Negative Binomialverteilung

Negative Binomialverteilung
Wahrscheinlichkeitsfunktion der negativen Binomialverteilung für r = 10; p = 0.2 (blau), p = 0.5 (grün) und p = 0.8 (rot)

Die negative Binomialverteilung (auch Pascal-Verteilung) ist eine diskrete Wahrscheinlichkeitsverteilung.

Die negative Binomialverteilung beschreibt die Wahrscheinlichkeitsverteilung der Anzahl der Versuche, die erforderlich sind, um in einem Bernoulli-Prozess eine vorgegebene Anzahl von Erfolgen zu erzielen. Sie ist ein Spezialfall der Panjer-Verteilung.

Neben der Poisson-Verteilung ist die negative Binomialverteilung die wichtigste Schadenzahlverteilung in der Versicherungsmathematik. Dort wird sie insbesondere als Schadenzahlverteilung in der Krankenversicherung benutzt, seltener im Bereich Kraftfahrzeug-Haftpflicht oder Kasko.

Inhaltsverzeichnis

Herleitung der negativen Binomialverteilung

Man kann diese Verteilung mit Hilfe des Urnenmodells mit Zurücklegen beschreiben: In einer Urne befinden sich zwei Sorten Kugeln (dichotome Grundgesamtheit). Der Anteil der Kugeln erster Sorte beträgt p. Die Wahrscheinlichkeit, dass eine Kugel erster Sorte gezogen wird, beträgt also p.

Es wird nun so lange eine Kugel gezogen und wieder zurückgelegt, bis erstmals genau r Kugeln erster Sorte resultieren. Man kann eine Zufallsvariable X: "Zahl der Versuche, bis erstmals r Erfolge resultieren" definieren. Die Zahl der Versuche liegt in der Menge \{n|n\geq r\}. X hat abzählbar unendlich viele mögliche Ausprägungen.

Die Wahrscheinlichkeit, dass n Versuche nötig waren, um r Erfolge zu erzielen, also P(X = n), berechnet man nach folgender Überlegung:

Es sollen zum jetzigen Zeitpunkt bereits n − 1 Versuche stattgefunden haben. Es wurden insgesamt r − 1 Kugeln erster Sorte gezogen. Die Wahrscheinlichkeit dafür wird durch die Binomialverteilung der Zufallsvariablen Y: "Zahl der Kugeln erster Sorte bei n − 1 Versuchen" angegeben:

\operatorname{P}(Y = r-1) = {{n-1} \choose {r-1}} p^{r-1}(1-p)^{n-1-(r-1)} .

Die Wahrscheinlichkeit, dass nun eine weitere Kugel erster Sorte gezogen wird, ist dann

\operatorname{P}(X = n)=\operatorname{P}(Y = r-1) \cdot p .

Eine Zufallsvariable X heißt damit negativ binomialverteilt NB(r,p) mit den Parametern r (Anzahl der erfolgreichen Versuche) und p (Wahrscheinlichkeit des Eintretens eines Erfolges im Einzelversuch), wenn sich für sie die Wahrscheinlichkeitsfunktion

\operatorname{P}(X = n)={{n-1} \choose {r-1}} p^r(1-p)^{n-r}

angeben lässt.

Alternative Definition

Eine diskrete Zufallsgröße X unterliegt der negativen Binomialverteilung NB(r,p) mit den Parametern r und p, wenn sie die Wahrscheinlichkeiten

\operatorname{P}(X=k)={k+r-1\choose k}p^{r}(1-p)^{k}={{k+r-1}\choose k}p^{r}q^{k} = {{-r}\choose k}p^{r}(-q)^{k}

besitzt.

Beide Definitionen stehen über n = k + r in Beziehung; während die erste Definition also nach der Anzahl der Versuche n (erfolgreiche + erfolglose) bis zum Eintreten des r-ten Erfolgs fragt, interessiert sich die alternative Darstellung für die Anzahl k der Misserfolge bis zum Eintreten des r-ten Erfolgs. Dabei werden die r Erfolge nicht mitgezählt. Die Zufallsvariable X bezeichnet dann nur die Anzahl der misslungenen Versuche.

Eigenschaften der negativen Binomialverteilung

  • Ein Spezialfall der negativen Binomialverteilung für r = 1 ist die geometrische Verteilung. Hier interessiert man sich für die Zahl der Misserfolge, bis erstmals Erfolg auftritt.
  • Die Negativ-Binomial-Verteilungen gehören zur Panjer-Klasse.
  • Die Summe X=\sum_{i=1}^{r} X_{i} von einander unabhängigen geometrisch verteilten Zufallsgrößen X_{1}, \dots, X_{r} mit demselben Parameter p ist negativ-binomialverteilt NB(r,p) mit den Parametern p und r.

Erwartungswert

Der Erwartungswert bestimmt sich zu

 \operatorname{E}(X) = \frac{r}{p}\,.

Bei der alternativen Definition ist der Erwartungswert um r kleiner, also \operatorname{E}(X) =\frac{r(1-p)}{p}.

Varianz

Die Varianz der negativen Binomialverteilung ist für beide Definitionen gegeben durch

\operatorname{Var}(X) = \frac{r(1-p)}{p^2}.

Die Varianz ist bei der alternativen Definition immer größer als der Erwartungswert (Überdispersion).

Variationskoeffizient

Aus Erwartungswert und Varianz ergibt sich sofort der Variationskoeffizient zu

\operatorname{VarK}(X) = \sqrt{\frac{1-p}{r}} bzw.
\operatorname{VarK}(X) = \frac{1}{\sqrt{r(1-p)}} in der alternativen Darstellung.

Schiefe

Die Schiefe ergibt sich zu:

\operatorname{v}(X) = \frac{2-p}{\sqrt{r(1-p)}}.

Charakteristische Funktion

Die charakteristische Funktion hat die Form

\varphi_{X}(s) = \left(\frac{p}{1-(1-p)e^{\mathrm{i}s}}\right)^{r} mit s < | ln(1 − p) | .

Erzeugende Funktion

Für die erzeugende Funktion erhält man.

g_{X}(s) = \left(\frac{p}{1-(1-p)s}\right)^{r} mit 0<s<\frac{1}{1-p}.

Momenterzeugende Funktion

Die momenterzeugende Funktion der negativen Binomialverteilung ist

M_{X}(s) = \left(\frac{p}{1-(1-p) e^{s}}\right)^{r} mit s < | ln(1 − p) | .

Beziehungen zu anderen Verteilungen

Beziehung zur geometrischen Verteilung

Die negative Binomialverteilung geht für r = 1 in die Geometrische Verteilung über. Mit anderen Worten, die Summe k identischer, unabhängiger, geometrisch verteilter Zufallsgrößen mit demselben Parameter p, ist negativ-binomialverteilt mit den Parametern p und k.

Beispiele

Beim wievielten Skatspiel gewinnt Paula zum 10. Mal?

Wahrscheinlichkeitsfunktion der Negativen Binomialverteilung

Die Studentin Paula spielt heute Abend Skat. Aus langer Erfahrung weiß sie, dass sie bei jedem 5. Spiel gewinnt. Gewinnen ist folgendermaßen definiert: Sie muss zunächst ein Spiel durch Reizen bekommen, dann muss sie dieses Spiel gewinnen.

Da sie morgen um acht Uhr Statistik-Vorlesung hat, soll der Abend nicht zu lang werden. Deshalb hat sie beschlossen, nach dem 10. gewonnenen Spiel nach Hause zu gehen. Nehmen wir an, dass ein Spiel etwa 4 Minuten dauert (großzügig gerechnet). Mit welcher Wahrscheinlichkeit kann sie nach zwei Stunden nach Hause gehen, also nach 30 Spielen?

Wir gehen mit unseren Überlegungen analog zu oben vor:

Mit welcher Wahrscheinlichkeit hat sie in 29 Spielen 9 mal gewonnen? Wir berechnen diese Wahrscheinlichkeit mit der Binomialverteilung, in Begriffen des Urnenmodells bei 29 Versuchen und 9 Kugeln erster Sorte:

P(Y=9)={29 \choose 9}0{,}2^9 \cdot 0{,}8^{20}=0{,}0591.

Die Wahrscheinlichkeit, den 10. Gewinn beim 30. Spiel zu machen, ist nun

P(X=30)=0{,}0591 \cdot 0{,}2=0{,}0118.
Verteilungsfunktion der Negativen Binomialverteilung

Diese Wahrscheinlichkeit scheint nun sehr klein zu sein. Die Grafik der negativ binomialverteilten Zufallsvariablen X zeigt, dass insgesamt die Wahrscheinlichkeiten sehr klein bleiben. Wie soll da die arme Paula jemals ins Bett kommen? Wir können sie beruhigen: Es genügt ja, danach zu fragen, wie viele Versuche Paula höchstens braucht, es müssen ja nicht genau 30 sein.

Die Wahrscheinlichkeit, dass höchstens 30 Versuche nötig sind, ist die Verteilungsfunktion F(x) der negativen Binomialverteilung an der Stelle x=30, was hier die Summe der Wahrscheinlichkeiten P(X=0) + P(X=1) + P(X=2) + ... + P(X=30) ergibt. Ein Blick auf die Grafik der Verteilungsfunktion zeigt: Wenn Paula mit einer 50%igen Wahrscheinlichkeit zufrieden ist, müsste sie höchstens ca. 50 Spiele absolvieren, das wären 50·4 min = 200 min = 3h 20 min. Um mit einer 80%igen Wahrscheinlichkeit ihre 10 Gewinne zu bekommen, müsste sie höchstens ca. 70 Spiele spielen, also knapp 5 Stunden. Vielleicht sollte Paula doch ihre Strategie der Spielezahl ändern.

Weblinks


Wikimedia Foundation.

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Binomialverteilung — Dichtefunktion Verteilungsfunktion …   Deutsch Wikipedia

  • Bernoullikette — Dieser Artikel wurde auf der Qualitätssicherungsseite des Portals Mathematik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Mathematik auf ein akzeptables Niveau zu bringen. Dabei werden Artikel gelöscht, die nicht… …   Deutsch Wikipedia

  • Binomial-Verteilung — Dieser Artikel wurde auf der Qualitätssicherungsseite des Portals Mathematik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Mathematik auf ein akzeptables Niveau zu bringen. Dabei werden Artikel gelöscht, die nicht… …   Deutsch Wikipedia

  • Poissonscher Grenzwertsatz — Dieser Artikel wurde auf der Qualitätssicherungsseite des Portals Mathematik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Mathematik auf ein akzeptables Niveau zu bringen. Dabei werden Artikel gelöscht, die nicht… …   Deutsch Wikipedia

  • Ziehen mit Zurücklegen — Dieser Artikel wurde auf der Qualitätssicherungsseite des Portals Mathematik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Mathematik auf ein akzeptables Niveau zu bringen. Dabei werden Artikel gelöscht, die nicht… …   Deutsch Wikipedia

  • Negativbinomialverteilung — Die negative Binomialverteilung (auch Pascal Verteilung) ist eine diskrete Wahrscheinlichkeitsverteilung. Die negative Binomialverteilung beschreibt die Wahrscheinlichkeitsverteilung der Anzahl der Versuche, die erforderlich sind, um in einem… …   Deutsch Wikipedia

  • Pascal-Verteilung — Die negative Binomialverteilung (auch Pascal Verteilung) ist eine diskrete Wahrscheinlichkeitsverteilung. Die negative Binomialverteilung beschreibt die Wahrscheinlichkeitsverteilung der Anzahl der Versuche, die erforderlich sind, um in einem… …   Deutsch Wikipedia

  • Geometrische-Verteilung — Die geometrische Verteilung ist eine diskrete Wahrscheinlichkeitsverteilung für unabhängige Bernoulli Experimente. Es werden zwei Varianten definiert: Variante A die Wahrscheinlichkeitsverteilung der Anzahl X der Bernoulli Versuche, die notwendig …   Deutsch Wikipedia

  • Gauss-Verteilung — Dichten normalverteilter Zufallsgrößen Die Normal oder Gauß Verteilung (nach Carl Friedrich Gauß) ist ein wichtiger Typ kontinuierlicher Wahrscheinlichkeitsverteilungen. Ihre Wahrscheinlichkeitsdichte wird auch Gauß Funktion, Gauß Kurve, Gauß… …   Deutsch Wikipedia

  • Gaussfunktion — Dichten normalverteilter Zufallsgrößen Die Normal oder Gauß Verteilung (nach Carl Friedrich Gauß) ist ein wichtiger Typ kontinuierlicher Wahrscheinlichkeitsverteilungen. Ihre Wahrscheinlichkeitsdichte wird auch Gauß Funktion, Gauß Kurve, Gauß… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”