Ziehen ohne Zurücklegen

Die hypergeometrische Verteilung ist eine diskrete Wahrscheinlichkeitsverteilung in der Stochastik.

Es wird von einer dichotomen Grundgesamtheit ausgegangen. Dieser Gesamtheit werden in einer Stichprobe zufällig n Elemente nacheinander ohne Zurücklegen entnommen. Die hypergeometrische Verteilung gibt dann Auskunft darüber, mit welcher Wahrscheinlichkeit in der Stichprobe eine bestimmte Anzahl von Elementen vorkommt, die die gewünschte Eigenschaft haben. Bedeutung kommt dieser Verteilung daher etwa bei Qualitätskontrollen zu.

Die hypergeometrische Verteilung wird modellhaft dem Urnenmodell ohne Zurücklegen zugeordnet (siehe auch Kombinatorik). Man betrachtet speziell in diesem Zusammenhang eine Urne mit zwei Sorten Kugeln. Es werden n Kugeln ohne Zurücklegen entnommen. Die Zufallsvariable X ist die Zahl der Kugeln der ersten Sorte in dieser Stichprobe.

Die hypergeometrische Verteilung beschreibt also die Wahrscheinlichkeit dafür, dass bei N gegebenen Elementen ("Grundgesamtheit des Umfangs N"), von denen M die gewünschte Eigenschaft besitzen, beim Herausgreifen von n Probestücken ("Stichprobe des Umfangs n") genau x Treffer erzielt werden, d.h. die Wahrscheinlichkeit für x Erfolge in n Versuchen.

Ein beispielhaftes Problem: In einer Urne befinden sich 45 Kugeln, 20 davon sind gelb. Wie hoch ist die Wahrscheinlichkeit in einer 10-elementigen Stichprobe genau 4 gelbe Kugeln zu ziehen? – Das Beispiel wird unten durchgerechnet.

Inhaltsverzeichnis

1 Definition
2 Eigenschaften der hypergeometrischen Verteilung
3 Beziehung zu anderen Verteilungen
- 3.1 Beziehung zur Binomialverteilung
4 Beispiele
- 4.1 Ausführliches Rechenbeispiel für die Kugeln
5 Zahlenwerte zu den Beispielen
6 Weblinks

Definition

Die hypergeometrische Verteilung ist abhängig von drei Parametern:

der Anzahl $N$ der Elemente einer Grundgesamtheit.
der Anzahl $M\leq N$ der Elemente mit einer bestimmten Eigenschaft in dieser Grundmenge (die Anzahl möglicher Erfolge).
der Anzahl $n\leq N$ der Elemente in einer Stichprobe.

Die Verteilung gibt nun Auskunft darüber, wie wahrscheinlich es ist, dass sich $k$ Elemente mit der zu prüfenden Eigenschaft (Erfolge bzw. Treffer) in der Stichprobe befinden. Der Ergebnisraum $Ω$ ist daher ${0, 1,..., n}$ .

Eine diskrete Zufallsgröße $X$ unterliegt der hypergeometrischen Verteilung mit den Parametern $M$ , $N$ , $n$ und $k$ , wenn sie die Wahrscheinlichkeiten

$h(k|N;M;n):= P(X = k) = \frac{\displaystyle{M \choose k}{N-M \choose n-k}}{\displaystyle{N \choose n}}$

für $k \in \Omega$ besitzt. Dabei bezeichnet $N \choose n$ den Binomialkoeffizienten "N über n".

Die Verteilungsfunktion $H (x | N; M; n)$ gibt dann die Wahrscheinlichkeit an, dass höchstens $k$ Elemente mit der zu prüfenden Eigenschaft in der Stichprobe sind. Diese kumulierte Wahrscheinlichkeit ist die Summe

$H(k|N;M;n) := P(X \le k)= \sum_{y=0}^{k}h(y|N;M;n) = \sum_{y=0}^{k} \frac{\displaystyle{M\choose y}{\displaystyle{N-M}\choose{n-y}}}{\displaystyle{N\choose n}}$ .

Eigenschaften der hypergeometrischen Verteilung

Symmetrie

$h(k|N;M;n)=h(k|N;n;M)= \frac{{M \choose k}{N-M \choose n-k}}{{N \choose n}}= \frac{{n \choose k}{N-n \choose M-k}}{{N \choose M}}$

Erwartungswert

Der Erwartungswert der hypergeometrischen Verteilung ist

$\operatorname{E}(X)= \sum_{k=0}^n k \frac{\displaystyle{M\choose k}{\displaystyle{N-M}\choose{n-k}}}{\displaystyle{N\choose n}} = n\frac{M}{N}$ .

Varianz

Für die Varianz erhält man in analoger Weise

$\operatorname{Var}(X)=\sum_{k=0}^n k^2 \frac{\displaystyle{M\choose k}{\displaystyle{N-M}\choose{n-k}}}{\displaystyle{N\choose n}} -\left(n\frac{M}{N}\right)^2 =n \, \frac{M}{N} \left( 1-\frac{M}{N} \right) \frac{N-n}{N-1}$ ,

wobei der letzte Bruch der so genannte Korrekturfaktor (Endlichkeitskorrektur) beim Modell ohne Zurücklegen ist.

Charakteristische Funktion

Die charakteristische Funktion hat die Form

$\phi_{X}(s) = (1-p(1-e^{is}))^{n} \,$ .

Beziehung zu anderen Verteilungen

Beziehung zur Binomialverteilung

Im Gegensatz zur Binomialverteilung werden bei der hypergeometrischen Verteilung die Stichproben nicht wieder in das Reservoir zur erneuten Auswahl zurückgelegt. Ist der Umfang $n$ der Stichprobe relativ klein (etwa $n / N < 0, 05$ ) im Vergleich zum Umfang $N$ der Grundgesamtheit, unterscheiden sich die durch die Binomialverteilung bzw. die hypergeometrische Verteilung berechneten Wahrscheinlichkeiten nicht wesentlich voneinander. In diesen Fällen wird dann oft die Binomialverteilung vorgezogen, weil sie mathematisch einfacher zu handhaben ist.

Beispiele

In einem Behälter befinden sich 45 Kugeln, davon sind 20 gelb. Es werden 10 Kugeln ohne Zurücklegen entnommen.
Die hypergeometrische Verteilung gibt die Wahrscheinlichkeit dafür an, dass genau x = 0, 1, 2, 3, ..., 10 der entnommenen Kugeln gelb sind.

Ein Beispiel für die Anwendung der hypergeometrischen Verteilung ist das Lotto: Beim Zahlenlotto gibt es 49 nummerierte Kugeln; davon werden bei der Auslosung 6 gezogen; auf dem Lottoschein werden 6 Zahlen angekreuzt.
h(x|49;6;6) gibt die Wahrscheinlichkeit dafür an, genau x = 0, 1, 2, 3, ..., 6 "Treffer" zu erzielen.

Wahrscheinlichkeit beim deutschen Lotto
in linearer Auftragung	in logarithmischer Auftragung

Ausführliches Rechenbeispiel für die Kugeln

Zu dem oben aufgeführten Beispiel der farbigen Kugeln soll die Wahrscheinlichkeit ermittelt werden, dass genau 4 gelbe Kugeln resultieren

Gesamtanzahl der Kugeln	$N = 45$
Anzahl mit der Eigenschaft "gelb"	$M = 20$
Umfang der Stichprobe	$n = 10$
davon Anteil gelb	$x = 4$

Also h(4|45,20,10)

Die Wahrscheinlichkeit ergibt sich aus:

Anzahl der Möglichkeiten, genau 4 gelbe (und damit genau 6 violette) Kugeln auszuwählen

geteilt durch

Anzahl der Möglichkeiten, genau 10 Kugeln beliebiger Farbe auszuwählen

Es gibt

${ M \choose x } = { 20 \choose 4 } = 4\,845$

Möglichkeiten, genau 4 gelbe Kugeln auszuwählen.

Es gibt

${ {N - M }\choose {n - x }} = { 25 \choose 6 } = 177\,100$

Möglichkeiten, genau 6 violette Kugeln auszuwählen.

Da jede "gelbe Möglichkeit" mit jeder "violetten Möglichkeit" kombiniert werden kann, ergeben sich

${ M \choose x } \cdot { {N - M }\choose {n - x }} = 4\,845 \cdot 177\,100 = 858\,049\,500$

Möglichkeiten für genau 4 gelbe und 6 violette Kugeln.

Es gibt insgesamt

${ N \choose n }$

Möglichkeiten, 10 Kugeln zu ziehen.

Wir erhalten also die Wahrscheinlichkeit

$P(X=4)=h(4|45,20,10)=\frac{{ 20 \choose 4 }{ 25 \choose 6 }}{{ 45 \choose 10 }} = \frac{4\,845 \cdot 177\,100 }{3\,190\,187\,286} \approx 0{,}2690$ ,

das heißt, in rund 27 Prozent der Fälle werden genau 4 gelbe (und 6 violette) Kugeln entnommen.

Alternativ kann das Ergebnis auch mit folgender Gleichung gefunden werden

$P(X=4)=h(4|45,20,10)=\frac{{10 \choose 4 }{ 35 \choose 16 }}{{ 45 \choose 20 }} \approx 0{,}2690$

Es befinden sich nämlich in der Stichprobe vom Umfang 10 4 gelbe Kugeln. Die restlichen gelben Kugeln (16) befinden sich in den 35 übrig gebliebenen Kugeln, die nicht zur Stichprobe gehören.

Zahlenwerte zu den Beispielen

h(xl45;20;10)
x	Anzahl möglicher Ergebnisse	Wahrscheinlichkeit in %
0	3.268.760	0,1024
1	40.859.500	1,2807
2	205.499.250	6,4416
3	547.998.000	17,1776
4	858.049.500	26,8965
5	823.727.520	25,8207
6	490.314.000	15,3694
7	178.296.000	5,5889
8	37.791.000	1,1846
9	4.199.000	0,1316
10	184.756	0,0058
∑	3.190.187.286	100,0000
Erwartungswert		4,4444
Varianz		1,9641

h(xl45;10;20)
x	Anzahl möglicher Ergebnisse	Wahrscheinlichkeit in %
0	3.247.943.160	0,1024
1	40.599.289.500	1,2808
2	204.190.544.250	6,4416
3	544.508.118.000	17,1776
4	852.585.079.500	26,8965
5	818.481.676.320	25,8207
6	487.191.474.000	15,3694
7	177.160.536.000	5,5889
8	37.550.331.000	1,1846
9	4.172.259.000	0,1316
10	183.579.396	0,0058
11...20	0	0
∑	3.169.870.830.126	100,0000
Erwartungswert		4,4444
Varianz		1,9641

h(xl49;6;6)
x	Anzahl möglicher Ergebnisse	Wahrscheinlichkeit in %
0	6.096.454	43,5965
1	5.775.588	41,3019
2	1.851.150	13,2378
3	246.820	1,765
4	13.545	0,0969
5	258	0,000018
6	1	0,0000071
∑	13.983.816	100,0000
Erwartungswert		0,7347
Varianz		0,5776

Weblinks

Universität Konstanz – Interaktive Animation

Diskrete univariate Verteilungen

Kontinuierliche univariate Verteilungen

Multivariate Verteilungen

Diskrete multivariate Verteilungen:
Ewen's | Multinomial | Dirichlet Multinomial

Multivariate Matrixverteilungen:
Inverse-Wishart | Matrix Normal | Wishart

Wikimedia Foundation.

Игры ⚽ Нужна курсовая?

Schlagen Sie auch in anderen Wörterbüchern nach:

Ziehen mit Zurücklegen — Dieser Artikel wurde auf der Qualitätssicherungsseite des Portals Mathematik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Mathematik auf ein akzeptables Niveau zu bringen. Dabei werden Artikel gelöscht, die nicht… … Deutsch Wikipedia
Zufallsstichprobe — Dieser Artikel wurde auf der Qualitätssicherungsseite des Portals Mathematik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Mathematik auf ein akzeptables Niveau zu bringen. Bitte hilf mit, die Mängel dieses… … Deutsch Wikipedia
Binomialtest — Ein Binomialtest ist ein statistischer Test, bei dem die Testgröße binomialverteilt ist. Er wird verwendet, um Hypothesen über Merkmale zu prüfen, die genau zwei Ausprägungen annehmen können (dichotome Merkmale). Inhaltsverzeichnis 1 Hypothesen… … Deutsch Wikipedia
Stochastische Unabhängigkeit — ist ein fundamentales wahrscheinlichkeitstheoretisches Konzept, welches die Vorstellung von sich nicht gegenseitig beeinflussenden Zufallsereignissen formalisiert. Sind zwei Ereignisse stochastisch unabhängig, dann ändert sich die… … Deutsch Wikipedia
Schätzfunktion — Dieser Artikel wurde auf der Qualitätssicherungsseite des Portals Mathematik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Mathematik auf ein akzeptables Niveau zu bringen. Bitte hilf mit, die Mängel dieses… … Deutsch Wikipedia
Abzählende Kombinatorik — Zahl der Permutationen und Derangements (totalen Versetzungen) von n Elementen. P(n) n Permutationen; D(n) totale Derangements (bei der alle n Elemente ihre Plätze wechseln) … Deutsch Wikipedia
Kombinatorische Explosion — Dieser Artikel wurde auf der Qualitätssicherungsseite des Portals Mathematik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Mathematik auf ein akzeptables Niveau zu bringen. Dabei werden Artikel gelöscht, die nicht… … Deutsch Wikipedia
Variationen mit Wiederholung — Dieser Artikel wurde auf der Qualitätssicherungsseite des Portals Mathematik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Mathematik auf ein akzeptables Niveau zu bringen. Dabei werden Artikel gelöscht, die nicht… … Deutsch Wikipedia
Uneingeschränkte Zufallsstichprobe — Ein Urnenmodell beschreibt ein hypothetisches Experiment und stellt eine Form der Zufallsstichprobe dar. Dazu wird ein fiktives Gefäß mit Kugeln gefüllt, welche anschließend zufällig gezogen werden. Durch ein Urnenmodell lassen sich so… … Deutsch Wikipedia
Urnenmodell — Ein Urnenmodell beschreibt ein hypothetisches Experiment und stellt eine Form der Zufallsstichprobe dar. Dazu wird ein fiktives Gefäß mit Kugeln gefüllt, welche anschließend zufällig gezogen werden. Durch ein Urnenmodell lassen sich so… … Deutsch Wikipedia

Academic dictionaries and encyclopedias

Ziehen ohne Zurücklegen

Inhaltsverzeichnis

Definition