- Hypergeometrische Verteilung
-
Die hypergeometrische Verteilung ist eine diskrete Wahrscheinlichkeitsverteilung in der Stochastik.
Es wird von einer dichotomen Grundgesamtheit ausgegangen. Dieser Gesamtheit werden in einer Stichprobe zufällig n Elemente nacheinander ohne Zurücklegen entnommen. Die hypergeometrische Verteilung gibt dann Auskunft darüber, mit welcher Wahrscheinlichkeit in der Stichprobe eine bestimmte Anzahl von Elementen vorkommt, die die gewünschte Eigenschaft haben. Bedeutung kommt dieser Verteilung daher etwa bei Qualitätskontrollen zu.
Die hypergeometrische Verteilung wird modellhaft dem Urnenmodell ohne Zurücklegen zugeordnet (siehe auch Kombinatorik). Man betrachtet speziell in diesem Zusammenhang eine Urne mit zwei Sorten Kugeln. Es werden n Kugeln ohne Zurücklegen entnommen. Die Zufallsvariable X ist die Zahl der Kugeln der ersten Sorte in dieser Stichprobe.
Die hypergeometrische Verteilung beschreibt also die Wahrscheinlichkeit dafür, dass bei N gegebenen Elementen („Grundgesamtheit des Umfangs N“), von denen M die gewünschte Eigenschaft besitzen, beim Herausgreifen von n Probestücken („Stichprobe des Umfangs n“) genau k Treffer erzielt werden, d.h. die Wahrscheinlichkeit für X = k Erfolge in n Versuchen.
Ein beispielhaftes Problem: In einer Urne befinden sich 45 Kugeln, 20 davon sind gelb. Wie hoch ist die Wahrscheinlichkeit in einer 10-elementigen Stichprobe genau 4 gelbe Kugeln zu ziehen? – Das Beispiel wird unten durchgerechnet.
Inhaltsverzeichnis
Definition
Die hypergeometrische Verteilung ist abhängig von drei Parametern:
- der Anzahl N der Elemente einer Grundgesamtheit.
- der Anzahl der Elemente mit einer bestimmten Eigenschaft in dieser Grundmenge (die Anzahl möglicher Erfolge).
- der Anzahl der Elemente in einer Stichprobe.
Die Verteilung gibt nun Auskunft darüber, wie wahrscheinlich es ist, dass sich k Elemente mit der zu prüfenden Eigenschaft (Erfolge bzw. Treffer) in der Stichprobe befinden. Der Ergebnisraum Ω ist daher {0,1,...,n}.
Eine diskrete Zufallsgröße X unterliegt der hypergeometrischen Verteilung mit den Parametern M, N und n, wenn sie die Wahrscheinlichkeiten
für besitzt. Dabei bezeichnet den Binomialkoeffizienten "N über n".
Die Verteilungsfunktion H(k | N;M;n) gibt dann die Wahrscheinlichkeit an, dass höchstens k Elemente mit der zu prüfenden Eigenschaft in der Stichprobe sind. Diese kumulierte Wahrscheinlichkeit ist die Summe
- .
Eigenschaften der hypergeometrischen Verteilung
Symmetrie
Erwartungswert
Der Erwartungswert der hypergeometrisch verteilten Zufallsvariable X ist
- .
Varianz
Die Varianz der hypergeometrisch verteilten Zufallsvariable X ist
- ,
wobei der letzte Bruch der so genannte Korrekturfaktor (Endlichkeitskorrektur) beim Modell ohne Zurücklegen ist.
Charakteristische Funktion
Die charakteristische Funktion hat die folgende Form:
Beziehung zu anderen Verteilungen
Beziehung zur Binomialverteilung
Im Gegensatz zur Binomialverteilung werden bei der hypergeometrischen Verteilung die Stichproben nicht wieder in das Reservoir zur erneuten Auswahl zurückgelegt. Ist der Umfang n der Stichprobe relativ klein (etwa n / N < 0,05) im Vergleich zum Umfang N der Grundgesamtheit, unterscheiden sich die durch die Binomialverteilung bzw. die hypergeometrische Verteilung berechneten Wahrscheinlichkeiten nicht wesentlich voneinander. In diesen Fällen wird dann oft die Binomialverteilung vorgezogen, weil sie mathematisch einfacher zu handhaben ist.
Beziehung zur Pólya-Verteilung
Die hypergeometrische Verteilung ist ein Spezialfall der Pólya-Verteilung (wähle c=-1).
Beispiele
In einem Behälter befinden sich 45 Kugeln, davon sind 20 gelb. Es werden 10 Kugeln ohne Zurücklegen entnommen.
Die hypergeometrische Verteilung gibt die Wahrscheinlichkeit dafür an, dass genau x = 0, 1, 2, 3, ..., 10 der entnommenen Kugeln gelb sind.Ein Beispiel für die Anwendung der hypergeometrischen Verteilung ist das Lotto: Beim Zahlenlotto gibt es 49 nummerierte Kugeln; davon werden bei der Auslosung 6 gezogen; auf dem Lottoschein werden 6 Zahlen angekreuzt.
h(x|49;6;6) gibt die Wahrscheinlichkeit dafür an, genau x = 0, 1, 2, 3, ..., 6 "Treffer" zu erzielen.Ausführliches Rechenbeispiel für die Kugeln
Zu dem oben aufgeführten Beispiel der farbigen Kugeln soll die Wahrscheinlichkeit ermittelt werden, dass genau 4 gelbe Kugeln resultieren
Gesamtanzahl der Kugeln N = 45 Anzahl mit der Eigenschaft "gelb" M = 20 Umfang der Stichprobe n = 10 Davon angestrebt gelb x = 4 Also h(4|45,20,10)
Die Wahrscheinlichkeit ergibt sich aus:
- Anzahl der Möglichkeiten, genau 4 gelbe (und damit genau 6 violette) Kugeln auszuwählen
- geteilt durch
- Anzahl der Möglichkeiten, genau 10 Kugeln beliebiger Farbe auszuwählen
Es gibt
Möglichkeiten, genau 4 gelbe Kugeln auszuwählen.
Es gibt
Möglichkeiten, genau 6 violette Kugeln auszuwählen.
Da jede "gelbe Möglichkeit" mit jeder "violetten Möglichkeit" kombiniert werden kann, ergeben sich
Möglichkeiten für genau 4 gelbe und 6 violette Kugeln.
Es gibt insgesamt
Möglichkeiten, 10 Kugeln zu ziehen.
Wir erhalten also die Wahrscheinlichkeit
- ,
das heißt, in rund 27 Prozent der Fälle werden genau 4 gelbe (und 6 violette) Kugeln entnommen.
Alternativ kann das Ergebnis auch mit folgender Gleichung gefunden werden
Es befinden sich nämlich in der Stichprobe vom Umfang 10 4 gelbe Kugeln. Die restlichen gelben Kugeln (16) befinden sich in den 35 übrig gebliebenen Kugeln, die nicht zur Stichprobe gehören.
Zahlenwerte zu den Beispielen
h(xl45;20;10) x Anzahl möglicher
ErgebnisseWahrscheinlichkeit
in %0 3.268.760 0,1024 1 40.859.500 1,2807 2 205.499.250 6,4416 3 547.998.000 17,1776 4 858.049.500 26,8965 5 823.727.520 25,8207 6 490.314.000 15,3694 7 178.296.000 5,5889 8 37.791.000 1,1846 9 4.199.000 0,1316 10 184.756 0,0058 ∑ 3.190.187.286 100,0000 Erwartungswert 4,4444 Varianz 1,9641 h(xl45;10;20) x Anzahl möglicher
ErgebnisseWahrscheinlichkeit
in %0 3.247.943.160 0,1024 1 40.599.289.500 1,2808 2 204.190.544.250 6,4416 3 544.508.118.000 17,1776 4 852.585.079.500 26,8965 5 818.481.676.320 25,8207 6 487.191.474.000 15,3694 7 177.160.536.000 5,5889 8 37.550.331.000 1,1846 9 4.172.259.000 0,1316 10 183.579.396 0,0058 11...20 0 0 ∑ 3.169.870.830.126 100,0000 Erwartungswert 4,4444 Varianz 1,9641 h(xl49;6;6) x Anzahl möglicher
ErgebnisseWahrscheinlichkeit
in %0 6.096.454 43,5965 1 5.775.588 41,3019 2 1.851.150 13,2378 3 246.820 1,765 4 13.545 0,0969 5 258 0,0018 6 1 0,0000072 ∑ 13.983.816 100,0000 Erwartungswert 0,7347 Varianz 0,5776 Weblinks
- Universität Konstanz – Interaktive Animation
-
Wikibooks: Hypergeometrische Verteilung – Lern- und Lehrmaterialien
Diskrete univariate VerteilungenDiskrete univariate Verteilungen für endliche Mengen:
Benford | Bernoulli | beta-binomial | binomial | kategorial | hypergeometrisch | Rademacher | Zipf | Zipf-MandelbrotDiskrete univariate Verteilungen für unendliche Mengen:
Boltzmann | Conway-Maxwell-Poisson | negativ binomial | erweitert negativ binomial | Compound-Poisson | diskret uniform | discrete-Phase-Type | Gauss-Kuzmin | geometrisch | logarithmisch | parabolisch-fraktal | Poisson | Poisson-Gamma | Skellam | Yule-Simon | Zeta
Wikimedia Foundation.
Schlagen Sie auch in anderen Wörterbüchern nach:
hypergeometrische Verteilung — hypergeometrische Verteilung, Statistik: die Wahrscheinlichkeitsverteilung einer Zufallsgröße, die verwendet wird, wenn aus einer Grundgesamtheit mit N Einheiten eine Stichprobe von … Universal-Lexikon
hypergeometrische Verteilung — hipergeometrinis skirstinys statusas T sritis fizika atitikmenys: angl. hypergeometric distribution vok. hypergeometrische Verteilung, f rus. гипергеометрическое распределение, n pranc. distribution hypergéométrique, f … Fizikos terminų žodynas
hypergeometrische Verteilung — spezielle diskrete theoretische ⇡ Verteilung in der Statistik mit der ⇡ Wahrscheinlichkeitsfunktion Die in die Wahrscheinlichkeitsfunktion eingehenden Ausdrücke sind Binomialkoeffizienten. Die h. V. erfasst folgenden Sachverhalt: In einer… … Lexikon der Economics
Verteilung — Ausbreitung; Streuung; Verbreitung; Zuweisung; Auskehrung; Zuordnung; Ausstreuung; Aushändigung; Ausgabe; Herausgabe; Erteilung; Austeilung … Universal-Lexikon
Binomial-Verteilung — Dieser Artikel wurde auf der Qualitätssicherungsseite des Portals Mathematik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Mathematik auf ein akzeptables Niveau zu bringen. Dabei werden Artikel gelöscht, die nicht… … Deutsch Wikipedia
Benfordsche Verteilung — Das benfordsche Gesetz, auch Newcomb Benford’s Law (NBL) beschreibt eine Gesetzmäßigkeit in der Verteilung der Ziffernstrukturen von Zahlen in empirischen Datensätzen, zum Beispiel ihrer ersten Ziffern. Es lässt sich etwa in Datensätzen über… … Deutsch Wikipedia
Diskrete Verteilung — In der Wahrscheinlichkeitstheorie gibt die Wahrscheinlichkeitsverteilung an, wie sich die Wahrscheinlichkeiten auf die möglichen Zufallsergebnisse, insbesondere die möglichen Werte einer Zufallsvariable, verteilen. Die… … Deutsch Wikipedia
Exponential-Verteilung — Dichte der Exponentialverteilung mit verschiedenen Werten für λ Die Exponentialverteilung ist eine stetige Wahrscheinlichkeitsverteilung über der Menge der positiven reellen Zahlen, die durch eine Exponentialfunktion gegeben ist. Sie wird als… … Deutsch Wikipedia
Exponentielle Verteilung — Dichte der Exponentialverteilung mit verschiedenen Werten für λ Die Exponentialverteilung ist eine stetige Wahrscheinlichkeitsverteilung über der Menge der positiven reellen Zahlen, die durch eine Exponentialfunktion gegeben ist. Sie wird als… … Deutsch Wikipedia
Gauss-Verteilung — Dichten normalverteilter Zufallsgrößen Die Normal oder Gauß Verteilung (nach Carl Friedrich Gauß) ist ein wichtiger Typ kontinuierlicher Wahrscheinlichkeitsverteilungen. Ihre Wahrscheinlichkeitsdichte wird auch Gauß Funktion, Gauß Kurve, Gauß… … Deutsch Wikipedia