- A-posteriori-Wahrscheinlichkeit
-
Die A-posteriori-Wahrscheinlichkeit ist ein Begriff aus der bayesschen Statistik. Sie beschreibt den Wissensstand über einen unbekannten Umweltzustand θ nach der Beobachtung einer von θ abhängigen Zufallsgröße X.
Inhaltsverzeichnis
Definition
Folgende Situation ist gegeben: θ ist ein unbekannter Umweltzustand (z.B. ein Parameter einer Wahrscheinlichkeitsverteilung), der auf der Basis von Beobachtungen x einer Zufallsgröße X geschätzt werden soll.
Gegeben sei eine Verteilung für den Parameter θ vor der Beobachtung der Stichprobe. Diese Verteilung wird auch A-priori-Verteilung genannt.
Weiterhin sei die Dichte (bzw. im diskreten Fall: die Wahrscheinlichkeitsfunktion) der bedingten Verteilung der Stichprobe unter der Bedingung θ = θ0 gegeben. Diese Dichte (bzw: Wahrscheinlichkeitsfunktion) wird im folgenden mit f(x | θ0) bezeichnet.
Die A-posteriori-Verteilung ist die Verteilung des Populationsparameters θ unter der Bedingung, dass für die Zufallsgröße X der Wert x beobachtet wurde. Die A-posteriori-Verteilung wird mit Hilfe des Bayestheorems aus der A-priori-Verteilung und der bedingten Verteilung der Stichprobe unter der Bedingung θ = θ0 berechnet.
A-posteriori-Verteilung
Für stetige A-priori-Verteilungen
Eine stetige A-priori-Verteilung liegt dann vor, wenn die A-priori-Verteilung auf der Menge der reellen Zahlen oder auf einem Intervall in definiert ist. Beispiele für stetige A-priori-Verteilungen sind:
- die Normalverteilung (hier ist der Parameterraum Θ die Menge der reellen Zahlen) oder
- die Gleichverteilung auf dem Intervall [0;1] (hier ist der Parameterraum Θ das Intervall [0;1]).
Im Folgenden steht g(θ) für die auf dem Parameterraum Θ definierte A-priori-Dichte von θ.
In diesem Fall kann die A-posteriori-Dichte h(θ | x) folgendermaßen berechnet werden[1]:
Für diskrete A-priori-Verteilungen
Im folgenden Abschnitt steht P(θ = θ0) für die diskrete A-priori-Wahrscheinlichkeit, dass der Parameter θ den Wert θ0 annimmt. Eine diskrete A-priori-Verteilung ist auf einer endlichen Menge oder auf einer Menge mit abzählbar unendlichem Träger definiert.
Die A-posteriori-Wahrscheinlichkeit wird im folgenden mit P(θ = θ0 | x) bezeichnet und kann auf folgende Weise berechnet werden:[1]
Bedeutung in der bayesianischen Statistik
In der bayesianischen Statistik stellt die A-posteriori-Verteilung den neuen, durch Vorwissen und Beobachtung bestimmten Kenntnisstand über die Verteilung des Parameters θ nach der Beobachtung der Stichprobe dar.
Damit ist die A-posteriori-Verteilung die Grundlage zur Berechnung aller Punktschätzer und Konfidenzintervalle in der bayesianischen Statistik.[1]
Beispiel
In einer Urne befinden sich rote und schwarze Kugeln. Es ist bekannt, dass der Anteil roter Kugeln entweder bei 40 % oder aber bei 60 % liegt. Um genaueres herauszufinden, werden (mit Zurücklegen) 11 Kugeln aus der Urne gezogen. Es werden 4 rote und 7 schwarze Kugeln gezogen.
Die Zufallsgröße Anzahl gezogener roter Kugeln wird im Folgenden mit dem Buchstaben X bezeichnet, der tatsächlich beobachtete Wert der Zufallsgröße als x.
Die Zufallsgröße X ist binomialverteilt mit unbekanntem Parameter θ, wobei θ nur einen der Werte 0{,}4 oder 0{,}6 annehmen kann. Da kein weiteres Vorwissen bekannt ist, wird als A-priori-Verteilung für θ eine diskrete Gleichverteilung angenommen, d.h.
Die Wahrscheinlichkeitsfunktion für X=x ergibt sich aus der Binomialverteilung:
Man erhält daher für θ = 0,4:
- .
Für θ = 0,6 erhält man:
- .
Die A-posteriori-Verteilung kann nun mit Hilfe des Satzes von Bayes berechnet werden. Für θ = 0,4 erhält man als A-posteriori-Wahrscheinlichkeit:
- .
Für θ = 0,6 ergibt sich die A-posteriori-Wahrscheinlichkeit:
- .
Somit ist man sich nach Ziehung der Stichprobe mit Wahrscheinlichkeit 0{,}77 sicher, dass der Anteil roter Kugel in der Urne 40 % beträgt.
Einzelnachweise
Literatur
- Bernhard Rüger: Induktive Statistik. Einführung für Wirtschafts- und Sozialwissenschaftler. R. Oldenbourg Verlag, München Wien 1988. ISBN 3-486-20535-8
- Hans-Otto Georgii: Stochastik - Einführung in die Wahrscheinlichkeitstheorie und Statistik. de Gruyter Verlag, Berlin New York 2007. ISBN 978-3-11-019349-7
Siehe auch
Wikimedia Foundation.