- Überschreitungswahrscheinlichkeit
-
Der p-Wert (auch Überschreitungswahrscheinlichkeit genannt) ist eine Kennzahl zur Auswertung von statistischen Tests. Er steht in enger Beziehung mit dem Signifikanzniveau, lässt sich aber nicht so einfach in Tabellen fassen, sodass die praktische Anwendung erst mit Einführung von Computern und Statistik-Software möglich geworden ist.Inhaltsverzeichnis
Mathematische Formulierung
Bei einem statistischen Test wird eine Vermutung (Nullhypothese) H0 überprüft, indem ein passendes Zufallsexperiment durchgeführt wird, das die Zufallsgrößen liefert. Diese Zufallsgrößen werden zu einer einzelnen Zahl („Statistik“)
zusammengefasst. Für einen konkreten Versuchsausgang des Experiments erhält man einen Wert
- .
Der p-Wert des Versuchsausgangs ist dann die Wahrscheinlichkeit, dass ein zufälliger Versuch bei gültiger Nullhypothese mindestens so „extrem“ ausgeht wie der beobachtete, also abhängig von der genauen Wahl der Statistik. Bei rechtsseitigem Test:
Bei linksseitigem Test:
Und bei zweiseitigem Test:
Der p-Wert gibt an, wie extremal der gefundene Wert der Teststatistik ist. Bei gültiger Nullhypothese ist der p-Wert die Wahrscheinlichkeit auf Werte, die wenigstens so extremal sind wie der gefundene Wert. Je kleiner der p-Wert, umso eher sollte die Nullhypothese verworfen werden. Üblicherweise wird vor dem Test ein Signifikanzniveau α festgelegt und die Nullhypothese dann verworfen, wenn der p-Wert kleiner oder gleich α ist.
Beispiel
Gegeben sei eine Münze. Die zu prüfende Nullhypothese sei, dass die Münze fair ist, dass also Kopf und Zahl gleich wahrscheinlich sind; die Alternativhypothese sei, dass ein Ergebnis wahrscheinlicher ist, wobei nicht festgelegt wird, welches der beiden wahrscheinlicher sein soll. Das Zufallsexperiment zum Testen der Nullhypothese bestehe nun darin, dass die Münze zwanzig Mal geworfen wird. K bezeichne die Anzahl der Würfe, die „Kopf“ als Ergebnis liefern. Bei einer fairen Münze wäre zehnmal „Kopf“ zu erwarten. Als Statistik wählt man daher sinnvollerweise
- Y = | K − 10 | .
Angenommen, der Versuch liefert k = 14 Mal das Ergebnis „Kopf“, also y = 4. Unter der Nullhypothese ist die Anzahl der Köpfe binomialverteilt mit n = 20 und . Der p-Wert für diesen Versuchsausgang ist daher
Bei einem Signifikanzniveau von 5% würde man die Nullhypothese nicht verwerfen, d.h., man kann aus den Daten nicht folgern, dass die Münze nicht fair sei.
Wäre das Versuchsergebnis k = 15 Mal Kopf, also y = 5, dann wäre der p-Wert für diesen Versuchsausgang
Bei einem Signifikanzniveau von 5% würde man also in diesem Fall die Nullhypothese verwerfen, also schließen, dass die Münze nicht fair ist, bei einem Signifikanzniveau von 1% hingegen weiterhin akzeptieren. (Genauer gesagt: Man würde die Datenlage für unzureichend ansehen, um den Schluss zu rechtfertigen, die Münze sei nicht fair. Dies als einen Beweis zu nehmen, dass die Münze fair ist, wäre jedoch falsch.)
Weblinks
Einzelnachweise
Wikimedia Foundation.