- Hypothese (Statistik)
-
In der Statistik bezeichnet man mit Hypothese eine Annahme, die mit Methoden der mathematischen Statistik auf Basis empirischer Daten geprüft wird. Man unterscheidet als Gegensatzpaar Nullhypothese, H0, und Alternativhypothese (auch Gegenhypothese), HA oder H1. Häufig sagt die Nullhypothese aus, dass ein bestimmter Zusammenhang nicht besteht. Diese These soll verworfen werden, so dass die Alternativhypothese als möglich (wahrscheinlich) übrig bleibt. Diese Logik verwirrt den Anwender oft, sodass auch der umgekehrte Weg möglich ist, die Nullhypothese wird als richtig angenommen.
Inhaltsverzeichnis
Nullhypothese
In der Statistik ist die Nullhypothese eine Annahme über die Wahrscheinlichkeitsverteilung einer Zufallsvariablen. Die Alternativhypothese steht für eine Menge von alternativen Annahmen bezüglich der Nullhypothese. Die Aufgabe, zwischen Null- und Alternativhypothese zu entscheiden, wird als Testproblem bezeichnet. Spricht das Stichprobenergebnis gegen die Annahme, so wird die Hypothese abgelehnt; andernfalls wird sie beibehalten.
Weil eine Untersuchung häufig das Ziel hat, zu zeigen, dass es einen bestimmten Unterschied gibt, der in der alternativen Hypothese formuliert wird, beinhaltet die Nullhypothese H0 den Gegensatz, d.h. die Gleichheit von Sachverhalten, etwa:
- dass zwischen Gruppen kein Unterschied besteht,
- dass ein bestimmtes Medikament keine Wirkung zeigt,
- dass zwischen Merkmalen kein Zusammenhang besteht.
Beispiele
Statistik: Ein Beispiel für die Anwendung der Nullhypothese wäre, die Ergebnisse eines Tests zwischen Männern und Frauen zu vergleichen. Dabei soll die Frage beantwortet werden, ob sich das Testergebnis zwischen den Gruppen statistisch signifikant unterscheidet. Die Nullhypothese wäre in diesem Fall, dass die Durchschnittsergebnisse von Männern und Frauen gleich sind:
- H0: μ1 = μ2
wobei:
- H0 die Nullhypothese ist,
- μ1 der Erwartungswert der männlichen Probe, und
- μ2 der Erwartungswert der weiblichen Probe.
Psychologie: Im Bereich der forensischen Psychologie ist die Nullhypothese durch das Urteil des Bundesgerichtshofes (zum Verfahren bei einer Glaubhaftigkeitsbegutachtung) vom 30. Juli 1999 definiert worden: „Das methodische Grundprinzip besteht darin, einen zu überprüfenden Sachverhalt (hier: Glaubhaftigkeit der spezifischen Aussage) so lange zu negieren, bis diese Negation mit den gesammelten Fakten nicht mehr vereinbar ist. Der Sachverständige nimmt daher bei der Begutachtung zunächst an, die Aussage sei unwahr (sog. Nullhypothese). Zur Prüfung dieser Annahme hat er weitere Hypothesen zu bilden. Ergibt seine Prüfstrategie, dass die Unwahrhypothese mit den erhobenen Fakten nicht mehr in Übereinstimmung stehen kann, so wird sie verworfen, und es gilt dann die Alternativhypothese, dass es sich um eine wahre Aussage handelt.“[1]
Alternativhypothese
Als Alternativhypothese bezeichnet man in der empirischen Wissenschaft eine durch Beobachtungen oder Überlegungen begründete Annahme oder Vermutung, die zur Erklärung bestimmter Phänomene dient, und die einer möglicherweise verbreiteten Annahme oder Vermutung (nämlich der Nullhypothese) entgegen steht. Insofern kann die Alternativhypothese als innovativ betrachtet werden.
Demgegenüber steht die Nullhypothese. Null- und Alternativhypothese dürfen sich nicht überschneiden, d.h. sie müssen disjunkt sein. Ziel eines statistischen Tests ist die Ablehnung (Verwerfung) der Nullhypothese. Falls diese nicht verworfen werden kann (z. B. weil nicht genügend Beobachtungen vorhanden sind), besteht aus statistischer Sicht allerdings kein Grund, von der Gültigkeit der Nullhypothese auszugehen (vgl. Fehler 2. Art). Ein statistischer Test kann also lediglich zu einer Annahme der Alternativhypothese, nicht aber zu einer Annahme der Nullhypothese führen.
Arten von Hypothesen
gerichtet vs. ungerichtet
Wenn wir uns unter Ω die Gesamtheit aller Möglichkeiten vorstellen, dann kann man einen Test allgemein so formulieren, dass die Nullhypothese darstellt und die Alternativhypothese. Für diesen allgemeinen Fall gibt es allerdings keine Standardtests. Stattdessen schaut man sich die Spezialfälle an, wo entweder nur die Menge, die die Nullhypothese erfüllt, ein Intervall ist (ungerichteter Test) oder wo beide Hypothesen durch ein Intervall dargestellt werden können (gerichteter Test).
- Ungerichtete Alternativhypothesen unterstellen lediglich einen Unterschied zwischen den verglichenen Kennwerten. Dabei ist egal, ob dieser Unterschied nun nach oben oder nach unten gerichtet ist. Nehmen wir folgendes Beispiel: Wir führen ein Training mit n=100 Kindern durch. Formulieren wir eine ungerichtete Hypothese, dann könnte die Alternativhypothese lauten, dass es einen Unterschied in der sportlichen Leistungsfähigkeit zwischen der Population der Kinder ohne und der mit Training gibt. Dabei ist es egal, ob die Kinder mit Training über eine höhere oder niedrigere sportliche Leistungsfähigkeit als Kinder ohne Training verfügen. Entsprechend lautet die Nullhypothese, dass keine Unterschiede zwischen beiden Populationen besteht.
- Gerichtete Hypothesen unterstellen einen Unterschied zwischen den untersuchten Kennwerten in eine bestimmte Richtung. Im obigen Beispiel lautete die Alternativhypothese dann entweder, dass die Kinder mit Training über eine höhere oder niedrigere sportliche Leistungsfähigkeit als Kinder ohne Training verfügen. Die Nullhypothese lautet dann entsprechend entweder, dass beide Populationen gleich sind oder einen Unterschied in die entgegengesetzte Richtung aufweisen.
spezifisch vs. unspezifisch
- Spezifische Hypothesen machen Aussagen über die Größe des erwarteten Unterschieds oder Zusammenhangs zwischen den untersuchten Kennwerten (postulieren z. B. einen bestimmten Mindestwert). Bezogen auf obiges Beispiel könnte man z. B. unterstellen, dass die Trainingspopulation um mindestens drei IQ-Punkte besser ist als die Ausgangspopulation.
- Unspezifische Hypothesen machen hingegen keine Aussagen über die Größe des erwarteten Unterschieds bzw. Zusammenhangs.
einfach vs. zusammengesetzt
- Eine Hypothese heißt einfach, wenn ihr eine einzelne Verteilung zu Grunde liegt. Macht die Hypothese lediglich die Aussage, dass die Verteilung einer Familie von Verteilungen angehört, spricht man von zusammengesetzten Hypothesen. Eine Nullhypothese der Form bei normalverteilten Größen mit bekannter Varianz, ist ein Beispiel für eine einfache Hypothese, die dazugehörige Alternativhypothese ist zusammengesetzt.
Wahl der Null- und Alternativhypothese
Formal zerlegen die Null- und Alternativhypothese einen Parameterraum Ω in zwei disjunkte nicht leere Teilmengen Ω0 und Ω1. Die Nullhypothese beinhaltet die Aussage, dass der unbekannte Parameter θ aus Ω0 stammt und die Alternativhypothese, dass der unbekannte Parameter aus Ω1 stammt
- vs. .
Für zwei Tests, den Einstichproben-t-Test (Parametertest) und den Lilliefors-Test (Verteilungstest), zeigt die folgende Tabelle die möglichen Null- und Alternativhypothesen usw. auf.
Test Nullhypothese Alternativ-
hypotheseParameterraum Ω0 Ω1 Einstichproben t-Test μ = μ0 μ0 μ mit μ > μ0 μ mit μ mit μ > μ0 μ < μ0 μ mit μ mit μ < μ0 Lilliefors-Test X ist normalverteilt X ist nicht normalverteilt Alle Verteilungen Normalverteilung alle Verteilungen außer der Normalverteilung Bei den fettgedruckten Nullhypothesen handelt es sich um einfache Nullhypothesen. In diesem Fall kann die Rolle der Nullhypothese und der Alternativhypothese nicht vertauscht werden, selbst wenn es aus der Anwendungssicht wünschenswert wäre.
Nur im Fall der beiden anderen zusammengesetzten Nullhypothesen kann die Rolle der Null- und Alternativhypothese vertauscht werden, d.h. man muss eines der Hypothesenpaare auswählen. Jedoch gilt hier immer, dass das Gleichheitszeichen in der Nullhypothese stehen muss.
Bei der Testentscheidung kann bei Nichtablehnung der Nullhypothese der Fehler 2. Art unterlaufen (Nichtablehnung der Nullhypothese, obwohl die Alternativhypothese gilt). Die Wahrscheinlichkeit dafür ist jedoch unbekannt. Bei Ablehnung der Nullhypothese kann zwar der Fehler 1. Art (Ablehnung der Nullhypothese, obwohl die Nullhypothese gilt) unterlaufen, jedoch ist die Wahrscheinlichkeit dafür kleiner gleich dem vorgebenen Signifikanzniveau (in der Regel 5%). Daher ist man daran interessiert, die Nullhypothese abzulehnen.
Dies führt zu dem folgenden Entscheidungsschema in 4 Schritten:[2]
1. Geht aus der Aufgabenstellung hervor, ob etwas gezeigt oder widerlegt werden soll?
- Ja: Man formuliert als Alternativhypothese das was gezeigt bzw. als Nullhypothese das, was widerlegt werden soll.
2. Nein. Sind die Konsequenzen von Fehlentscheidung bekannt?
- Ja: Man macht den Fehler mit dem größten Risiko zum Fehler 1. Art, da dieser Fehler festgelegt wird.
3. Nein. Geht aus der Aufgabenstellung hervor zu welcher Interessensgruppe der Prüfer gehört?
- Ja: Man formuliert die Alternativhypothese so, dass es im Interesse des Prüfers liegt die Alternativhypothese nachzuweisen.
4. Nein. Dann ist eine eindeutige Hypothesenformulierung nicht möglich.
Beispiel zu 1.: Eine Gruppe von Umweltschützern und eine Waschmittelfirma streiten sich, ob der mittlere Phosphatgehalt μ in einem Waschmittel zu hoch ist (z.B. 18g pro Packung).
- Die Umweltschützer wollen beweisen, dass der Phosphatgehalt zu hoch ist. Daher werden ihre Hypothesen lauten: vs. .
- Die Firma will beweisen, dass der Phosphatgehalt in Ordnung ist. Daher werden ihre Hypothesen lauten: vs. .
Je nach Interessenslage kommt man also zu unterschiedlichen Hypothesenpaaren.
Beispiel zu 2.: Ein Bankkunde will einen Kredit von 1.000 EUR von seiner Bank. Lehnt der Bankier den Kreditwunsch ab und ist der Kunde solvent, so verliert er die gezahlten Zinsen in Höhe von 80 EUR. Gibt der Bankier dem Kunden den Kredit und der Kunde ist insolvent, so verliert der Bankier die gesamten 1000 EUR.
- Werden die Hypothesen mit einem Signifikanzniveau von 5% so formuliert, dass der Fehler 1. Art gerade Bankier lehnt den Kreditwunsch ab und der Kunde ist solvent entspricht so wissen wir, dass der erwartete Verlust beim Fehler 1. Art gleich 80 EUR*5% = 4 EUR ist. Beim Fehler 2. Art kennen wir die Wahrscheinlichkeit nicht, d.h. im ungünstigsten Fall ist er Eins und der maximale Verlust ist gleich 1000 EUR. Zusammen ergibt sich bei einer Fehlentscheidung im Test ein erwarteter Verlust von 1004 EUR.
- Werden die Hypothesen mit einem Signifikanzniveau von 5% so formuliert, dass der Fehler 1. Art gerade Bankier akzeptiert den Kreditwunsch und der Kunde ist insolvent so wissen wir, dass der erwartete Verlust beim Fehler 1. Art gleich 1000 EUR*5% = 50 EUR ist. Beim Fehler 2. Art kennen wir die Wahrscheinlichkeit nicht, d.h. im ungünstigsten Fall ist er Eins und der maximale Verlust ist gleich 80 EUR. Zusammen ergibt sich bei einer Fehlentscheidung im Test ein erwarteter Verlust von 130 EUR.
Die Hypothesen sollten also so gewählt werden, dass der Fehler 1. Art Bankier akzeptiert den Kreditwunsch und der Kunde ist insolvent entspricht, da dann der erwartete Verlust am geringsten ist.
Siehe auch
- Hypothese, Abduktion, Fehlschluss, Arbeitshypothese, These
- Deduktion, Induktion (Denken), Statistische Signifikanz, Rhetorik, Dialektik
Einzelnachweise
Wikimedia Foundation.