- Power
-
Power (englisch für Kraft, Macht, Energie) oder Teststärke beschreibt in der Statistik die Aussagekraft eines statistischen Tests.
Die Teststärke gibt an, mit welcher Wahrscheinlichkeit ein Signifikanztest zugunsten einer spezifischen Alternativhypothese H1 (zum Beispiel „Es gibt einen Unterschied“) entscheidet, falls diese richtig ist. (Die abzulehnende Hypothese wird H0, die Nullhypothese genannt.)
Die Teststärke hat den Wert 1-β, wobei β die Wahrscheinlichkeit bezeichnet, einen Fehler 2. Art zu begehen.
Inhaltsverzeichnis
Entscheidungstabelle
Wahrer Sachverhalt: H0
(Es gibt keinen Unterschied)Wahrer Sachverhalt: H1
(Es gibt einen Unterschied)durch einen statistischen Test fällt eine Entscheidung für: H0 richtige Entscheidung (Spezifität) Fehler 2. Art
Wahrscheinlichkeit: βdurch einen statistischen Test fällt eine Entscheidung für: H1 Fehler 1. Art
Wahrscheinlichkeit: αrichtige Entscheidung
Wahrscheinlichkeit: 1-β (Teststärke, "Power", Sensitivität)Wahl des β-Fehler-Niveaus
Für Wirksamkeitsstudien medizinischer Behandlungen schlägt Cohen (1969: 56) für β einen 4-mal so hohen Wert vor wie für das Signifikanzniveau α. Wenn α = 5% ist, sollte das β-Fehler-Niveau also 20 % betragen. Liegt in einer Untersuchung die β-Fehler-Wahrscheinlichkeit (Wahrscheinlichkeit für einen Fehler 2. Art) unter dieser 20 %-Grenze, so ist die Teststärke (1-β) damit größer als 80 %.
Es sollte dabei bedacht werden, dass der β-Fehler bei vorgegebenem, festem Signifikanzniveau α im Allgemeinen nicht direkt kontrolliert werden kann. Bei vielen asymptotischen oder nichtparametrischen Tests ist der β-Fehler unberechenbar oder es existieren lediglich Simulationsstudien. Bei einigen Tests, zum Beispiel dem t-Test, kann der β-Fehler kontrolliert werden, wenn der statistischen Auswertung eine Stichprobenumfangsplanung vorausgeht.
Determinanten der Teststärke
Die Teststärke (1-β) wird größer [1]:
- mit wachsender Differenz von μ0 − μ1 (das bedeutet: ein großer Unterschied zwischen zwei Teilpopulationen wird seltener übersehen als ein kleiner Unterschied)
- mit kleiner werdender Merkmalsstreuung σ
- mit größer werdendem Signifikanzniveau α (sofern β nicht festgelegt ist)
- mit wachsendem Stichprobenumfang, da der Standardfehler dann kleiner wird:
Siehe auch
Wichtig für die Power ist auch die Art des statistischen Tests: Parametrische Tests (zum Beispiel t-Test) haben, falls die Verteilungsannahme stimmt, bei gleichem Stichprobenumfang stets eine höhere Power als nichtparametische Tests wie zum Beispiel der Wilcoxon-Vorzeichen-Rang-Test. Weichen die angenommene Verteilung und die wahre Verteilung jedoch voneinander ab, liegt also zum Beispiel in Wahrheit eine Laplace-Verteilung zugrunde, während eine Normalverteilungsannahme getroffen wurde, so können nichtparametrische Verfahren eine wesentlich größere Power als ihre parametrischen Gegenstücke besitzen.
Literatur
- Cohen, J.: Statistical Power Analysis for the Behavior Science. Erlbaum; Hillsdale, NJ 1969, ISBN 0-8058-0283-5
Weblinks
Wiktionary: Power – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen- G*Power 3 – frei verfügbares Programm zur Teststärkeanalyse
- [1] - Animation zum Fehler 1. und 2. Art
Einzelnachweise
- ↑ Bortz, J.: Statistik für Sozialwissenschaftler. Springer, Berlin 1999. ISBN 3-540-21271-X
Wikimedia Foundation.