Teststärke

Teststärke

Power (englisch für Kraft, Macht, Energie) oder Teststärke beschreibt in der Statistik die Aussagekraft eines statistischen Tests oder auch einer medizinischen Studie.

Die Teststärke gibt an, mit welcher Wahrscheinlichkeit ein Signifikanztest zugunsten einer spezifischen Alternativhypothese H1 (z. B. „Es gibt einen Unterschied“) entscheidet, falls diese richtig ist. (Die abzulehnende Hypothese wird H0, die Nullhypothese genannt.)

Die Teststärke hat den Wert 1-β, wobei β die Wahrscheinlichkeit bezeichnet, einen Fehler 2. Art zu begehen.

Inhaltsverzeichnis

Entscheidungstabelle

Wahrer Sachverhalt: H0
(Es gibt keinen Unterschied)
Wahrer Sachverhalt: H1
(Es gibt einen Unterschied)
durch einen statistischen Test fällt eine Entscheidung für: H0 richtige Entscheidung (Spezifität) Fehler 2. Art
Wahrscheinlichkeit: β
durch einen statistischen Test fällt eine Entscheidung für: H1 Fehler 1. Art
Wahrscheinlichkeit: α
richtige Entscheidung
Wahrscheinlichkeit: 1-β ("Power", Sensitivität)

Wahl des β-Fehler-Niveaus

Für Wirksamkeitsstudien medizinischer Behandlungen schlägt Cohen (1969) für β einen 4-mal so hohen Wert vor wie für das Signifikanzniveau α. Wenn α = 5% ist, sollte das β-Fehler-Niveau also 20 % betragen. Liegt in einer Untersuchung die β-Fehler-Wahrscheinlichkeit (Wahrscheinlichkeit für einen Fehler 2. Art) unter dieser 20 %-Grenze, so ist die Teststärke (1-β) damit größer als 80 %.

Es sollte dabei bedacht werden, dass der β-Fehler bei vorgegebenem, festem Signifikanzniveau α im Allgemeinen nicht direkt kontrolliert werden kann. Bei vielen asymptotischen oder nichtparametrischen Tests ist der β-Fehler unberechenbar oder es existieren lediglich Simulationsstudien. Bei einigen Tests, z.B. dem t-Test, kann der β-Fehler kontrolliert werden, wenn der statistischen Auswertung eine Fallzahlplanung vorausgeht.

Determinanten der Power

Die Power (1-β) wird größer [1]:

  • mit wachsender Differenz von μ0 − μ1 (das bedeutet: ein großer Unterschied zwischen zwei Teilpopulationen wird seltener übersehen als ein kleiner Unterschied)
  • mit kleiner werdender Merkmalsstreuung σ
  • mit größer werdendem Signifikanzniveau α (sofern β nicht festgelegt ist)
  • mit wachsendem Stichprobenumfang (da der Standardfehler dann kleiner wird:  \sigma_{\overline{x}} = \frac{\sigma}{\sqrt{n}})

Siehe auch

Wichtig für die Power ist auch die Art des statistischen Tests: Parametrische Tests (z.B. t-Test) haben, falls die Verteilungsannahme stimmt, bei gleichem Stichprobenumfang stets eine höhere Power als nichtparametische Tests wie z.B. der Wilcoxon-Vorzeichen-Rang-Test. Weichen die angenommene Verteilung und die wahre Verteilung jedoch voneinander ab, liegt also z.B. in Wahrheit eine Laplace-Verteilung zugrunde, während eine Normalverteilungsannhame getroffen wurde, so können nichtparametrische Verfahren eine wesentlich größere Power als ihre parametrischen Gegenstücke besitzen.

Literatur

  • Cohen, J.: Statistical Power Analysis for the Behavior Science. Erlbaum; Hillsdale, NJ 1969, ISBN 0-8058-0283-5

Weblinks

  • [1] - Animation zum Fehler 1. und 2. Art

Quellen

  1. Bortz, J.: Statistik für Sozialwissenschaftler. Springer, Berlin 1999. ISBN 3-540-21271-X

Wikimedia Foundation.

Игры ⚽ Нужен реферат?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Teststärke — Trennschärfe, Güte eines Tests, Macht eines Tests; Ordinate der ⇡ Gütefunktion eines ⇡ statistischen Testverfahrens. Die T. gibt die Fähigkeit eines Tests an, eine falsche ⇡ Nullhypothese als solche kenntlich zu machen …   Lexikon der Economics

  • Güte — ⇡ Teststärke …   Lexikon der Economics

  • Trennschärfe — ⇡ Teststärke …   Lexikon der Economics

  • Shapiro-Wilk-Test — Der Shapiro Wilk Test ist ein statistischer Signifikanztest, der die Hypothese überprüft, dass die zugrunde liegende Grundgesamtheit einer Stichprobe normalverteilt ist. Die Nullhypothese H0 nimmt an, dass eine Normalverteilung der… …   Deutsch Wikipedia

  • Power — (englisch für Kraft, Macht, Energie) oder Teststärke beschreibt in der Statistik die Aussagekraft eines statistischen Tests. Die Teststärke gibt an, mit welcher Wahrscheinlichkeit ein Signifikanztest zugunsten einer spezifischen… …   Deutsch Wikipedia

  • Anderson-Darling-Test — Der Anderson Darling Test beziehungsweise Anderson Darling Anpassungstest ist ein statistischer Test, mit dem festgestellt werden kann, ob die Häufigkeitsverteilung der Daten einer Stichprobe von einer vorgegebenen hypothetischen… …   Deutsch Wikipedia

  • Neyman-Pearson-Lemma — Das Neyman Pearson Lemma ist ein Satz der mathematischen Statistik, der eine Optimalitätsaussage über die Konstruktion eines Hypothesentests macht. Gegenstand des Neyman Pearson Lemmas ist das denkbar einfachste Szenario eines Hypothesentests:… …   Deutsch Wikipedia

  • Median-Test — Der Median Test, auch als Mood’s Median Test, Westenberg Mood Median Test oder Brown Mood Median Test bezeichnet, ist ein statistischer Test, mit dem untersucht werden kann, ob zwei oder mehr unabhängige Stichproben aus Grundgesamtheiten mit… …   Deutsch Wikipedia

  • Lilliefors-Test — Der Lilliefors Test beziehungsweise Kolmogorow Smirnow Lilliefors Test ist ein statistischer Test, mit dem die Häufigkeitsverteilung der Daten einer Stichprobe auf Abweichungen von der Normalverteilung untersucht werden kann. Er basiert auf einer …   Deutsch Wikipedia

  • Effectiveness — Dieser Artikel oder Abschnitt ist nicht hinreichend mit Belegen (Literatur, Webseiten oder Einzelnachweisen) versehen. Die fraglichen Angaben werden daher möglicherweise demnächst gelöscht. Hilf Wikipedia, indem du die Angaben recherchierst und… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”