Einstichproben-t-Test

Einstichproben-t-Test

Der Einstichproben-t-Test ist ein Signifikanztest aus der mathematischen Statistik. Er prüft anhand des Mittelwertes einer Stichprobe, ob der Mittelwert einer Grundgesamtheit gleich einem vorgegebenen Wert ist (bzw. kleiner oder größer).

Inhaltsverzeichnis


Testidee

Der Einstichproben-t-Test prüft (im einfachsten Fall) mit Hilfe des Mittelwertes \bar{x} einer Stichprobe, ob der Mittelwert der Grundgesamtheit μ verschieden von einem vorgegebenen Wert μ0 ist.

Die untenstehende Grafik zeigt eine Grundgesamtheit (schwarze Punkte) und eine Stichprobe (rote Punkte), die zufällig aus der Grundgesamtheit gezogen wurde. Der Mittelwert der Stichprobe \bar{x} kann aus der Stichprobe berechnet werden, der Mittelwert der Grundgesamtheit μ ist jedoch unbekannt. Man vermutet, z.B. wegen historischen Ergebnissen oder theoretischen Überlegungen, dass der Mittelwert μ der Grundgesamtheit verschieden von einem vorgegebenen Wert μ0 ist.

Im einfachsten Fall prüft der Test

  • die Nullhypothese, dass der Mittelwert der Grundgesamtheit gleich dem vorgegebenen Wert ist (H_0:\,\mu=\mu_0)
  • gegen die Alternativhypothese, dass der Mittelwert der Grundgesamtheit ungleich dem vorgegebenen Wert ist (H_1:\,\mu\neq\mu_0).
One sample ttest.svg

Wenn die Stichprobe geeignet gezogen wird, z.B. als einfache Zufallsstichprobe, wird der Mittelwert der Stichprobe \bar{x} mit hoher Wahrscheinlichkeit nahe bei dem Mittelwert der Grundgesamtheit μ liegen. D.h. der waagerechte Abstand zwischen der gestrichelten roten und schwarzen Linie wird mit hoher Wahrscheinlichkeit klein sein.

  • Liegt nun der vorgegebene Wert μ0 nahe dem Mittelwert der Stichprobe \bar{x}, d.h. die gestrichelten blaue und rote Linie haben einen kleinen waagerechten Abstand, dann liegt der vorgegebene Wert μ0 auch nahe dem Mittelwert der Grundgesamtheit μ. Wir können dann die Nullhypothese nicht ablehnen.
  • Liegt jedoch der vorgegebene Wert μ0 weit entfernt von dem Mittelwert der Stichprobe \bar{x}, d.h. die gestrichelten blaue und rote Linie haben einen großen waagerechten Abstand, dann liegt der vorgegebene Wert μ0 auch weit entfernt von dem Mittelwert der Grundgesamtheit μ. Dann können wir die Nullhypothese ablehnen.

Die genauen mathematischen Berechnungen finden sich in den folgenden Abschnitten.

Hypothesen

Für den Einstichproben-t-Test können drei verschiedene Hypothesenpaare (Nullhypothese H0 vs. Alternativhypothese H1) formuliert werden:

  1. H_0:\,\mu=\mu_0 vs. H_1:\,\mu\neq\mu_0 (zweiseitiger Test),
  2. H_0:\,\mu\leq\mu_0 vs. H_1:\,\mu>\mu_0 (rechtsseitiger Test) und
  3. H_0:\,\mu\geq\mu_0 vs. H_1:\,\mu<\mu_0 (linksseitiger Test),

Für alle drei Hypothesenpaare wird die gleiche Teststatistik benutzt, lediglich die Bereiche für die Ablehnung bzw. Annahme der Nullhypothese unterscheiden sich.

Mathematische Ableitung der Teststatistik

Für eine normalverteilte Grundgesamtheit

Sind X_1, X_2, \dots, X_n unabhängige normalverteilte Zufallsvariablen mit Erwartungswert μ und Standardabweichung σ, und möchte man die Nullhypothese μ = μ0 testen, dann liegt es nahe, ihr arithmetisches Mittel

\bar X = \frac{1}{n} \sum_{i=1}^n X_i

als Teststatistik zu benutzen. Sie ist namentlich ebenfalls normalverteilt mit Erwartungswert μ, hat aber die Standardabweichung σ/√n. Bei bekanntem σ könnte die Hypothese mit einem Gauß-Test getestet werden. Dazu berechnet man

Z = \sqrt{n}\frac{\bar X - \mu_0}{\sigma},

welche unter der Nullhypothese standardnormalverteilt ist.

Normalerweise ist jedoch die Standardabweichung unbekannt. In diesem Fall liegt es nahe, sie durch die empirische Standardabweichung

S = \sqrt{\frac{\sum_{i=1}^n(X_i - \bar X )^2}{n-1}}

zu schätzen und als Teststatistik

T = \sqrt{n}\frac{\bar X - \mu_0}{S}

zu verwenden. Diese Statistik ist unter der Nullhypothese allerdings nicht mehr normalverteilt, sondern t-verteilt mit n−1 Freiheitsgraden. Ist der Wert der Teststatistik für eine konkrete Stichprobe so groß (oder so klein), dass dieser oder ein noch extremerer Wert unter der Nullhypothese hinreichend unwahrscheinlich ist, wird die Nullhypothese abgelehnt.

Für eine beliebig verteilte Grundgesamtheit

Sind X_1, X_2, \dots, X_n (n > 30) unabhängige identisch verteilte Zufallsvariablen mit Erwartungswert μ (-\infty<\mu<\infty) und Standardabweichung σ (\sigma<\infty), dann liegt es wie im obigen Fall nahe, ihr arithmetisches Mittel

\bar X = \frac{1}{n} \sum_{i=1}^n X_i

als Teststatistik zu benutzen. Obwohl ihre Verteilung unbekannt ist, gilt aufgrund des zentralen Grenzwertsatzes, dass sie approximativ normalverteilt ist mit Erwartungswert μ und Standardabweichung σ/√n.

Weil normalerweise die Standardabweichung unbekannt ist, liegt es auch in diesem Fall nahe, sie durch die empirische Standardabweichung

S = \sqrt{\frac{\sum_{i=1}^n(X_i - \bar X )^2}{n-1}}

zu schätzen und wieder als Teststatistik

T = \sqrt{n}\frac{\bar X - \mu_0}{S}

zu verwenden. Diese Statistik ist unter der Nullhypothese allerdings nur annähernd t-verteilt mit n−1 Freiheitsgraden. Ist der Wert der Teststatistik für eine konkrete Stichprobe so groß (oder so klein), dass dieser oder ein noch extremerer Wert unter der Nullhypothese hinreichend unwahrscheinlich ist, wird die Nullhypothese abgelehnt.

Beispiel

Zweiseitiger Test

Es soll getestet werden, ob die durchschnittliche Laufzeit μ von Notebook-Akkus möglicherweise von den vom Hersteller angegebenen 3,5 Stunden abweicht. Dazu werden bei 10 Akkus dieser Marke unter kontrollierten gleichen Bedingungen die Laufzeiten gemessen. Da wir nur wenige Beobachtungen haben, kann der zentrale Grenzwertsatz nicht angewendet werden; siehe Abschnitt Mathematische Ableitung der Teststatistik für eine beliebig verteilte Grundgesamtheit. Wir müssen daher davon ausgehen, dass die Laufzeit der Notebook-Akkus in der Grundgesamtheit normalverteilt ist.

Folgende Hypothesen sollen geprüft werden:

Allgemein Beispiel
H_0:\, \mu = \mu_0 vs. H_1:\, \mu \neq \mu_0 H_0:\, \mu = 3{,}5 Stunden vs. H_1:\, \mu \neq 3{,}5 Stunden

Bei der Durchführung des Tests ergebe sich beispielsweise der Sichprobenmittelwert \bar{x} = 3{,}25 Stunden und die Stichprobenstandardabweichung s = 0,31 Stunden. Daraus lässt sich nun der Prüfwert t folgendermaßen berechnen:

Allgemein Beispiel
t = \sqrt{n}\frac{\bar x - \mu_0}{s} t = \sqrt{10}\frac{3{,}25-3{,}5}{0{,}31} \approx -2{,}55
mit \bar x = \frac{1}{n}\sum_{i=1}^n x_i \bar{x}=3{,}25 Stunden
und s = \sqrt{\frac{\sum_{i=1}^n(x_i-\bar x)^2}{n-1}} s = 0,31 Stunden

Die Nullhypothese wird zum Signifikanzniveau α abgelehnt, falls |t| > t(1-\tfrac{\alpha}{2}, n-1). Darin entspricht t(1-\tfrac{\alpha}{2}, n-1) dem (1 - \tfrac{\alpha}{2})-Quantil der t-Verteilung mit n − 1 Freiheitsgraden.

Für das Beispiel heißt das, dass die Nullhypothese abgelehnt wird bei einem Signifikanzniveau α = 5%, wenn t kleiner ist als das 2,5%-Quantil oder größer als das 97,5%-Quantil der t-Verteilung mit 10 − 1 = 9 Freiheitsgraden. Man findet mit Hilfe einer t-Tabelle oder eines Computerprogramms den Wert t(0,975;9) = 2,262. Wegen die Symmetrie der t-Verteilung ist t(0,025;9) = − 2,262. Weil t < − 2,262 kann die Nullhypothese, dass der Erwartungswert der Laufzeit gleich 3,5 Stunden ist, zum Signifikanzniveau α = 5% abgelehnt werden. Die Akkus laufen im Mittel nicht 3,5 Stunden, also mehr oder weniger.

Einseitiger Test

In der Praxis hätte man einen einseitigen Test durchgeführt, denn wenn die Akkus mehr als 3,5 Stunden laufen, dann ist man als Kunde ja auch zufrieden. Die Hypothesen zum Prüfen, ob die Akkus mindestens 3,5 Stunden durchhalten, lauten dann

Allgemein Beispiel
H_0:\, \mu \geq \mu_0 vs. H_1:\, \mu < \mu_0 H_0:\, \mu \geq 3{,}5 Stunden vs. H_1:\, \mu < 3{,}5 Stunden

Der Prüfwert ergibt sich wieder zu t \approx -2{,}55 und kann auch zum Testen der einseitigen Hypothese zum Signifikanzniveau α verwendet werden. Die Nullhypothese \mu \geq \mu_0 wird nun abgelehnt, wenn t < -t(1-\alpha,\ n-1) ist.

Für α = 0.05 ergibt sich t(1-\alpha,\ n-1)=1{,}833 und da gilt − 2,55 < − 1,833 können wir diese Nullhypothese ebenfalls ablehnen, d. h., wir konnten zeigen, dass die durchschnittliche Akkulaufzeit kleiner als 3,5 Stunden ist.

Alternative Tests

  • Nur im Fall,
  • wenn der zentrale Grenzwertsatz für die Stichprobenvariablen Xi nicht erfüllt ist oder
  • wenn der zentrale Grenzwertsatz für die Stichprobenvariablen Xi erfüllt ist und der Stichprobenumfang kleiner gleich 30 ist
muss als Alternative der nicht-parametrische Einstichproben-Median-Test eingesetzt werden. Dieser testet allerdings, ob der Median der Grundgesamtheit einem vorgegebenen Wert entspricht.

Kompaktdarstellung

Einstichproben-t-Test
Voraussetzungen
  • X_i\, unabhängig voneinander
  • X_i\sim N(\mu;\sigma)\, oder X_i\sim (\mu;\sigma)\, mit n > 30 (ZGS erfüllt)
Hypothesen H_0: \mu\leq\mu_0
H_1: \mu>\mu_0\,
(rechtsseitig)
H_0: \mu=\mu_0\,
H_1: \mu\neq\mu_0
(zweiseitig)
H_0: \mu\geq\mu_0
H_1: \mu<\mu_0\,
(linksseitig)
Teststatistik T=\sqrt{n}\frac{\bar{X}-\mu_0}{S} \sim t_{n-1}
Prüfwert t=\sqrt{n}\frac{\bar{x}-\mu_0}{s} mit \bar{x}=\frac{1}{n}\sum_{i=1}^n x_i und s=\sqrt{\frac{1}{n-1}\sum_{i=1}^n(x_i-\bar{x})^2}
Ablehnungsbereich H0 (t_{1-\alpha;n-1},\infty)\, (-\infty,-t_{1-\frac{\alpha}2;n-1})\cup (t_{1-\frac{\alpha}2;n-1},\infty)\, (-\infty,-t_{1-\alpha;n-1})\,

Literatur

Weblinks


Wikimedia Foundation.

Игры ⚽ Поможем написать реферат

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Einstichproben t-Test — Der t Test ist ein Begriff aus der mathematischen Statistik, er bezeichnet eine Gruppe von Hypothesentests. Den t Test im eigentlichen Sinn gibt es nicht. Es handelt sich hier lediglich um einen beliebigen Hypothesentest mit t verteilter… …   Deutsch Wikipedia

  • T-Test — Der t Test ist ein Begriff aus der mathematischen Statistik, er bezeichnet eine Gruppe von Hypothesentests. Den t Test im eigentlichen Sinn gibt es nicht. Es handelt sich hier lediglich um einen beliebigen Hypothesentest mit t verteilter… …   Deutsch Wikipedia

  • Zweistichproben t-Test — Der t Test ist ein Begriff aus der mathematischen Statistik, er bezeichnet eine Gruppe von Hypothesentests. Den t Test im eigentlichen Sinn gibt es nicht. Es handelt sich hier lediglich um einen beliebigen Hypothesentest mit t verteilter… …   Deutsch Wikipedia

  • Gauß-Test — Der Gauß Test ist ein Begriff aus der mathematischen Statistik. Er bezeichnet eine Gruppe von Hypothesentests mit standardnormalverteilter Testprüfgröße. Der Test ist benannt nach Carl Friedrich Gauß. Mit dem Gauß Test werden anhand von… …   Deutsch Wikipedia

  • Wald-Test — Der Wald Test ist ein statistischer Test, der 1943 von Abraham Wald vorgestellt worden ist. Ist θ ein unbekannter Parameter in der Grundgesamtheit und θ0 ein vorgegebener Wert, so prüft er die Hypothesen: vs. . Das Problem ist, die Verteilung… …   Deutsch Wikipedia

  • t-Test — Der t Test ist ein Begriff aus der mathematischen Statistik, er bezeichnet eine Gruppe von Hypothesentests mit t verteilter Testprüfgröße. Oft ist jedoch mit dem t Test der Einstichproben bzw. Zweistichproben t Test gemeint. Der Einstichproben t… …   Deutsch Wikipedia

  • Zweistichproben-t-Test — Der Zweistichproben t Test ist ein Signifikanztest aus der mathematischen Statistik. Er prüft anhand der Mittelwerte zweier Stichproben, ob die Mittelwerte zweier Grundgesamtheiten einander gleich sind, ggf. gegen die Alternative, dass einer der… …   Deutsch Wikipedia

  • Kolmogorow-Smirnow-Test — Der Kolmogorow Smirnow Test (KS Test) (nach Andrei Nikolajewitsch Kolmogorow und Wladimir Iwanowitsch Smirnow) ist ein statistischer Test auf Übereinstimmung zweier Wahrscheinlichkeitsverteilungen. Mit seiner Hilfe kann anhand von… …   Deutsch Wikipedia

  • Hypothese (Statistik) — In der Statistik bezeichnet man mit Hypothese eine Annahme, die mit Methoden der mathematischen Statistik auf Basis empirischer Daten geprüft wird. Man unterscheidet als Gegensatzpaar Nullhypothese, H0, und Alternativhypothese (auch… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”