T-Test

T-Test

Der t-Test ist ein Begriff aus der mathematischen Statistik, er bezeichnet eine Gruppe von Hypothesentests. Den t-Test im eigentlichen Sinn gibt es nicht. Es handelt sich hier lediglich um einen beliebigen Hypothesentest mit t-verteilter Testprüfgröße.

Oft ist jedoch mit dem t-Test der Einstichproben- bzw. Zweistichproben t-Test gemeint:

Weitere wichtige Tests mit t-verteilter Prüfgröße sind:

Der t-Test ist ein Spezialfall des Wald-Tests.

Inhaltsverzeichnis

Einstichproben t-Test

Grundidee für den t-Test über den Erwartungswert einer normalverteilten Grundgesamtheit

Sind X_1, X_2, \dots, X_n unabhängige normalverteilte Zufallsvariablen mit Erwartungswert μ und Standardabweichung σ, dann ist ihr arithmetisches Mittel \bar X = \frac{1}{n}\sum_{i=1}^n X_i ebenfalls normalverteilt mit Erwartungswert μ und hat die Standardabweichung \frac{\sigma}{\sqrt{n}}. Daher ist der standardisierte Mittelwert Z = \sqrt{n}\frac{\bar X - \mu}{\sigma} standardnormalverteilt und könnte mit einem Gauß-Test getestet werden.

Normalerweise ist jedoch die Standardabweichung unbekannt. In diesem Fall liegt es nahe, sie durch die empirische Standardabweichung S = \sqrt{\frac{\sum_{i=1}^n(X_i - \bar X )^2}{n-1}} zu schätzen und als Teststatistik

T = \sqrt{n}\frac{\bar X - \mu}{S}

zu verwenden. Dieser Wert ist allerdings nicht mehr normalverteilt, sondern t-verteilt mit n − 1 Freiheitsgraden. Ist er für eine konkrete Stichprobe so groß (oder so klein), dass dieser oder ein noch extremerer Wert unter der Nullhypothese hinreichend unwahrscheinlich ist, wird die Nullhypothese abgelehnt.

Grundidee für den t-Test über den Erwartungswert einer beliebig verteilten Grundgesamtheit

Sind X_1, X_2, \dots, X_n (n > 30) unabhängige beliebig verteilte Zufallsvariablen mit Erwartungswert -\infty<\mu<\infty und Standardabweichung \sigma<\infty, dann ist aufgrund des zentralen Grenzwertsatzes ihr arithmetisches Mittel \bar X = \frac{1}{n}\sum_{i=1}^n X_i ebenfalls approximativ normalverteilt mit Erwartungswert μ und hat die Standardabweichung \frac{\sigma}{\sqrt{n}}. Mit der gleichen Argumentation wie zuvor gelangt man zu einer t-verteilten Teststatistik

Vorgehen

Für eine Stichprobe x_1, x_2, \dots, x_n aus einer normalverteilten Grundgesamtheit mit unbekanntem Erwartungswert μ und unbekannter Standardabweichung σ soll die Nullhypothese H0:μ = μ0 (mit einem festen vermuteten Wert μ0) gegen die zweiseitige Alternative H_1 \colon \mu \neq \mu_0 getestet werden. Dazu wird mit dem Stichprobenmittelwert \bar x = \frac{1}{n}\sum_{i=1}^n x_i und der Stichprobenstandardabweichung s = \sqrt{\frac{\sum_{i=1}^n(x_i - \bar x)^2}{n-1}} die Testprüfgröße t = \sqrt{n}\frac{\bar x - \mu_0}{s} berechnet. Die Nullhypothese wird zum Signifikanzniveau α abgelehnt, falls |t| > t(1-\tfrac{\alpha}{2}, n-1) ist, dem (1 - \tfrac{\alpha}{2})-Quantil der t-Verteilung mit n − 1 Freiheitsgraden.

Die Prüfgröße t kann auch zum Testen der einseitigen Alternative μ > μ0 gegen die Nullhypothese \mu \leq \mu_0 zum Signifikanzniveau α verwendet werden. Diese wird nun abgelehnt, wenn t > t(1-\alpha,\ n-1) gilt. Analog wird die Nullhypothese \mu \geq \mu_0 abgelehnt, wenn t < -t(1-\alpha,\ n-1) ist.

Beispiel 1

Es soll getestet werden, ob die durchschnittliche Laufzeit von Notebook-Akkus tatsächlich mindestens 3,5 Stunden beträgt, wie vom Hersteller behauptet. Dazu werden bei 10 Akkus dieser Marke unter kontrollierten gleichen Bedingungen die Laufzeiten gemessen. Es ergibt sich ein empirischer Mittelwert von 3,25 Stunden mit einer Standardabweichung von 0,31 Stunden. Daraus berechnet sich als Prüfgröße ein t-Wert von t = \sqrt{10}\frac{3{,}25-3{,}5}{0{,}31} \approx -2{,}55. Für das 0,95-Quantil der t-Verteilung mit 10 − 1 = 9 Freiheitsgraden findet man mit Hilfe einer t-Tabelle oder eines Computerprogramms den Wert t(0,95;9) = 1,833. Wegen t < − 1,833 kann die Nullhypothese, dass der Erwartungswert der Laufzeit größer oder gleich 3,5 Stunden ist, zum Signifikanzniveau \alpha = 5\% abgelehnt werden. Die Akkus erreichen also nicht die behaupteten Laufzeiten.

Kompaktdarstellung

Einstichproben t-Test
Voraussetzungen
  • X_i\, unabhängig voneinander
  • X_i\sim N(\mu;\sigma)\, oder X_i\sim (\mu;\sigma)\, mit n > 30
Hypothesen H_0: \mu\leq\mu_0
H_1: \mu&amp;gt;\mu_0\,
(rechtsseitig)
H_0: \mu=\mu_0\,
H_1: \mu\neq\mu_0
(zweiseitig)
H_0: \mu\geq\mu_0
H_1: \mu&amp;lt;\mu_0\,
(linksseitig)
Teststatistik V=\frac{\bar{X}-\mu_0}{S/\sqrt{n}} \sim t_{n-1}
Prüfwert v=\frac{\bar{x}-\mu_0}{s/\sqrt{n}} mit \bar{x}=\frac{1}{n}\sum_{i=1}^n x_i und s=\sqrt{\frac{1}{n-1}\sum_{i=1}^n(x_i-\bar{x})^2}
Annahmebereich H0 \{v|v\leq t_{1-\alpha;n-1}\}\, \{v|-t_{1-\alpha/2;n-1}\leq v \leq t_{1-\alpha/2;n-1}\}\, \{v|v\geq -t_{1-\alpha;n-1}\}\,
Annahmebereich H1 \{v|v&amp;gt;t_{1-\alpha;n-1}\}\, \{v|v&amp;lt;-t_{1-\alpha/2;n-1}\}\,
oder
\{v|v&amp;gt;t_{1-\alpha/2;n-1}\}\,
\{v|v&amp;lt;-t_{1-\alpha;n-1}\}\,

Zweistichproben t-Test

Aus der Theorie der multivariaten Normalverteilung folgt, dass die Differenz zweier normal verteilter (oder approximativ normalverteilter) Zufallsvariable wieder normalverteilt ist. Damit kann der Zweistichproben t-Test auf den Einstichproben t-Test zurückgeführt werden mit D=\bar{X}-\bar{Y}:

H_0: \mu_x\leq \mu_y H_1: \mu_x&amp;gt; \mu_y\, \Longleftrightarrow H_0: \mu_D\leq 0 H_1: \mu_D&amp;gt;0\,
H_0: \mu_x=\mu_y\, H_1: \mu_x\neq \mu_y \Longleftrightarrow H_0: \mu_D= 0\, H_1: \mu_D\neq 0
H_0: \mu_x\geq\mu_y H_1: \mu_x&amp;lt; \mu_y\, \Longleftrightarrow H_0: \mu_D\geq0 H_1: \mu_D&amp;lt; 0\,

Das Problem ist die Schätzung der Varianz von D\, unter Gültigkeit der Nullhypothese zur Bestimmung der Verteilung der Teststatistik:

  • Sind die Grundgesamtheiten abhängig voneinander, dann muss der t-Test für gepaarte Stichproben durchgeführt werden.
  • Sind die Grundgesamtheiten unabhängig voneinander und
    • sind die Varianzen in den Grundgesamtheiten gleich, dann muss der t-Test für zwei unabhängige Stichproben durchgeführt werden und
    • sind die Varianzen in den Grundgesamtheiten ungleich, dann muss der Welch-Test durchgeführt werden.

Die drei Tests unterscheiden sich im wesentlichen dadurch, wie die Varianz von D\, geschätzt wird. Dies beeinflusst auch die Zahl der Freiheitsgrade für die t-Verteilung der Teststatistik.

t-Tests für gepaarte Stichproben

Hier sind x_1, x_2, \dots, x_n und y_1, y_2, \dots, y_n zwei paarweise verbundene Stichproben, die beispielsweise aus zwei Messungen an denselben Untersuchungseinheiten gewonnen wurden (Messwiederholung). Die Stichproben können auch aus anderen Gründen paarweise abhängig sein, z.B., wenn die x- und y-Werte Messergebnisse von Frauen bzw. Männern in einer Partnerschaft sind und Unterschiede zwischen den Geschlechtern interessieren.

Soll die Nullhypothese getestet werden, dass die beiden Erwartungswerte der zugrunde liegenden normalverteilten Grundgesamtheiten gleich sind, so können mit dem oben beschriebenen Einstichproben-t-Test die Differenzen di = xiyi auf den Erwartungswert 0 getestet werden.

Beispiel 2

Um eine neue Therapie zur Senkung des Cholesterinspiegels zu testen, werden bei zehn Probanden vor und nach der Behandlung die Cholesterinwerte bestimmt. Es ergeben sich die folgenden Messergebnisse:

vor der Behandlung:   223  259  248  220  287  191  229  270  245  201
nach der Behandlung:  220  244  243  211  299  170  210  276  252  189
Differenz:              3   15    5    9  -12   21   19   -6   -7   12

Die Differenzen der Messwerte haben das arithmetisches Mittel \bar d = 5{,}9 und die Stichprobenstandardabweichung sd = 11,39. Das ergibt als Prüfgrößenwert

t=\sqrt{10}\frac{5{,}9}{11{,}39}=1{,}6385.

Es ist t(0{,}975;\ 9) = 2{,}2622, also gilt |t| \leq t(0{,}975;\ 9). Somit kann die Nullhypothese, dass die Erwartungswerte der Cholesterinwerte vor und nach der Behandlung gleich sind, die Therapie also keine Wirkung hat, zum Signifikanzniveau \alpha=5\% nicht abgelehnt werden. Wegen t&amp;lt;t(0{,}95;\ 9) = 1{,}8331 ist auch die einseitige Alternative, dass die Therapie den Cholesterinspiegel senkt, nicht signifikant. Wenn die Behandlung überhaupt einen Effekt hat, so ist dieser nicht groß genug, um ihn mit einem so kleinen Stichprobenumfang zu entdecken.

Kompaktdarstellung

Zweistichproben t-Test für zwei gepaarte Stichproben
Voraussetzungen
  • D_i=X_i-Y_i\, unabhängig voneinander
  • \bar{D}=\frac{1}{n}\sum_{i=1}^n D_i\sim N(\mu_D; \sigma_D/\sqrt{n}) (zumindest approximativ)
Hypothesen H_0: \mu_x-\mu_y\leq\omega_0
H_1: \mu_x-\mu_y&amp;gt;\omega_0\,
(rechtsseitig)
H_0: \mu_x-\mu_y=\omega_0\,
H_1: \mu_x-\mu_y\neq\omega_0
(zweiseitig)
H_0: \mu_x-\mu_y\geq\omega_0
H_1: \mu_x-\mu_y&amp;lt;\omega_0\,
(linksseitig)
Teststatistik V=\frac{\bar{D}-\omega_0}{S_D/\sqrt{n}} \sim t_{n-1}
Prüfwert v=\frac{(\bar{x}-\bar{y})-\omega_0}{s_D/\sqrt{n}} mit \bar{x}=\frac{1}{n}\sum_{i=1}^{n} x_i, \bar{y}=\frac{1}{n}\sum_{i=1}^{n} y_i
und s_D = \frac{1}{n-1}\sum_{i=1}^n \left((x_i-y_i)-(\bar{x}-\bar{y})\right)^2
Annahmebereich H0 \{v|v\leq t_{1-\alpha;n-1}\}\, \{v|-t_{1-\alpha/2;n-1}\leq v \leq t_{1-\alpha/2;n-1}\}\, \{v|v\geq -t_{1-\alpha;n-1}\}\,
Annahmebereich H1 \{v|v&amp;gt;t_{1-\alpha;n-1}\}\, \{v|v&amp;lt;-t_{1-\alpha/2;n-1}\}\,
oder
\{v|v&amp;gt;t_{1-\alpha/2;n-1}\}\,
\{v|v&amp;lt;-t_{1-\alpha;n-1}\}\,


t-Tests für zwei unabhängige Stichproben

Gegeben sind nun zwei unabhängige Stichproben x_1, x_2,\dots, x_n und y_1, y_2, \dots, y_m jeweils aus normalverteilten Grundgesamtheiten mit den Erwartungswerten μx bzw. μy und unbekannter, aber gleicher Standardabweichung σ. Es soll die Nullhypothese H0x = μy gegen die zweiseitige Alternative H_1 \colon \mu_x \neq \mu_y getestet werden. Dazu wird mit den Stichprobenmittelwerten \bar x, \bar y, den Stichprobenvarianzen s_x^2, s_y^2 und der sogenannten gewichteten Varianz

s^2 = \frac{(n-1)s_x^2 + (m-1)s_y^2}{n+m-2}

die Prüfgröße

t = \sqrt{\frac{nm}{n+m}} \frac{\bar x - \bar y}{s}

berechnet. (Bei gleich großen Stichproben, also m = n, vereinfacht sich diese Formel zu t = \frac{\bar x - \bar y}{\sqrt{(s_x^2 + s_y^2)/n}}). Die Prüfgröße ist t-verteilt mit n + m − 2 Freiheitsgraden, also wird H0 zum Signifikanzniveau α abgelehnt, wenn |t| &amp;gt; t(1-\frac{\alpha}{2},\ n+m-2) gilt. Es können auch wieder einseitige Hypothesen getestet werden: Zum Beispiel wird die Nullhypothese \mu_x \leq \mu_y zugunsten der Alternative μx > μy abgelehnt, wenn t &amp;gt; t(1-\alpha,\ n+m-2) gilt.

Beispiel 3

Zwei Düngemittelsorten sollen verglichen werden. Dazu werden 10 Parzellen mit Sorte A und 15 Parzellen mit Sorte B gedüngt. Bei ersteren ergibt sich ein mittlerer Ernteertrag \bar x = 23{,}6 mit Stichprobenvarianz s_x^2 = 9{,}5 und bei den anderen Parzellen das Mittel \bar y = 20{,}1 mit Varianz s_y^2 = 8{,}9. Für die gewichtete Varianz berechnet man damit

s^2 = \frac{9\cdot 9{,}5 + 14 \cdot 8{,}9}{10+15-2} = 9{,}135.

Daraus erhält man die Prüfgröße

t = \sqrt{\frac{10 \cdot 15}{10+15}} \cdot \frac{23{,}6-20{,}1}{\sqrt{9{,}135}} = 2{,}837.

Dieser Wert ist größer als das 0,975-Quantil der t-Verteilung mit 10 + 15 − 2 = 23 Freiheitsgraden t(0{,}975;\ 23) = 2{,}069. Es kann also mit einer Konfidenz von 95 \% behauptet werden, dass ein Unterschied in der Wirkung der beiden Düngemittel besteht. Wegen \bar x &amp;gt; \bar y ist Sorte A besser.

Kompaktdarstellung

Zweistichproben t-Test für zwei unabhängige Stichproben
Voraussetzungen
  • X_i\, und Y_j\, unabhängig voneinander
  • \sigma_x=\sigma_y=\sigma\, unbekannt
  • X_i\sim N(\mu_x;\sigma)\, oder X_i\sim (\mu_x;\sigma)\, mit n > 30
  • Y_j\sim N(\mu_y;\sigma)\, oder Y_j\sim (\mu_y;\sigma)\, mit m > 30
Hypothesen H_0: \mu_x-\mu_y\leq\omega_0
H_1: \mu_x-\mu_y&amp;gt;\omega_0\,
(rechtsseitig)
H_0: \mu_x-\mu_y=\omega_0\,
H_1: \mu_x-\mu_y\neq\omega_0
(zweiseitig)
H_0: \mu_x-\mu_y\geq\omega_0
H_1: \mu_x-\mu_y&amp;lt;\omega_0\,
(linksseitig)
Teststatistik V=\frac{\bar{X}-\bar{Y}-\omega_0}{S_D} \sim t_{n+m-2}
Prüfwert v=\frac{(\bar{x}-\bar{y})-\omega_0}{s_D} mit \bar{x}=\frac{1}{n}\sum_{i=1}^{n} x_i,\bar{y}=\frac{1}{m}\sum_{i=1}^{m} y_i, s_X=\frac{1}{n-1}\sum_{i=1}^n (x_i-\bar{x})^2,

s_Y=\frac{1}{m-1}\sum_{j=1}^m (y_j-\bar{y})^2 und s_D=\sqrt{\frac{(n-1)s_X+(m-1)s_Y}{n+m-2}}

Annahmebereich H0 \{v|v\leq t_{1-\alpha;n+m-2}\}\, \{v|-t_{1-\alpha/2;n+m-2}\leq v \leq t_{1-\alpha/2;n+m-2}\}\, \{v|v\geq -t_{1-\alpha;n+m-2}\}\,
Annahmebereich H1 \{v|v&amp;gt;t_{1-\alpha;n+m-2}\}\, \{v|v&amp;lt;-t_{1-\alpha/2;n+m-2}\}\,
oder
\{v|v&amp;gt;t_{1-\alpha/2;n+m-2}\}\,
\{v|v&amp;lt;-t_{1-\alpha;n+m-2}\}\,

Testen der Voraussetzungen und Alternativen zum t-Test

Der t-Test wird, wie oben ausgeführt, zum Testen von Hypothesen über Erwartungswerte einer oder zweier Stichproben aus normalverteilten Grundgesamtheiten mit unbekannter Standardabweichung verwendet.

Weblinks


Wikimedia Foundation.

Игры ⚽ Нужно сделать НИР?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Test-driven development — (TDD ) is a software development technique consisting of short iterations where new test cases covering the desired improvement or new functionality are written first, then the production code necessary to pass the tests is implemented, and… …   Wikipedia

  • Test pilot — Test pilots are aviators who fly new and modified aircraft in specific maneuvers, allowing the results to be measured and the design to be evaluated. Test pilots may work for military organizations or private, (mostly aerospace) companies.… …   Wikipedia

  • Test logiciel — Test (informatique) En informatique, un test (anglicisme) désigne une procédure de vérification partielle d un système informatique. Le but en est de trouver un nombre maximum de comportements problématiques du logiciel, car il est impossible de… …   Wikipédia en Français

  • Test Card F — is a test card that was created by the BBC and used on television in the United Kingdom and in countries elsewhere in the world for more than four decades. Like other test cards, it was usually shown while no programmes were being broadcast, but… …   Wikipedia

  • Test the Nation — is a television programme, first broadcast in 2001 by BNN in The Netherlands where the concept is owned by [http://www.eyeworks.tv/ Eyeworks Holding] who license it to TV production companies around the world. how FormatThe format is designed to… …   Wikipedia

  • Test and tagging — is a generic name given to the process of visually inspecting and electrically testing in service electrical equipment for personal use and/or safety. Colloquially, it is also referred to as; tagging, test tag, test and tag, electrical tagging,… …   Wikipedia

  • Test Rorschach — Test de Rorschach La première planche parmi les dix du test de Rorschach Le test de Rorschach ou psychodiagnostik est un outil d évaluation psychologique de type projectif élaboré par le psychiatre et psychanalyste Hermann Rorschach en 1921. Il… …   Wikipédia en Français

  • Test de Charge — Test de performance Un test de performance ou benchmark est un test dont l objectif est de déterminer la performance d un système informatique. L acception la plus courante de ce terme est celle dans laquelle ces tests logiciels vont avoir pour… …   Wikipédia en Français

  • Test de Khi-2 — Test du χ²  Pour la loi de probabilité, voir Loi du χ². Densité du χ² en fonction du nombre de degrés de liberté Le test du χ² (prononcer …   Wikipédia en Français

  • Test de rorschach — La première planche parmi les dix du test de Rorschach Le test de Rorschach ou psychodiagnostik est un outil d évaluation psychologique de type projectif élaboré par le psychiatre et psychanalyste Hermann Rorschach en 1921. Il consiste en une… …   Wikipédia en Français

  • Test des taches d'encre — Test de Rorschach La première planche parmi les dix du test de Rorschach Le test de Rorschach ou psychodiagnostik est un outil d évaluation psychologique de type projectif élaboré par le psychiatre et psychanalyste Hermann Rorschach en 1921. Il… …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”