Wilcoxon-Mann-Whitney-Test

Wilcoxon-Mann-Whitney-Test

Der Wilcoxon-Mann-Whitney-Test (auch: „Mann-Whitney-U-Test“, „U-Test“,„Wilcoxon-Rangsummentest“) ist ein parameterfreier statistischer Test. Der U-Test ist ein Homogenitätstest. Er dient zur Überprüfung der Signifikanz der Übereinstimmung zweier Verteilungen, also ob zwei unabhängige Verteilungen A und B (zum Beispiel eine unbeeinflusste und eine beeinflusste) zu derselben Grundgesamtheit gehören. Der Test wurde von Henry Mann und Donald Whitney (1947) sowie Frank Wilcoxon (1945) entwickelt.[1] [2] Die zentrale Idee des Tests wurde bereits 1914 von dem deutschen Pädagogen Gustaf Deuchler verwendet.[3]

Inhaltsverzeichnis

Annahmen

  • Die Zufallsvariablen X und Y haben stetige Verteilungsfunktionen F bzw. G, die sich nur um eine Verschiebung a voneinander unterscheiden, das heißt:
G(x)=F(x-a)\,.
Sind die beiden Zufallsvariablen X und Y bis auf Verschiebung gleich, dann muss insbesondere σX = σY (Varianzhomogenität) gelten. D.h. bei Ablehnung der Varianzhomogenität durch den Bartlett-Test oder Levene-Test unterscheiden sich die beiden Zufallsvariablen X und Y nicht nur durch eine Verschiebung.
  • Es liegen unabhängige Stichproben X_1, \dots ,X_m von X und  Y_1, \dots ,Y_n von Y vor, die auch untereinander unabhängig sind.

Teststatistik

Für das Testen der Hypothesen des Wilcoxon-Mann-Whitney-Tests

H_0: a=0\text { vs. }H_1:a\neq 0

gibt es zwei Teststatistiken: die Mann-Whitney-U-Statistik U und die Wilcoxon-Rangsummenstatistik Wm,n. Aufgrund des Zusammenhangs zwischen den Teststatistiken

W_{m,n} = U + \frac{m(m+1)}{2}

sind der Wilcoxon-Rangsummentest und der Mann-Whitney-U-Test äquivalent.

Mann-Whitney-U-Statistik

Die Mann-Whitney-U-Teststatistik ist

U = \sum_{i=1}^m \sum_{j=1}^n S(X_i,Y_j),

worin S(X,Y) = 1 wenn Y < X und sonst 0. Abhängig von der Alternativhypothese wird die Nullhypothese abgelehnt für zu kleine oder zu große Werte von U. In dieser Form findet er sich bei Mann und Whitney und wird oft als Mann-Whitney-U-Test bezeichnet.

Exakte kritische Werte

Exakte kritische Werte liegen nur tabelliert vor und können für kleine Stichprobenumfänge der Tabelle unten entnommen werden (\alpha=5\% beim zweiseitigen Test und \alpha=2,5\% beim einseitigen Test).

Approximative kritische Werte

Für m > 3, n > 3 und m + n > 19 kann

U \approx N\left(\frac{m\,n}{2}; \frac{n\,m\,(n+m+1)}{12}\right)

durch die Normalverteilung approximiert werden.[4] Die kritischen Werte ergeben sich dann aus den kritischen Werten der approximativen Normalverteilung.

Wilcoxon-Rangsummenstatistik

Die Wilcoxon-Rangsummenstatistik ist

W_{m,n} = \sum_{i=1}^m R(X_i)

mit R(Xi) der Rang der i-ten X in der gepoolten, geordneten Stichprobe. In dieser Form trägt der Test häufig die Bezeichnung Wilcoxon-Rangsummentest.

Exakte kritische Werte

Die exakte Verteilung von Wm,n unter der Bedingung der Nullhypothese kann mittels kombinatorischer Überlegungen leicht gefunden werden. Allerdings steigt der Rechenaufwand für große Werte von m,n rasch an. Man kann die exakten kritischen Werte w zum Signifikanzniveau α mittels einer Rekursionsformel berechnen:

P(Wm − 1,n = w) = α (oder = α / 2 oder = 1 − α oder = 1 − α / 2)

Die Formel entsteht, wenn man konditioniert auf die Bedingung, ob der letzte Wert in der Anordnung ein X (...X) oder ein Y (...Y) ist.

P(W_{m,n}=w) = P(W_{m,n}=w|...X)P(...X) + P(W_{m,n}=w|...Y)P(...Y)= \,
= P(W_{m-1,n}=w-m-n)\frac{m}{m+n} + P(W_{m,n-1}=w)\frac{n}{m+n}

Approximative kritische Werte

Für m > 25 oder n > 25 (auch: m > 10 oder n > 10) kann die Teststatistik

W_{m,n} \approx N\left(\frac{m\,(n+m+1)}{2}; \frac{n\,m\,(n+m+1)}{12}\right)

durch die Normalverteilung approximiert werden.[5] [6] Die kritischen Werte ergeben sich dann aus den kritischen Werten der approximativen Normalverteilung.

Einseitige Hypothesen

Der Test kann auch für die einseitigen Hypothesen

H_0: a\leq 0\text { vs. }H_1:a>0 bzw.
H_0: a\geq 0\text { vs. }H_1:a<0

formuliert werden.

Abgeleitete Hypothesen

Der Test ist speziell interessant, weil bei Annahme bzw. Ablehnung der Null- oder Alternativhypothese auch die folgenden Null- und Alternativhypothesen (unter den oben genannten Voraussetzungen) angenommen bzw. abgelehnt werden können:

\!H_0: \mu_A=\mu_B \text { vs. }H_1:\mu_A\neq \mu_B,

d.h. die Mittelwerte der Verteilungen A und B unterscheiden sich.

H_0: \tilde{x}_A=\tilde{x}_B \text { vs. }H_1:\tilde{x}_A\neq \tilde{x}_B,

d.h. die Mediane der Verteilungen A und B unterscheiden sich.

Sind die Voraussetzungen bei der Hypothese über die Mediane nicht erfüllt, dann kann man auf den Median-Test ausweichen.

Beispiel

Aus den Daten der Allgemeinen Bevölkerungsumfrage der Sozialwissenschaften 2006 wurden zufällig 20 Personen gezogen und ihr Nettoeinkommen ermittelt:

Rang 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Nettoeinkommen 0 400 500 550 600 650 750 800 900 950 1000 1100 1200 1500 1600 1800 1900 2000 2200 3500
Geschlecht M W M W M W M M W W M M W M W M M M M M

Man hat zwei Stichproben vor sich, Stichprobe der Männer mit 13 Werten und Stichprobe der Frauen mit 7 Werten. Wir könnten nun prüfen, ob das Einkommen der Männer und Frauen gleich ist (zweiseitiger Test) oder das Einkommen der Frauen geringer (einseitiger Test) mit F die Verteilungsfunktion des Einkommens der Männer und G die Verteilungsfunktion des Einkommens der Frauen. Wir betrachten hier die Tests

Zweiseitiger Test Einseitiger Test
H_0: a=0\text { vs. }H_1:a\neq 0 H_0: a\geq 0\text { vs. }H_1:a<0

Zunächst wird aus beiden Zahlenreihen je eine Prüfgröße U gebildet:

U_1=n_1 \cdot n_2 +{n_1 \cdot (n_1+1) \over 2}-R_1
U_2=n_1 \cdot n_2 +{n_2 \cdot (n_2+1) \over 2}-R_2

n1 und n2 sind dabei die Anzahlen der Zahlenwerte pro Reihe, R1 und R2 sind die Rangzahlen der geordneten Reihen. Die Rangzahlen der Zahlenwerte werden für A und für B getrennt in zwei Spalten aufsummiert. Sind zwei oder mehrere Werte in beiden Datensätzen gleich, dann müssen in beiden Rangspalten jeweils die Mediane (bzw. arithmetischen Mittel) eingetragen werden. Für die Tests benötigt man das Minimum von U1 und U2, also min(U) = min(U1,U2).

Für unser Beispiel ergibt sich

RM = 151 und UM = 31.
RW = 59 und UW = 60 und
min(U) = 31.

Bei korrekter Berechnung muss gelten R1 + R2 = (n1 + n2)(n1 + n2 + 1) / 2 bzw. U1 + U2 = n1n2. Die Testgröße min(U) wird nun mit den kritischen Wert(en) verglichen. Das Beispiel ist so gewählt, dass sowohl ein Vergleich mit den exakten kritischen Werten als auch mit den approximativen Werten möglich ist.

Zweiseitiger Test

Exakte kritische Werte

Anhand der Tabelle ergibt sich mit n1 = 13 und n2 = 7 ein kritischer Wert von Ukrit = 20 für ein Signifikanzniveau vom \alpha=5\%. Abgelehnt wird die Nullhypothese, wenn min(U) < Ukrit ist; dies ist hier aber nicht der Fall.

Approximative kritische Werte

Da die Teststatistik U approximativ normal verteilt ist, folgt dass die

Z = \frac{U-\frac{n_1n_2}{2}}{\sqrt{\frac{n_1n_2(n_1+n_2+1)}{12}}} \approx N(0;1)

verteilt ist. Für ein Signifikanzniveau von \alpha=5\% ergibt sich der Nichtablehnungsbereich der Nullhypothese im zweiseitigen Test durch das 2,5%- bzw. 97,5%-Quantil der Standardnormalverteilung N(0;1) mit [ − 1,96; + 1,96]. Es ergibt sich jedoch z=\tfrac{31-45,5}{\sqrt{159,25}}\approx -1,15, d.h. der Prüfwert liegt innerhalb des Intervalls und die Nullhypothese kann nicht abgelehnt werden.

Einseitiger Test

Exakte kritische Werte

Anhand der Tabelle ergibt sich mit n1 = 13 und n2 = 7 ein kritischer Wert von Ukrit = 20 für ein Signifikanzniveau von \alpha=2,5\% (anderes Signifikanzniveau als beim zweiseitigen Test!). Abgelehnt wird die Nullhypothese, wenn min(U) < Ukrit ist; dies ist hier aber nicht der Fall.

Approximative kritische Werte

Für ein Signifikanzniveau von \alpha=5\% ergibt sich der kritische Wert als das 5%-Quantil der Standardnormalverteilung N(0;1) und der Nichtablehnungsbereich der Nullhypothese als [-1,65;+\infty[. Es ergibt sich jedoch z=\tfrac{31-45,5}{\sqrt{159,25}}\approx -1,15, d.h. die Nullhypothese kann nicht abgelehnt werden.

Tabelle der kritischen Werte der Mann-Whitney-U-Statistik

Die folgende Tabelle ist gültig für \alpha=5\% (einseitig) bzw. \alpha=2,5\% (zweiseitig) mit n_2\leq n_1. Ein - Eintrag bedeutet, dass die Nullhypothese in jedem Fall zu dem gegebenen Signifikanzniveau nicht abgelehnt werden kann.

n1
n2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
1 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 0 0
2 - - - - - - 0 0 0 0 1 1 1 1 1 2 2 2 2 3 3 3 3 3 4 4 4 4 5 5 5 5 5 6 6 6 6 7 7
3 - - 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 10 11 11 12 13 13 14 14 15 15 16 16 17 17 18 18
4 0 1 2 3 4 4 5 6 7 8 9 10 11 11 12 13 14 15 16 17 17 18 19 20 21 22 23 24 24 25 26 27 28 29 30 31 31
5 2 3 5 6 7 8 9 11 12 13 14 15 17 18 19 20 22 23 24 25 27 28 29 30 32 33 34 35 37 38 39 40 41 43 44 45
6 5 6 8 10 11 13 14 16 17 19 21 22 24 25 27 29 30 32 33 35 37 38 40 42 43 45 46 48 50 51 53 55 56 58 59
7 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74
8 13 15 17 19 22 24 26 29 31 34 36 38 41 43 45 48 50 53 55 57 60 62 65 67 69 72 74 77 79 81 84 86 89
9 17 20 23 26 28 31 34 37 39 42 45 48 50 53 56 59 62 64 67 70 73 76 78 81 84 87 89 92 95 98 101 103
10 23 26 29 33 36 39 42 45 48 52 55 58 61 64 67 71 74 77 80 83 87 90 93 96 99 103 106 109 112 115 119
11 30 33 37 40 44 47 51 55 58 62 65 69 73 76 80 83 87 90 94 98 101 105 108 112 116 119 123 127 130 134
12 37 41 45 49 53 57 61 65 69 73 77 81 85 89 93 97 101 105 109 113 117 121 125 129 133 137 141 145 149
13 45 50 54 59 63 67 72 76 80 85 89 94 98 102 107 111 116 120 125 129 133 138 142 147 151 156 160 165
14 55 59 64 69 74 78 83 88 93 98 102 107 112 117 122 127 131 136 141 146 151 156 161 165 170 175 180
15 64 70 75 80 85 90 96 101 106 111 117 122 127 132 138 143 148 153 159 164 169 174 180 185 190 196
16 75 81 86 92 98 103 109 115 120 126 132 137 143 149 154 160 166 171 177 183 188 194 200 206 211
17 87 93 99 105 111 117 123 129 135 141 147 154 160 166 172 178 184 190 196 202 209 215 221 227
18 99 106 112 119 125 132 138 145 151 158 164 171 177 184 190 197 203 210 216 223 230 236 243
19 113 119 126 133 140 147 154 161 168 175 182 189 196 203 210 217 224 231 238 245 252 258
20 127 134 141 149 156 163 171 178 186 193 200 208 215 222 230 237 245 252 259 267 274

Einzelnachweise

  1. Wilcoxon, Frank (1945): Individual Comparisons by Ranking Methods. Biometrics Bulletin 1: 80–83.
  2. Mann, Henry & Whitney, Donald (1947): On a test of whether one of two random variables is stochastically larger than the other. Annals of mathematical Statistics 18: 50-60 (online).
  3. William H. Kruskal, Historical Note on the Wilcoxon unpaired two-sample test, in: Journal of the American Statistical Association, Band 52, 1957, S. 356-360, JSTOR
  4. Rönz, B., Strohe, H.G. (Hrsg.): Lexikon Statistik. Gabler, Wiesbaden 1994, ISBN 3-409-19952-7
  5. Rinne, H. (2003), Taschenbuch der Statistik (3. Auflage), Verlag Harri Deutsch, S. 534
  6. Kotz, S., Read, C.B., Balakrishnan, N. (2003), Encyclopedia of Statistical Sciences, Wiley, Band ?, S. 208

Literatur

  • Herbert Büning, Götz Trenkler (1998), Nichtparametrische statistische Methoden, de Gruyter, ISBN 3-11-016351-9
  • Sidney Siegel: Nichtparametrische statistische Methoden. Fachbuchhandlung für Psychologie, Eschborn bei Frankfurt am Main, 2. Ausgabe, 1985)

Weblinks


Wikimedia Foundation.

Игры ⚽ Нужно сделать НИР?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Mann-Whitney-Test — Der Mann Whitney Test ( Mann Whitney U Test oder kurz U Test ) ist ein parameterfreier statistischer Test. Der U Test ist ein Homogenitätstest. Er dient zur Überprüfung der Signifikanz der Übereinstimmung zweier Verteilungen, also ob zwei… …   Deutsch Wikipedia

  • Mann-Whitney test — Mann Whitney U test, Mann Whitney Wilcoxon test rank sum t …   Medical dictionary

  • Mann–Whitney U — In statistics, the Mann–Whitney U test (also called the Mann–Whitney–Wilcoxon (MWW) or Wilcoxon rank sum test) is a non parametric statistical hypothesis test for assessing whether one of two samples of independent observations tends to have… …   Wikipedia

  • Mann-Whitney U — In statistics, the Mann Whitney U test (also called the Mann Whitney Wilcoxon (MWW), Wilcoxon rank sum test, or Wilcoxon Mann Whitney test) is a non parametric test for assessing whether two samples of observations come from the same distribution …   Wikipedia

  • Mann-Whitney — Der Mann Whitney Test ( Mann Whitney U Test oder kurz U Test ) ist ein parameterfreier statistischer Test. Der U Test ist ein Homogenitätstest. Er dient zur Überprüfung der Signifikanz der Übereinstimmung zweier Verteilungen, also ob zwei… …   Deutsch Wikipedia

  • Mann-Whitney-U-Test — Der Mann Whitney Test ( Mann Whitney U Test oder kurz U Test ) ist ein parameterfreier statistischer Test. Der U Test ist ein Homogenitätstest. Er dient zur Überprüfung der Signifikanz der Übereinstimmung zweier Verteilungen, also ob zwei… …   Deutsch Wikipedia

  • Wilcoxon signed-rank test — The Wilcoxon signed rank test is a non parametric alternative to the paired Student s t test for the case of two related samples or repeated measurements on a single sample. The test is named for Frank Wilcoxon (1892 ndash;1965) who, in a single… …   Wikipedia

  • Prueba U de Mann-Whitney — En estadística la prueba U de Mann Whitney (también llamada de Mann Whitney Wilcoxon, prueba de suma de rangos Wilcoxon, o prueba de Wilcoxon Mann Whitney) es una prueba no paramétrica aplicada a dos muestras independientes. Es, de hecho, la… …   Wikipedia Español

  • Median test — In statistics, Mood s median test is a special case of Pearson s chi squared test. It is a nonparametric test that tests the null hypothesis that the medians of the populations from which two samples are drawn are identical. The data in each… …   Wikipedia

  • Wilcoxon — is a surname, and may refer to: * Henry Wilcoxon, an actor * Frank Wilcoxon, chemist and statistician, inventor of two non parametric tests for statistical significance: ** The Wilcoxon signed rank test ** The Wilcoxon rank sum test (also known… …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”