Wilcoxon-Mann-Whitney-Test

Der Wilcoxon-Mann-Whitney-Test (auch: „Mann-Whitney-U-Test“, „U-Test“,„Wilcoxon-Rangsummentest“) ist ein parameterfreier statistischer Test. Der U-Test ist ein Homogenitätstest. Er dient zur Überprüfung der Signifikanz der Übereinstimmung zweier Verteilungen, also ob zwei unabhängige Verteilungen A und B (zum Beispiel eine unbeeinflusste und eine beeinflusste) zu derselben Grundgesamtheit gehören. Der Test wurde von Henry Mann und Donald Whitney (1947) sowie Frank Wilcoxon (1945) entwickelt.^[1] ^[2] Die zentrale Idee des Tests wurde bereits 1914 von dem deutschen Pädagogen Gustaf Deuchler verwendet.^[3]

Annahmen

Die Zufallsvariablen $X$ und $Y$ haben stetige Verteilungsfunktionen $F$ bzw. $G$ , die sich nur um eine Verschiebung $a$ voneinander unterscheiden, das heißt:

$G(x)=F(x-a)\,$ .

Sind die beiden Zufallsvariablen

X

und

Y

bis auf Verschiebung gleich, dann muss insbesondere

σ X = σ Y

(Varianzhomogenität) gelten. D.h. bei Ablehnung der Varianzhomogenität durch den Bartlett-Test oder Levene-Test unterscheiden sich die beiden Zufallsvariablen X und Y nicht nur durch eine Verschiebung.

Es liegen unabhängige Stichproben $X_1, \dots ,X_m$ von $X$ und $Y_1, \dots ,Y_n$ von $Y$ vor, die auch untereinander unabhängig sind.

Teststatistik

Für das Testen der Hypothesen des Wilcoxon-Mann-Whitney-Tests

$H_0: a=0\text { vs. }H_1:a\neq 0$

gibt es zwei Teststatistiken: die Mann-Whitney-U-Statistik $U$ und die Wilcoxon-Rangsummenstatistik $W m, n$ . Aufgrund des Zusammenhangs zwischen den Teststatistiken

$W_{m,n} = U + \frac{m(m+1)}{2}$

sind der Wilcoxon-Rangsummentest und der Mann-Whitney-U-Test äquivalent.

Mann-Whitney-U-Statistik

Die Mann-Whitney-U-Teststatistik ist

$U = \sum_{i=1}^m \sum_{j=1}^n S(X_i,Y_j)$ ,

worin S(X,Y) = 1 wenn Y < X und sonst 0. Abhängig von der Alternativhypothese wird die Nullhypothese abgelehnt für zu kleine oder zu große Werte von $U$ . In dieser Form findet er sich bei Mann und Whitney und wird oft als Mann-Whitney-U-Test bezeichnet.

Exakte kritische Werte

Exakte kritische Werte liegen nur tabelliert vor und können für kleine Stichprobenumfänge der Tabelle unten entnommen werden ( $\alpha=5\%$ beim zweiseitigen Test und $\alpha=2,5\%$ beim einseitigen Test).

Approximative kritische Werte

Für $m > 3$ , $n > 3$ und $m + n > 19$ kann

$U \approx N\left(\frac{m\,n}{2}; \frac{n\,m\,(n+m+1)}{12}\right)$

durch die Normalverteilung approximiert werden.^[4] Die kritischen Werte ergeben sich dann aus den kritischen Werten der approximativen Normalverteilung.

Wilcoxon-Rangsummenstatistik

Die Wilcoxon-Rangsummenstatistik ist

$W_{m,n} = \sum_{i=1}^m R(X_i)$

mit $R (X i)$ der Rang der i-ten X in der gepoolten, geordneten Stichprobe. In dieser Form trägt der Test häufig die Bezeichnung Wilcoxon-Rangsummentest.

Exakte kritische Werte

Die exakte Verteilung von $W m, n$ unter der Bedingung der Nullhypothese kann mittels kombinatorischer Überlegungen leicht gefunden werden. Allerdings steigt der Rechenaufwand für große Werte von $m, n$ rasch an. Man kann die exakten kritischen Werte $w$ zum Signifikanzniveau $α$ mittels einer Rekursionsformel berechnen:

P (W m - 1, n = w) = α

(oder

= α / 2

oder

= 1 - α

oder

= 1 - α / 2

)

Die Formel entsteht, wenn man konditioniert auf die Bedingung, ob der letzte Wert in der Anordnung ein X (...X) oder ein Y (...Y) ist.

$P(W_{m,n}=w) = P(W_{m,n}=w|...X)P(...X) + P(W_{m,n}=w|...Y)P(...Y)= \,$

$= P(W_{m-1,n}=w-m-n)\frac{m}{m+n} + P(W_{m,n-1}=w)\frac{n}{m+n}$

Approximative kritische Werte

Für $m > 25$ oder $n > 25$ (auch: $m > 10$ oder $n > 10$ ) kann die Teststatistik

$W_{m,n} \approx N\left(\frac{m\,(n+m+1)}{2}; \frac{n\,m\,(n+m+1)}{12}\right)$

durch die Normalverteilung approximiert werden.^[5] ^[6] Die kritischen Werte ergeben sich dann aus den kritischen Werten der approximativen Normalverteilung.

Einseitige Hypothesen

Der Test kann auch für die einseitigen Hypothesen

$H_0: a\leq 0\text { vs. }H_1:a>0$ bzw.

$H_0: a\geq 0\text { vs. }H_1:a<0$

formuliert werden.

Abgeleitete Hypothesen

Der Test ist speziell interessant, weil bei Annahme bzw. Ablehnung der Null- oder Alternativhypothese auch die folgenden Null- und Alternativhypothesen (unter den oben genannten Voraussetzungen) angenommen bzw. abgelehnt werden können:

$\!H_0: \mu_A=\mu_B \text { vs. }H_1:\mu_A\neq \mu_B$ ,

d.h. die Mittelwerte der Verteilungen A und B unterscheiden sich.

$H_0: \tilde{x}_A=\tilde{x}_B \text { vs. }H_1:\tilde{x}_A\neq \tilde{x}_B$ ,

d.h. die Mediane der Verteilungen A und B unterscheiden sich.

Sind die Voraussetzungen bei der Hypothese über die Mediane nicht erfüllt, dann kann man auf den Median-Test ausweichen.

Beispiel

Aus den Daten der Allgemeinen Bevölkerungsumfrage der Sozialwissenschaften 2006 wurden zufällig 20 Personen gezogen und ihr Nettoeinkommen ermittelt:

Rang	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20
Nettoeinkommen	0	400	500	550	600	650	750	800	900	950	1000	1100	1200	1500	1600	1800	1900	2000	2200	3500
Geschlecht	M	W	M	W	M	W	M	M	W	W	M	M	W	M	W	M	M	M	M	M

Man hat zwei Stichproben vor sich, Stichprobe der Männer mit $13$ Werten und Stichprobe der Frauen mit $7$ Werten. Wir könnten nun prüfen, ob das Einkommen der Männer und Frauen gleich ist (zweiseitiger Test) oder das Einkommen der Frauen geringer (einseitiger Test) mit $F$ die Verteilungsfunktion des Einkommens der Männer und $G$ die Verteilungsfunktion des Einkommens der Frauen. Wir betrachten hier die Tests

Zweiseitiger Test	Einseitiger Test
$H_0: a=0\text { vs. }H_1:a\neq 0$	$H_0: a\geq 0\text { vs. }H_1:a<0$

Zunächst wird aus beiden Zahlenreihen je eine Prüfgröße $U$ gebildet:

$U_1=n_1 \cdot n_2 +{n_1 \cdot (n_1+1) \over 2}-R_1$

$U_2=n_1 \cdot n_2 +{n_2 \cdot (n_2+1) \over 2}-R_2$

$n 1$ und $n 2$ sind dabei die Anzahlen der Zahlenwerte pro Reihe, $R 1$ und $R 2$ sind die Rangzahlen der geordneten Reihen. Die Rangzahlen der Zahlenwerte werden für $A$ und für $B$ getrennt in zwei Spalten aufsummiert. Sind zwei oder mehrere Werte in beiden Datensätzen gleich, dann müssen in beiden Rangspalten jeweils die Mediane (bzw. arithmetischen Mittel) eingetragen werden. Für die Tests benötigt man das Minimum von $U 1$ und $U 2$ , also $min(U) = min(U 1, U 2)$ .

Für unser Beispiel ergibt sich

R M = 151

und

U M = 31

R W = 59

und

U W = 60

und

min(U) = 31

Bei korrekter Berechnung muss gelten $R 1 + R 2 = (n 1 + n 2)(n 1 + n 2 + 1) / 2$ bzw. $U 1 + U 2 = n 1 n 2$ . Die Testgröße $min(U)$ wird nun mit den kritischen Wert(en) verglichen. Das Beispiel ist so gewählt, dass sowohl ein Vergleich mit den exakten kritischen Werten als auch mit den approximativen Werten möglich ist.

Zweiseitiger Test

Exakte kritische Werte

Anhand der Tabelle ergibt sich mit $n 1 = 13$ und $n 2 = 7$ ein kritischer Wert von $U k r i t = 20$ für ein Signifikanzniveau vom $\alpha=5\%$ . Abgelehnt wird die Nullhypothese, wenn $min(U) < U k r i t$ ist; dies ist hier aber nicht der Fall.

Approximative kritische Werte

Da die Teststatistik $U$ approximativ normal verteilt ist, folgt dass die

$Z = \frac{U-\frac{n_1n_2}{2}}{\sqrt{\frac{n_1n_2(n_1+n_2+1)}{12}}} \approx N(0;1)$

verteilt ist. Für ein Signifikanzniveau von $\alpha=5\%$ ergibt sich der Nichtablehnungsbereich der Nullhypothese im zweiseitigen Test durch das 2,5%- bzw. 97,5%-Quantil der Standardnormalverteilung $N (0;1)$ mit $[ - 1,96; + 1,96]$ . Es ergibt sich jedoch $z=\tfrac{31-45,5}{\sqrt{159,25}}\approx -1,15$ , d.h. der Prüfwert liegt innerhalb des Intervalls und die Nullhypothese kann nicht abgelehnt werden.

Einseitiger Test

Exakte kritische Werte

Anhand der Tabelle ergibt sich mit $n 1 = 13$ und $n 2 = 7$ ein kritischer Wert von $U k r i t = 20$ für ein Signifikanzniveau von $\alpha=2,5\%$ (anderes Signifikanzniveau als beim zweiseitigen Test!). Abgelehnt wird die Nullhypothese, wenn $min(U) < U k r i t$ ist; dies ist hier aber nicht der Fall.

Approximative kritische Werte

Für ein Signifikanzniveau von $\alpha=5\%$ ergibt sich der kritische Wert als das 5%-Quantil der Standardnormalverteilung $N (0;1)$ und der Nichtablehnungsbereich der Nullhypothese als $[-1,65;+\infty[$ . Es ergibt sich jedoch $z=\tfrac{31-45,5}{\sqrt{159,25}}\approx -1,15$ , d.h. die Nullhypothese kann nicht abgelehnt werden.

Tabelle der kritischen Werte der Mann-Whitney-U-Statistik

Die folgende Tabelle ist gültig für $\alpha=5\%$ (einseitig) bzw. $\alpha=2,5\%$ (zweiseitig) mit $n_2\leq n_1$ . Ein - Eintrag bedeutet, dass die Nullhypothese in jedem Fall zu dem gegebenen Signifikanzniveau nicht abgelehnt werden kann.

	$n 1$
$n 2$	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20	21	22	23	24	25	26	27	28	29	30	31	32	33	34	35	36	37	38	39	40
1	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	0	0
2		-	-	-	-	-	-	0	0	0	0	1	1	1	1	1	2	2	2	2	3	3	3	3	3	4	4	4	4	5	5	5	5	5	6	6	6	6	7	7
3			-	-	0	1	1	2	2	3	3	4	4	5	5	6	6	7	7	8	8	9	9	10	10	11	11	12	13	13	14	14	15	15	16	16	17	17	18	18
4				0	1	2	3	4	4	5	6	7	8	9	10	11	11	12	13	14	15	16	17	17	18	19	20	21	22	23	24	24	25	26	27	28	29	30	31	31
5					2	3	5	6	7	8	9	11	12	13	14	15	17	18	19	20	22	23	24	25	27	28	29	30	32	33	34	35	37	38	39	40	41	43	44	45
6						5	6	8	10	11	13	14	16	17	19	21	22	24	25	27	29	30	32	33	35	37	38	40	42	43	45	46	48	50	51	53	55	56	58	59
7							8	10	12	14	16	18	20	22	24	26	28	30	32	34	36	38	40	42	44	46	48	50	52	54	56	58	60	62	64	66	68	70	72	74
8								13	15	17	19	22	24	26	29	31	34	36	38	41	43	45	48	50	53	55	57	60	62	65	67	69	72	74	77	79	81	84	86	89
9									17	20	23	26	28	31	34	37	39	42	45	48	50	53	56	59	62	64	67	70	73	76	78	81	84	87	89	92	95	98	101	103
10										23	26	29	33	36	39	42	45	48	52	55	58	61	64	67	71	74	77	80	83	87	90	93	96	99	103	106	109	112	115	119
11											30	33	37	40	44	47	51	55	58	62	65	69	73	76	80	83	87	90	94	98	101	105	108	112	116	119	123	127	130	134
12												37	41	45	49	53	57	61	65	69	73	77	81	85	89	93	97	101	105	109	113	117	121	125	129	133	137	141	145	149
13													45	50	54	59	63	67	72	76	80	85	89	94	98	102	107	111	116	120	125	129	133	138	142	147	151	156	160	165
14														55	59	64	69	74	78	83	88	93	98	102	107	112	117	122	127	131	136	141	146	151	156	161	165	170	175	180
15															64	70	75	80	85	90	96	101	106	111	117	122	127	132	138	143	148	153	159	164	169	174	180	185	190	196
16																75	81	86	92	98	103	109	115	120	126	132	137	143	149	154	160	166	171	177	183	188	194	200	206	211
17																	87	93	99	105	111	117	123	129	135	141	147	154	160	166	172	178	184	190	196	202	209	215	221	227
18																		99	106	112	119	125	132	138	145	151	158	164	171	177	184	190	197	203	210	216	223	230	236	243
19																			113	119	126	133	140	147	154	161	168	175	182	189	196	203	210	217	224	231	238	245	252	258
20																				127	134	141	149	156	163	171	178	186	193	200	208	215	222	230	237	245	252	259	267	274

Einzelnachweise

↑ Wilcoxon, Frank (1945): Individual Comparisons by Ranking Methods. Biometrics Bulletin 1: 80–83.
↑ Mann, Henry & Whitney, Donald (1947): On a test of whether one of two random variables is stochastically larger than the other. Annals of mathematical Statistics 18: 50-60 (online).
↑ William H. Kruskal, Historical Note on the Wilcoxon unpaired two-sample test, in: Journal of the American Statistical Association, Band 52, 1957, S. 356-360, JSTOR
↑ Rönz, B., Strohe, H.G. (Hrsg.): Lexikon Statistik. Gabler, Wiesbaden 1994, ISBN 3-409-19952-7
↑ Rinne, H. (2003), Taschenbuch der Statistik (3. Auflage), Verlag Harri Deutsch, S. 534
↑ Kotz, S., Read, C.B., Balakrishnan, N. (2003), Encyclopedia of Statistical Sciences, Wiley, Band ?, S. 208

Literatur

Herbert Büning, Götz Trenkler (1998), Nichtparametrische statistische Methoden, de Gruyter, ISBN 3-11-016351-9
Sidney Siegel: Nichtparametrische statistische Methoden. Fachbuchhandlung für Psychologie, Eschborn bei Frankfurt am Main, 2. Ausgabe, 1985)

Weblinks

Kategorie:

Nicht-Parametrischer Test

Wikimedia Foundation.

Игры ⚽ Нужно сделать НИР?

Schlagen Sie auch in anderen Wörterbüchern nach:

Mann-Whitney-Test — Der Mann Whitney Test ( Mann Whitney U Test oder kurz U Test ) ist ein parameterfreier statistischer Test. Der U Test ist ein Homogenitätstest. Er dient zur Überprüfung der Signifikanz der Übereinstimmung zweier Verteilungen, also ob zwei… … Deutsch Wikipedia
Mann-Whitney test — Mann Whitney U test, Mann Whitney Wilcoxon test rank sum t … Medical dictionary
Mann–Whitney U — In statistics, the Mann–Whitney U test (also called the Mann–Whitney–Wilcoxon (MWW) or Wilcoxon rank sum test) is a non parametric statistical hypothesis test for assessing whether one of two samples of independent observations tends to have… … Wikipedia
Mann-Whitney U — In statistics, the Mann Whitney U test (also called the Mann Whitney Wilcoxon (MWW), Wilcoxon rank sum test, or Wilcoxon Mann Whitney test) is a non parametric test for assessing whether two samples of observations come from the same distribution … Wikipedia
Mann-Whitney — Der Mann Whitney Test ( Mann Whitney U Test oder kurz U Test ) ist ein parameterfreier statistischer Test. Der U Test ist ein Homogenitätstest. Er dient zur Überprüfung der Signifikanz der Übereinstimmung zweier Verteilungen, also ob zwei… … Deutsch Wikipedia
Mann-Whitney-U-Test — Der Mann Whitney Test ( Mann Whitney U Test oder kurz U Test ) ist ein parameterfreier statistischer Test. Der U Test ist ein Homogenitätstest. Er dient zur Überprüfung der Signifikanz der Übereinstimmung zweier Verteilungen, also ob zwei… … Deutsch Wikipedia
Wilcoxon signed-rank test — The Wilcoxon signed rank test is a non parametric alternative to the paired Student s t test for the case of two related samples or repeated measurements on a single sample. The test is named for Frank Wilcoxon (1892 ndash;1965) who, in a single… … Wikipedia
Prueba U de Mann-Whitney — En estadística la prueba U de Mann Whitney (también llamada de Mann Whitney Wilcoxon, prueba de suma de rangos Wilcoxon, o prueba de Wilcoxon Mann Whitney) es una prueba no paramétrica aplicada a dos muestras independientes. Es, de hecho, la… … Wikipedia Español
Median test — In statistics, Mood s median test is a special case of Pearson s chi squared test. It is a nonparametric test that tests the null hypothesis that the medians of the populations from which two samples are drawn are identical. The data in each… … Wikipedia
Wilcoxon — is a surname, and may refer to: * Henry Wilcoxon, an actor * Frank Wilcoxon, chemist and statistician, inventor of two non parametric tests for statistical significance: ** The Wilcoxon signed rank test ** The Wilcoxon rank sum test (also known… … Wikipedia

Academic dictionaries and encyclopedias

Wilcoxon-Mann-Whitney-Test

Inhaltsverzeichnis

Annahmen