Runs-Test

Runs-Test

Der Run- oder Runs-Test (auch Wald-Wolfowitz-Test, nach Abraham Wald und Jacob Wolfowitz, Iterationstest oder Geary-Test) ist ein nichtparametrischer Test auf Zufälligkeit einer Folge. Konzeptionell wird von einer dichotomen Grundgesamtheit, also einem Urnenmodell mit zwei Sorten Kugeln, ausgegangen. Es sind n viele Kugeln entnommen worden. Es soll die Hypothese geprüft werden, dass die Entnahme zufällig erfolgt ist.


Inhaltsverzeichnis

Vorgehensweise

Es wurden einer dichotomen Grundgesamtheit n Kugeln entnommen. Die Ergebnisse liegen in ihrer chronologischen Abfolge vor. Es werden nun alle benachbarten Ergebnisse gleicher Ausprägung zu einem Lauf oder Run zusammengefasst. Wenn die Folge tatsächlich zufällig ist, sollten nicht zu wenig Runs vorliegen, aber auch nicht zu viele.

Es wird die Hypothese aufgestellt: Die Entnahme erfolgte zufällig.

Für die Festlegung der Zahl der Runs, bei der die Hypothese abgelehnt wird, wird die Verteilung der Runs benötigt: Es seien n1 die Zahl der Kugeln erster Sorte und n2 = n - n1 der zweiten Sorte; es sei r die Zahl der Runs. Nach dem Symmetrieprinzip ist die Wahrscheinlichkeit für jede beliebige Folge der Kugeln bei zufälliger Entnahme gleich groß. Es gibt insgesamt

\frac{(n_1 + n_2)!}{n_1! \cdot n_2!}

Möglichkeiten der Entnahme.

Bezüglich der Verteilung der Zahl der Runs unterscheidet man die Fälle:

1. Die Zahl der Runs r ist geradzahlig:

Es liegen q= \frac {r}{2} Runs der Kugeln der ersten Sorte und q= \frac {r}{2} Runs der Kugeln der zweiten Sorte vor. Die Wahrscheinlichkeit, dass genau r Runs eingetreten sind, ist dann
 P(R=2q) = \frac { 2 {{n_1-1} \choose {q-1}} {{n_2-1} \choose {q-1}}} {{{n_1+n_2} \choose n_1}}

2. Die Zahl der Runs r ist ungeradzahlig:

Es liegen  q = \frac {r+1}{2} Runs der Kugeln der ersten Sorte und  q = \frac {r-1}{2} Runs der Kugeln der zweiten Sorte vor oder der umgekehrte Fall. Die Wahrscheinlichkeit, dass genau r Runs eingetreten sind, berechnet sich dann als Summe aus diesen beiden Möglichkeiten
 P(R=2q+1)= \frac { {n_1-1 \choose q} {n_2-1 \choose q-1 } + {n_1-1 \choose q-1} {n_2-1 \choose q }} {{n_1+n_2 \choose n_1}}

Ist r zu klein oder zu groß, führt das zur Ablehnung der Nullhypothese. Bei einem Signifikanzniveau von alpha wird H0 abgelehnt, wenn für die Prüfgröße r gilt:

r \le r(\frac {\alpha}{2}) oder r \ge r(1 - \frac {\alpha}{2})

mit r(p)als Quantil der Verteilung von R an der Stelle p, wobei hier das Prinzip des konservativen Testens angewendet wird. Da die Berechnung der kritischen Werte von r für die Ablehnung der Hypothese umständlich ist, bedient man sich häufig einer Tabelle.

Einfaches Beispiel

Für eine Podiumsdiskussion mit zwei politischen Parteien wurden die Sprecher angeblich zufällig ermittelt. Es wurde ausgelost, dass von der Partei Supi 4 Vertreter und von der Partei Toll 5 Vertreter in der folgenden Reihe sprechen dürfen:

S S  T  S  T T T  S  T

Ein Vertreter von Toll beschwerte sich, dass S vorgezogen würde. Es wurde ein Run-Test vorgenommen:

Es ist n1 = 4 und n2 = 5. Man erhielt r = 6 Runs.

Nach der Tabelle des Run-Testes wird H0 abgelehnt, wenn r ≤ 2 oder r ≥ 9 ist. Also liegt die Prüfgröße r = 6 im Nichtablehnungsbereich; man kann nach den Kriterien des Run-Testes davon ausgehen, dass die Reihenfolge der Sprecher zufällig ist.

Ergänzungen

Parameter der Verteilung von R

Der Erwartungswert von R ist


\operatorname{E}(R) = \frac{2 n_1 n_2}{n} + 1

und die Varianz


\operatorname{Var}(R) = \frac{2 n_1 n_2 (2 n_1 n_2 - n)}{n^2(n_1 + n_2 - 1)}
.

Grundgesamtheit mit mehr als zwei Ausprägungen des Merkmals

Liegt eine endliche Folge reeller Zahlen (xi) eines metrischen Merkmals vor, wird die Folge dichotomisiert: Man bestimmt zunächst den Median z der Folge. Werte xi < z werden dann als Kugeln der ersten Sorte, Werte xi > z als Kugeln der zweiten Sorte interpretiert. Die entstandene dichotome Folge kann dann wieder auf Zufälligkeit getestet werden (siehe Beispiel unten).

Liegt eine nichtnumerische Symbolsequenz mit mehr als zwei Ausprägungen vor, muss zunächst eine numerische Reihe erzeugt werden, wobei hier das Problem bestehen kann, dass die Symbole nicht geordnet werden können.

Normalapproximation

Für Stichprobenumfänge n1,n2 > 20 ist die Zahl der Runs R annähernd normalverteilt mit Erwartungswert und Varianz wie oben. Man erhält die standardisierte Prüfgröße

z = \frac{r - (\frac{2 n_1 n_2}{n} + 1 )}{\sqrt{\frac{2 n_1 n_2 (2 n_1 n_2 - n)}{n^2(n_1 + n_2 - 1)}}}

Die Hypothese wird abgelehnt, wenn

z &amp;lt; -z(1 - \frac {\alpha}{2}) oder z &amp;gt; z(1 - \frac {\alpha}{2})

mit z(1 - \frac {\alpha}{2}) als Quantil der Standardnormalverteilung für die Wahrscheinlichkeit 1 - \frac {\alpha}{2} .

Anwendungen

Der Runtest kann angewendet werden, um Stationarität bzw. Nicht-Korrelation in einer Zeitreihe oder anderen Sequenz zu überprüfen, vor allem wenn die Verteilung des Merkmals unbekannt ist. Die Nullhypothese ist hier, dass aufeinanderfolgende Werte unkorreliert sind.

Der Run-Test kann mit dem Chi-Quadrat-Test kombiniert werden, da beide Prüfgrößen asymptotisch unabhängig voneinander sind.


Beispiel für ein metrisches Merkmal

Es liegt die Folge

13	 3	14	14	1	14	3	8	14	17	9	14	13	2	16	1	3	12	13	14

vor. Sie wird mit dem Median z = 13 dichotomisiert. Für die erste Ausprägung wird + gesetzt, für die zweite Ausprägung -.

0	-10	1	1	-12	1	-10	-5	1	4	-4	1	0	-11	3	-12	-10	-1	0	1
+	-	+	+	-	+	-	-	+	+	-	+	+	-	+	-	-	-	+	+

Man erhält bei n1 = 11 (+) und n2 = 9 (-) r = 13 Runs. R ist annähernd normalverteilt mit dem Erwartungswert

\operatorname{E}(R) = \frac{(2\cdot11\cdot9)}{20} + 1 = 10,9

und der Varianz

\operatorname{Var}(R)= \frac{2 \cdot 11 \cdot 9 \cdot (2 \cdot 11 \cdot 9 - 20)}{20^2 \cdot 19}= 4,6.

Die Prüfgröße z errechnet sich dann als

\frac{13 - 10,9}{\sqrt{4,6}}= 1,0

Bei einem Signifikanzniveau von 0,05 wird H0 abgelehnt, wenn |z| > 1,96. Dies ist nicht der Fall.

Entscheidung: Die Hypothese wird nicht abgelehnt. Die Elemente der Stichprobe sind vermutlich zufällig entnommen worden.

Literatur

  • James V. Bradley: Distribution-Free Statistical Tests, 1968, Chapter 12, ISBN 0132162598
  • Herbert Büning, Götz Trenkler: Nichtparametrische statistische Methoden, 1999, Kapitel 4.5, ISBN 3-11-016351-9

Siehe auch

Autokorrelation, Zufallszahlengenerator, Pseudozufallszahlen, Trend, Median, Varianz

Weblinks


Wikimedia Foundation.

Игры ⚽ Нужно сделать НИР?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Runs Test — A statistical procedure that examines whether a string of data is occurring randomly given a specific distribution. The runs test analyzes the occurrence of similar events that are separated by events that are different. For example, a list of… …   Investment dictionary

  • Wald-Wolfowitz runs test — The runs test (also called Wald Wolfowitz test) is a non parametric test that checks a randomness hypothesis for a two valued data sequence. More precisely, it can be used to test the hypothesis that the elements of the sequence are mutually… …   Wikipedia

  • test run — UK US noun [countable] [singular test run plural test runs] a process designed to test whether a machine or system works well Thesaurus: general words for tests and testingsynonym * * …   Useful english dictionary

  • test run — test runs N COUNT If you give a machine or system a test run, you try it out to see if it will work properly when it is actually in use. Japan s space ambitions have had a set back after the failure of an engine in a test run... The vote was seen …   English dictionary

  • test your metal — test your strength or will or skill, run the gauntlet    If your team is losing by three runs, the bases are loaded, and you are the final batter that will test your metal! …   English idioms

  • Test matches in England in 2005 — There were seven Test matches played in England in 2005. The first two were against Bangladesh, the bottom ranked test team. England started this series ranked second in the LG ICC Test Championship table.The remaining tests were played for the… …   Wikipedia

  • Test cricket — A Test match between South Africa and England in January 2005. The men wearing black trousers on the far right are the umpires. Test cricket is played in traditional white clothes and with a red ball. Test cricket is the longest form of the sport …   Wikipedia

  • Test cricket — Un match de Test cricket en 2006. Le Test cricket est une forme de cricket disputée au niveau international. C est la forme la plus longue de jeu : un test match est limité à cinq jours de durée. Seules dix sélections nationales sont… …   Wikipédia en Français

  • Test automation — Compare with Manual testing. Test automation is the use of software to control the execution of tests, the comparison of actual outcomes to predicted outcomes, the setting up of test preconditions, and other test control and test reporting… …   Wikipedia

  • Test Anything Protocol — The Test Anything Protocol (TAP) is a protocol to allow communication betwen unit tests and a test harness. It allows individual tests (TAP producers) to communicate test results to the testing harness in a language agnostic way. Originally… …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”