Binomialtest

Binomialtest: Ein Binomialtest ist ein statistischer Test, bei dem die Testgröße binomialverteilt ist. Er wird verwendet, um Hypothesen über Merkmale zu prüfen, die genau zwei Ausprägungen annehmen können (dichotome Merkmale).

Inhaltsverzeichnis

1 Hypothesen und Teststatistik

2 Signifikanzniveau und kritische Werte

3 Approximation der Verteilung der Teststatistik

4 Beispiele

5 Anmerkungen

6 Literatur

Hypothesen und Teststatistik

Mit dem Binomialtest können drei Hypothesenpaare (ein zweiseitiges und zwei einseitige) getestet werden:

Test $H 0$ $H 1$

zweiseitiger $p = p_0\,$ $p \neq p_0$

rechtsseitig $p\leq p_0$ $p > <span class=$ p_0\," border="0">

linksseitig $p\geq p_0$ $p < p_0\,$

Die Teststatistik $X$ : Anzahl erfolgreicher Versuche ist $X\sim B(n;p_0)\,$ verteilt mit $B(i|p_0,n)=\binom{n}{i} p_0^i (1-p_0)^{n-i}$ .

Signifikanzniveau und kritische Werte

Teststatistik für den Binomialtest, die roten Balken gehören zum kritischen Bereich.

Da die Teststatistik diskret verteilt ist, kann das vorgebene Signifikanzniveau $\alpha\,$ in der Regel nicht eingehalten werden. Daher wird gefordert, die kritischen Werte so zu wählen, dass für ein möglichst großes exaktes Signifikanzniveau $α e x .$ gilt $\alpha_{ex.}\leq\alpha$ .

Für den zweiseitigen Test müssen daher kritischen Werte $c 1$ und $c 2$ so bestimmt werden, dass gilt

$\sum_{i=0}^{c_1} B(i|p_0,n) \leq \alpha/2$ und

$\sum_{i=c_2}^n B(i|p_0,n) \leq \alpha/2$ .

Das exakte Signifikanzniveau ergibt sich als $\alpha_{ex.}=\sum_{i=0}^{c_1} B(i|p_0,n)+\sum_{i=c_2}^n B(i|p_0,n)$ . Für die beiden einseitigen Tests wird analog verfahren.

Test Kritische Werte Kritischer Bereich Grenze(n)

zweiseitig $c 1 + 1$ und $c 2 - 1$ $\{0,\ldots,c_1\} \cup \{c_2,\ldots,n\}$

rechtsseitig $c - 1$ $\{c,\ldots,n\}$ c = kleinster Wert, für den $\sum_{i=c}^n B(i| p_0,n)= \alpha_{ex.} \leq \alpha$

linksseitig $c + 1$ $\{0,\ldots,c\}$ c = größter Wert, für den $\sum_{i=0}^{c} B(i| p_0,n)= \alpha_{ex.} \leq \alpha$

Approximation der Verteilung der Teststatistik

Approximation einer Binomialverteilung mit einer Normalverteilung.

Die binomial verteilte Teststatistik kann mit einer anderen Verteilung approximiert werden. Die dafür notwendigen Approximationsbedingungen können je nach Literaturquelle variieren.

Verteilung Parameter Approximationsbedingungen

Poisson-Verteilung $X\approx Po(\lambda)$ $λ = n p 0$ $n > 10$ und $p 0 < 0, 05$

Normalverteilung $X\approx N(\mu, \sigma^2)$ $μ = n p 0$ und $σ 2 = n p 0 (1 - p 0)$ $n p 0 (1 - p 0) > 9$

Im Fall der Approximation der Normalverteilung kann statt der Teststatistik $X$ auch gleich die Teststatistik $\Pi=X/n\approx N\left(p_0, \tfrac{p_0(1-p_o)}{n}\right)$ betrachtet werden.

Beispiele

Hellseh-Fähigkeit versus Raten der Farbe einer zufällig gewählten Spielkarte (aus statistischer Test): Bei n-maliger Durchführung erreicht eine Testperson X Treffer (Farbe richtig genannt). Ab welcher Trefferzahl X sollte man die Nullhypothese $H_0: p = \tfrac 14$ verwerfen und die Alternativhypothese $H_1: p>\<span class=$ tfrac 14" border="0"> (also tatsächliche Hellseh-Fähigkeit) für plausibler halten?^[1] Wenn $H 0$ richtig ist, dann ist X binomialverteilt mit Parametern n und 1/4. Die Wahrscheinlichkeit k oder mehr Treffer durch Raten zu erzielen, beträgt dann $\sum_{i=k}^n B(i|\tfrac{1}{4},n)$ . Bei einem Signifikanzniveau von 1% verwirft man die Nullhypothese, falls $X \geq c$ . Hier ist c der kleinste Wert, für den $\sum_{i=c}^n B(i|\tfrac{1}{4},n) \leq 1%$ ist.

In einer Multiple-Choice-Prüfung gibt es 50 Fragen und jeweils 4 Antwortmöglichkeiten, von denen jeweils genau eine richtig ist. Dies führt zur gleichen Fragestellung wie das Spielkartenbeispiel. Die Nullhypothese ist, dass ein Prüfling die Antwort zufällig ankreuzt ( $H 0 : p = 1 / 4$ ), und die Alternativhypothese ist $H 1 : p > 1 / 4$ .^[2] Diese Modellierung setzt allerdings voraus, dass es keine Möglichkeit gibt, gewisse Antworten als unplausibel auszuschließen, siehe dazu den Abschnitt über die Auswertung von Multiple-Choice-Tests.

Eine Urne enthält 10 Kugeln, die weiß oder schwarz sein können. Man möchte die Nullhypothese testen, dass alle Kugeln weiß sind (also $H 0 : p = 0$ ) und zieht n Kugeln mit Zurücklegen. Die Alternativhypothese ist $H 1 : p > 0$ und man verwirft die Nullhypothese, sobald eine oder mehr schwarze Kugeln gezogen worden sind: der Ablehnungsbereich ist $\{1,\ldots,n\}$ . Der Fehler 1. Art ist gleich 0, da unter der Nullhypothese keine schwarze Kugel gezogen werden kann. Der Ablehnungsbereich ist also offenbar unabhängig vom Signifikanzniveau. Der Fehler 2. Art ist maximal, falls genau eine schwarze Kugel vorhanden ist, und beträgt dann $0, 9 n$ .

(Gegenbeispiel) Gleiche Situation, aber Ziehen ohne Zurücklegen (es werden maximal n=10 Kugeln gezogen). Wie im vorigen Fall verschwindet der Fehler 1. Art. Der Fehler 2. Art bestimmt sich aber aus einer hypergeometrischen Verteilung. Er ist maximal für eine schwarze Kugel und beträgt dann $(10 - n) / n$ . Es handelt sich also nicht um einen Binomialtest.

Anmerkungen

↑ Wir betrachten für p den Parameterbereich [1/4,1], um zu erreichen, dass Nullhypothese und Alternativhypothese den gesamten Parameterbereich überdecken. Bei absichtlichem Nennen einer falschen Farbe könnte man zwar auch auf Hellseh-Fähigkeiten schließen, aber wir nehmen an, dass die Testperson eine möglichst hohe Trefferzahl erzielen will.

↑ Wie im Spielkartenbeispiel nehmen wir an, dass der Parameterbereich [1/4,1] ist (Prüfling möchte eine möglichst hohe Trefferzahl erreichen).

Literatur

Henze, Norbert: Stochastik für Einsteiger. 8. Auflage. Vieweg, 2010.

Krengel, Ulrich: Einführung in die Wahrscheinlichkeitstheorie und Statistik. 8. Auflage. Vieweg, 2005.

Rinne, Horst: Taschenbuch der Statistik. 3. Auflage. Harri Deutsch, 2003.

Kategorie:
Stochastik

Test	$H 0$	$H 1$
zweiseitiger	$p = p_0\,$	$p \neq p_0$
rechtsseitig	$p\leq p_0$	$p > <span class=$ p_0\," border="0">
linksseitig	$p\geq p_0$	$p < p_0\,$

Test	Kritische Werte	Kritischer Bereich	Grenze(n)
zweiseitig	$c 1 + 1$ und $c 2 - 1$	$\{0,\ldots,c_1\} \cup \{c_2,\ldots,n\}$
rechtsseitig	$c - 1$	$\{c,\ldots,n\}$	c = kleinster Wert, für den $\sum_{i=c}^n B(i\| p_0,n)= \alpha_{ex.} \leq \alpha$
linksseitig	$c + 1$	$\{0,\ldots,c\}$	c = größter Wert, für den $\sum_{i=0}^{c} B(i\| p_0,n)= \alpha_{ex.} \leq \alpha$

Verteilung	Parameter	Approximationsbedingungen
Poisson-Verteilung $X\approx Po(\lambda)$	$λ = n p 0$	$n > 10$ und $p 0 < 0, 05$
Normalverteilung $X\approx N(\mu, \sigma^2)$	$μ = n p 0$ und $σ 2 = n p 0 (1 - p 0)$	$n p 0 (1 - p 0) > 9$

Игры ⚽ Нужно сделать НИР?

Schlagen Sie auch in anderen Wörterbüchern nach:

Statistischer Test — Ein statistischer Test dient in der mathematischen Statistik dazu, anhand vorliegender Beobachtungen eine begründete Entscheidung über die Gültigkeit oder Ungültigkeit einer Hypothese zu treffen. Formal ist ein Test also eine mathematische… … Deutsch Wikipedia
Vorzeichentest — Der Vorzeichentest oder Zeichentest[1][2] ist ein nichtparametrischer statistischer Test. Der Vorzeichentest ist ein Binomialtest.[3][4] Mit seiner Hilfe lassen sich Verteilungshypothesen in Ein und Zweistichprobenproblemen testen. Der… … Deutsch Wikipedia
Meta-Analyse — Forest plot zur grafischen Veranschaulichung der Ergebnisse einer Metaanalyse Eine Metaanalyse ist eine Zusammenfassung von Primär Untersuchungen, die mit quantitativen, statistischen Mitteln arbeitet. Der Begriff wurde 1976 vom Psychologen Gene… … Deutsch Wikipedia
Metaanalyse — Forest plot zur grafischen Veranschaulichung der Ergebnisse einer Metaanalyse Eine Metaanalyse ist eine Zusammenfassung von Primär Untersuchungen zu Metadaten, die mit quantitativen, statistischen Mitteln arbeitet. Der Begriff wurde 1976 vom… … Deutsch Wikipedia
Metastudie — Forest plot zur grafischen Veranschaulichung der Ergebnisse einer Metaanalyse Eine Metaanalyse ist eine Zusammenfassung von Primär Untersuchungen, die mit quantitativen, statistischen Mitteln arbeitet. Der Begriff wurde 1976 vom Psychologen Gene… … Deutsch Wikipedia
Metastudien — Forest plot zur grafischen Veranschaulichung der Ergebnisse einer Metaanalyse Eine Metaanalyse ist eine Zusammenfassung von Primär Untersuchungen, die mit quantitativen, statistischen Mitteln arbeitet. Der Begriff wurde 1976 vom Psychologen Gene… … Deutsch Wikipedia
Parameterfreie Statistik — Der Zweig der Statistik, der als parameterfreie Statistik bekannt ist, beschäftigt sich mit parameterfreien statistischen Modellen und parameterfreien statistischen Tests. Andere gebräuchliche Bezeichnungen sind nicht parametrische Statistik oder … Deutsch Wikipedia

Academic dictionaries and encyclopedias

Binomialtest

Inhaltsverzeichnis

Hypothesen und Teststatistik

Signifikanzniveau und kritische Werte

Approximation der Verteilung der Teststatistik

Beispiele

Anmerkungen

Literatur

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Academic dictionaries and encyclopedias

Deutsch Wikipedia

Binomialtest

Inhaltsverzeichnis

Hypothesen und Teststatistik

Signifikanzniveau und kritische Werte

Approximation der Verteilung der Teststatistik

Beispiele

Anmerkungen

Literatur

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Direct link