Behrens-Fisher-Problem

Das Behrens-Fisher-Problem ist eine Problemstellung der mathematischen Statistik, deren exakte Lösungen nachgewiesenermaßen unerwünschte Eigenschaften haben, weswegen man Approximationen bevorzugt.

Gesucht ist ein nichtrandomisierter ähnlicher Test der Nullhypothese gleicher Erwartungswerte, $H_0\colon\,\mu_1=\mu_2$ , zweier normalverteilter Grundgesamtheiten, deren Varianzen $\sigma_1^2$ und $\sigma_2^2$ unbekannt sind und nicht als gleich vorausgesetzt werden. Die Ähnlichkeit des Tests besagt dabei, dass die Nullhypothese bei deren Gültigkeit exakt mit Wahrscheinlichkeit $\,\alpha$ , dem vorgegebenen Signifikanzniveau, abgelehnt wird, wie groß und unterschiedlich auch immer die unbekannten Varianzen $\sigma_1^2$ und $\sigma_2^2$ sind. Aus Gründen der Macht des Tests bezieht man sich auf folgende „Behrens-Fisher“-Testgröße:

$T = {\bar x_1 - \bar x_2 \over \sqrt{s_1^2/n_1 + s_2^2/n_2}},$

wobei $\bar x_1$ und $\bar x_2$ die Mittelwerte und $\,s_1$ und $\,s_2$ die Standardabweichungen der beiden Stichproben sind; mit $\,n_1$ und $\,n_2$ wird deren jeweiliger Umfang bezeichnet.

Das Behrens-Fisher-Problem verallgemeinert den t-Test für zwei unabhängige Stichproben; dieser setzt nämlich voraus, dass die Varianzen beider Grundgesamtheiten übereinstimmen.

Inhaltsverzeichnis

1 Entstehung
2 Nichtexistenz einer wünschenswerten Lösung
3 Beste Approximation mittels eines nichtkonvergenten Reihenansatzes
4 Die Approximation im sogenannten Welch-Test
5 Literatur
6 Weblinks

Entstehung

Ronald Fisher führte 1935 die „fiducial inference“ zur Lösung diese Problems ein. Er bezog sich hierbei auf eine frühere Arbeit von W. V. Behrens aus dem Jahr 1929. Behrens und Fisher schlugen vor, die Verteilung der oben erwähnten Testgröße $\,T$ zu bestimmen.

Fisher approximierte diese Verteilung, indem er die Zufälligkeit der relativen Größe $[(s_1^2/n_1) / (s_1^2/n_1 + s_2^2/n_2)]^{1/2}$ ignorierte. Folglich hatte der so entstandene Test nicht die gewünschte Eigenschaft, die Nullhypothese mit Wahrscheinlichkeit $\,\alpha$ abzulehnen, wenn immer sie zutrifft. Das rief eine Kontroverse hervor, die gemeinhin als das Behrens-Fisher-Problem bekannt ist.

Nichtexistenz einer wünschenswerten Lösung

Linnik (1968, Theorem 8.3.1) hat gezeigt, dass es für die Grenze zwischen Annahme und Ablehnbereich der eingangs genannten Behrens-Fisher-Testgröße $\,T$ keine stetige Funktion gibt, die nur vom Quotienten der empirischen Varianzen der Mittelwerte, $(s_1^2/n_1)/(s_2^2/n_2)$ , (und natürlich Konstanten wie $\,\nu_1=n_1-1$ , $\,\nu_2=n_2-1$ und dem Signifikanzniveau $\,\alpha$ ) abhängt. Die Grenze zwischen Annahme- und Ablehnbereich jeder exakten Lösung des Behrens-Fisher-Problems ist notwendigerweise unstetig in diesem Quotienten. Mehr noch: Eine exakte Lösung fordert, dass der Ablehnbereich der Behrens-Fisher-Testgröße Umgebungen von Punkten enthält, für die $\bar x_1 = \bar x_2$ ist, eine untragbare Eigenschaft (Linnik, 1968). Dass sich Linnik anstatt auf $\,T$ und den genannten Varianzquotienten auf $(\bar x_1-\bar x_2)/s_2$ und $\,s_1/s_2$ bezieht, ist nicht wesentlich, da mittels letzterer das Problem in äquivalenter Weise beschrieben wird.

Beste Approximation mittels eines nichtkonvergenten Reihenansatzes

Eine Arbeit, die Linnik (1968) nie erwähnt hat, ist die von B. L. Welch (1947). Schon zwei Jahrzehnte früher hat nämlich Welch (1947), der, wie Fisher, am University College London tätig war, einen Ansatz zur exakten Lösung des Behrens-Fisher-Problems gemacht, der die Grenze zwischen Annahme- und Ablehnbereich der Testgröße $\,T$ als stetige Funktion in $(s_1^2/n_1)/(s_2^2/n_2)$ beschreiben würde. Welch (1947) gibt für gegebenes Signifikanzniveau $\,\alpha$ diese Grenze zunächst für die empirische Mittelwertsdifferenz $\bar d = \bar x_1-\bar x_2$ als Funktion $\,h$ von den empirischen Varianzen $s_1^2$ und $s_2^2$ in Form einer partiellen Differentialgleichung unendlicher Ordnung exakt an. Auch beschreibt er die Methode, wie man die Lösung mittels dreier Taylor-Entwicklungen beliebig genau annähert. Die Reihenentwicklung dieser Funktion $\,h$ lässt erkennen, dass sie in ein Produkt aus der geschätzten Standardabweichung der Mittelwertsdifferenz, $s_{\bar d} = (s_1^2/n_1 + s_2^2/n_2)^{1/2}$ , und einer nur vom Varianzquotienten $(s_1^2/n_1)/(s_2^2/n_2)$ (und Konstanten) abhängigen Funktion faktorisiert werden kann. Die entsprechend der Testgröße $\,T$ standardisierte Funktion $h^*=h/s_{\bar d}$ hängt also – wie gewünscht – nur vom Varianzquotienten $(s_1^2/n_1)/(s_2^2/n_2)$ ab. Konvergierte nun Welch's Reihenansatz gleichmäßig, sodass die Funktion unendlich oft differenzierbar, also auch stetig wäre, würde dies Linniks Beweis widersprechen, demgemäß es eine solche Funktion nicht gibt. Es folgt, dass Welchs Ansatz nicht gleichmäßig konvergieren kann. Graphische Darstellungen der Funktion $\,h^*$ bis zu verschieden weit entwickelten Ordnungen, bei sehr kleinen wie auch etwas größeren $\,\nu_1$ , $\,\nu_2$ und $\,\alpha$ lassen diese Schlussfolgerung durchaus glaubwürdig erscheinen, obwohl für nicht allzu kleine $\,\nu_1$ , $\,\nu_2$ und $\,\alpha$ die Ergebnisse hinsichtlich der Glätte von $\,h^*$ und der Genauigkeit der numerisch errechneten Irrtumswahrscheinlichkeiten erster Art beachtlich sind. Aspins (1948) Weiterentwicklung des Reihenansatzes von Welch bis zur vierten Potenz in Kehrwerten von Freiheitsgraden liefert die mit Abstand genaueste Approximation, es sei denn $\,\nu_1$ , $\,\nu_2$ und $\,\alpha$ seien viel kleiner als üblich. Der so entstandene Welch-Aspin-Test ist in Bachmaier (2000) ausführlich und in deutscher Sprache beschrieben.

Die Approximation im sogenannten Welch-Test

Approximative Ansätze zur Lösung des Behrens-Fisher-Problems gibt es mehrere. Eine der am meisten benutzten Approximationen (beispielsweise in Microsoft Excel) stammt ebenfalls von Welch. Man bezeichnet den auf dieser Welch-Approximation beruhenden Test auch als Welch-Test.

Die Varianz der Mittelwertsdifferenz $\bar d =\bar x_1 - \bar x_2$ ist $s_{\bar d}^2 = s_1^2/n_1 + s_2^2/n_2$ . Die Verteilung von $s_{\bar d}^2$ approximierte Welch (1938) durch diejenige Pearson-Kurve vom Typ III (eine skalierte Chi-Quadrat-Verteilung), deren erste beide Momente (Erwartungswert und Varianz) mit denen von $s_{\bar d}^2$ übereinstimmen. Dies trifft bei folgender Anzahl $\,\nu$ an Freiheitsgraden (degrees of freedom, d.f.) mit im Allgemeinen nichtganzzahligen Werten zu:

$\nu = {(\gamma_1 + \gamma_2)^2 \over \gamma_1^2/(n_1-1) + \gamma_2^2/(n_2-1)} \qquad{\rm mit~~}\gamma_i = \sigma_i^2/n_i.$

Bei Gültigkeit der Nullhypothese gleicher Erwartungswerte, $H_0\colon\,\mu_1=\mu_2$ , könnte die Verteilung der eingangs erwähnten Behrens-Fisher-Testgröße $\,T$ , die ein wenig vom Quotienten der Standardabweichungen, $σ 1 / σ 2$ , abhängt, durch Students t-Verteilung mit diesen $\,\nu$ Freiheitsgraden approximiert werden. Nun enthält dieses $\,\nu$ aber auch die Varianzen $\sigma_i^2$ der Grundgesamtheiten, welche unbekannt sind. Es hat sich schließlich folgende Schätzung der Freiheitsgrade durchgesetzt, die einfach auf der Ersetzung der Grundgesamtheits-Varianzen durch die Stichproben-Varianzen beruht:

$\hat\nu = {(g_1 + g_2)^2 \over g_1^2/(n_1-1) + g_2^2/(n_2-1)} \qquad{\rm mit~~}g_i = s_i^2/n_i.$

Durch diese Schätzung wird aber $\hat\nu$ eine Zufallsvariable. Eine t-Verteilung mit einer zufälligen Anzahl von Freiheitsgraden gibt es aber nicht. Das ist jedoch kein Hinderungsgrund, die Testgröße $\,T$ mit entsprechenden Quantilswerten der t-Verteilung mit den geschätzten $\hat\nu$ Freiheitsgraden zu vergleichen. Auf diese Weise entsteht eine unendlich oft differenzierbare von den empirischen Varianzen $s_i^2$ abhängige Funktion als Grenze zwischen Annahme- und Ablehnbereich der Teststgröße $\,T$ .

Diese Methode hält das Signifikanzniveau nicht exakt, ist aber nicht allzu weit entfernt davon. Nur wenn die Grundgesamtheits-Varianzen, $\sigma_1^2$ und $\sigma_2^2$ , identisch sind oder im Falle eher kleiner Stichprobenumfänge wenigstens als nahezu identisch angenommen werden können, ist der gewöhnliche t-Test von Student die bessere Wahl.

Literatur

A. A. Aspin: An Examination and Further Development of a Formula Arising in the Problem of Comparing Two Mean Values. Biometrika 35, 1948, S. 88–96.
M. Bachmaier: Das Behrens-Fisher-Problem. In: M. Bachmaier: Klassische, robuste und nichtparametrische Bartlett-Tests und robuste Varianzanalyse bei heterogenen Skalenparametern. Shaker, Aachen 2000, S. 231–245.
W. V. Behrens: Ein Beitrag zur Fehlerberechnung bei wenigen Beobachtungen Landwirtschaftliche Jahrbücher 68, 1929, S. 807–837.
Juri Wladimirowitsch Linnik: Statistical problems with nuisance parameters. American Mathematical Society, Providence, Rhode Island, 1968.
B. L. Welch: The Significance of the Difference between Two Means When the Population Variances Are Unequal. Biometrika 29, 1938, S. 350–362.
B. L. Welch: The Generalization of Student's Problem When Several Different Population Variances Are Involved. Biometrika 34, 1947, S. 28–35.

Weblinks

„Distributional Property of the Generalized p-value for the Behrens-Fisher Problem with Applications to Multiple Testing“, von Kam-Wah Tsui and Shijie Tang, University of Wisconsin, 31. Oktober 2005 (PDF-Datei; 192 kB)
„A simple conservative and robust solution of the Behrens-Fisher problem“, von Harold Ruben, The Indian Journal of Statistics Series A, Volume 64, Teil 1, S. 139–155, erschienen 2002

Kategorie:

Parametrischer Test

Wikimedia Foundation.

Игры ⚽ Нужно сделать НИР?

Schlagen Sie auch in anderen Wörterbüchern nach:

Behrens–Fisher problem — In statistics, the Behrens–Fisher problem is the problem of interval estimation and hypothesis testing concerning the difference between the means of two normally distributed populations when the variances of the two populations are not assumed… … Wikipedia
Behrens-Fisher-Problem — Behrens Fịsher Problem [ ʃ ; nach W. U. Behrens, * 1903, ✝ 1963, und R. A. Fisher], Statistik: das Auffinden eines exakten (nicht asymptotischen) statistischen Prüfverfahrens für den Vergleich zweier Mittelwerte aus Normalverteilungen mit… … Universal-Lexikon
Behrens — is a surname and may refer to:* Heidi Behrens Benedict * Herbert Behrens * Hildegard Behrens (b. 1941), opera singer * Isidor Behrens * Paul Behrens (1893 ndash; 1984), German clockmaker * Peter Behrens (1868 ndash; 1940), German architect * Sam… … Wikipedia
Ronald Fisher — Ronald Aylmer Fisher Sir Ronald Aylmer Fisher (* 17. Februar 1890 in London, England; † 29. Juli 1962 in Adelaide, Australien) war einer der bedeutendsten Theoretischen Biologen, Genetiker, Evolutionstheoretiker und … Deutsch Wikipedia
Ronald Fisher — R. A. Fisher Born 17 February 1890(1890 02 17) East Finchley, London … Wikipedia
Ronald Aylmer Fisher — Sir Ronald Aylmer Fisher (* 17. Februar 1890 in London, England; † 29. Juli 1962 in Adelaide, Australien) war einer der bedeutendsten Theoretischen Biologen, Genetiker, Evolutionstheoretiker und … Deutsch Wikipedia
Welch-Test — Das Behrens Fisher Problem ist eine Problemstellung der mathematischen Statistik, deren exakte Lösungen nachgewiesenermaßen unerwünschte Eigenschaften haben, weswegen man Approximationen bevorzugt. Gesucht ist ein nichtrandomisierter ähnlicher… … Deutsch Wikipedia
List of statistics topics — Please add any Wikipedia articles related to statistics that are not already on this list.The Related changes link in the margin of this page (below search) leads to a list of the most recent changes to the articles listed below. To see the most… … Wikipedia
Unsolved problems in statistics — There are many longstanding unsolved problems in mathematics for which a solution has still not yet been found. The unsolved problems in statistics are generally of a different flavor; according to John Tukey, difficulties in identifying problems … Wikipedia
Normal distribution — This article is about the univariate normal distribution. For normally distributed vectors, see Multivariate normal distribution. Probability density function The red line is the standard normal distribution Cumulative distribution function … Wikipedia

Academic dictionaries and encyclopedias

Behrens-Fisher-Problem

Inhaltsverzeichnis

Entstehung

Nichtexistenz einer wünschenswerten Lösung

Beste Approximation mittels eines nichtkonvergenten Reihenansatzes

Die Approximation im sogenannten Welch-Test

Literatur

Weblinks

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Academic dictionaries and encyclopedias

Deutsch Wikipedia

Behrens-Fisher-Problem

Inhaltsverzeichnis

Entstehung

Nichtexistenz einer wünschenswerten Lösung

Beste Approximation mittels eines nichtkonvergenten Reihenansatzes

Die Approximation im sogenannten Welch-Test

Literatur

Weblinks

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Direct link