F-Test

F-Test

Als F-Test wird eine Gruppe von Tests bezeichnet, bei denen die Teststatistik unter der Nullhypothese einer F-Verteilung folgt. Häufig ist mit F-Test ein statistischer Test gemeint, mithilfe dessen mit einer gewissen Konfidenz entschieden werden kann, ob zwei Stichproben aus unterschiedlichen, normalverteilten Populationen sich hinsichtlich ihrer Varianz wesentlich unterscheiden. Er dient damit unter anderem zur generellen Überprüfung von Unterschieden zwischen zwei statistischen Populationen.

Der Test geht zurück auf einen der bekanntesten Statistiker, Ronald Aylmer Fisher (1890–1962). Als Prüfwert des F-Tests wird der F-Wert berechnet, welcher unter der Nullhypothese einer F-Verteilung (s. auch Chi-Quadrat-Verteilung) mit n1 und n2 Freiheitsgraden gehorcht.

Inhaltsverzeichnis

F-Test für zwei Stichproben

Die Voraussetzung für den F-Test sind: die Stichprobenvariablen sind normal verteilt mit X_{i1}\sim N(\mu_1,\sigma_1^2) und X_{i2}\sim N(\mu_2,\sigma_2^2) und sie sind unabhängig innerhalb und zwischen den beiden Stichproben. Die Stichprobenumfänge n1 und n2 können ungleich sein.

Dann lauten beim F-Test zweier Stichproben die Hypothesen:

Nullhypothese: H_0: \sigma_1^2 = \sigma_2^2
Alternativhypothese: H_1: \sigma_1^2 \neq \sigma_2^2

Formal berechnet sich der F-Wert der Stichprobe dann als der Quotient der geschätzten Varianzen der beiden Stichproben:

F_{\mathrm{Stichprobe}} =\frac{S^2_1}{S^2_2}=\frac{\tfrac{1}{n_1-1}\sum_{i=1}^{n_1} (X_{i1}-\bar{X}_1)^2}{\tfrac{1}{n_2-1}\sum_{i=1}^{n_2} (X_{i2}-\bar{X}_2)^2}.

Wird die Untersuchung unter einer einseitigen Alternativhypothese betrachtet, schreibt man den größeren Varianzwert in den Zähler. Die Varianzen werden dabei jeweils durch die Varianzen der Messwerte der entsprechenden Stichprobe geschätzt.

Unter Annahme der Nullhypothese ist die Verteilung des F-Wertes durch die F-Verteilung mit den sich aus der Stichprobengröße ergebenden Freiheitsgraden gegeben. Dadurch kann die Wahrscheinlichkeit bestimmt werden, dass bei gleichen Varianzen ein F-Wert entsteht, der mindestens so sehr von dem Erwartungswert 1 der F-Verteilung abweicht, wie es der aus der Stichprobe erhaltene tut. Dies geschieht am einfachsten unter Zuhilfenahme einer F-Wert-Tabelle.

Bei einer Wahrscheinlichkeit von weniger als 5% wird die Nullhypothese üblicherweise abgelehnt. Es handelt sich dabei aber nur um eine gängige Konvention, siehe auch den Artikel Statistische Signifikanz. Allerdings können aus der erhaltenen Wahrscheinlichkeit P(F | H0) keine direkten Rückschlüsse auf die Wahrscheinlichkeit der Gültigkeit der Alternativhypothese gezogen werden.

Wenn sich zwei Stichproben schon in ihren Varianzen unterscheiden, dann unterscheiden sie sich allgemein natürlich auch.

Beispiel

Ein Unternehmen will vor dem Kauf einer neuen Anwendung prüfen, welche von zwei konkurrierenden Anwendungen die bessere ist. Unter anderem wird die Zufriedenheit der Benutzer gemessen. Die Ergebnisse eines Zufriedenheitsfragebogens zeigen bei den 120 Benutzern der Anwendung A eine Varianz von 95. Die Werte der 100 Benutzer der Anwendung B haben eine Varianz von 80. Die Präferenz des Unternehmens geht eindeutig zur Anwendung A, aus diesem Grunde wird eine einseitige Überprüfung vorgeschlagen:

F_{Stichprobe}=\frac{S_A^2}{S_B^2}=\frac{95}{80}= 1.188

Dieser F-Wert kommt unter der Nullhypothese aus eine F(119;99)-Verteilung. Der P-Wert des Stichprobenergebnis ist also:

P(F_{(119{,}99)} \geq 1{,}188) = 18,8%.

Die Nullhypothese wird also nicht abgelehnt.

F-Test für mehrere Stichprobenvergleiche

Der einfaktoriellen Varianzanalyse liegt ebenfalls der F-Test zugrunde. Hier werden die Treatment- und Fehler-Varianzen einander gegenübergestellt.

F-Test des Bestimmtheitsmaßes eines Regressionsansatzes

Hier wird getestet, ob das Bestimmtheitsmaß des Regressionsansatzes Null ist. Wenn diese Hypothese abgelehnt wird, kann man vermuten, dass das gewählte Regressionsmodell einen Erklärungswert für den Regressand y besitzt. Beispielsweise wird getestet, ob mehrere Variablen zusammen einen signifikanten Einfluss auf den Regressanden haben. Es kann somit auch der Fall eintreten, dass der t-Test zu den üblichen Signifikanzniveaus keinen signifikanten Einfluss der einzelnen Regressoren festgestellt hat, der F-Test allerdings die Signifikanz des Gesamtmodells feststellt. Die Wahrscheinlichkeit, dass F-Test und t-Test unterschiedliche Ergebnisse liefern, steigt mit der Anzahl der Freiheitsgrade.

Einordnung

Literatur

  • Bortz, J. (1977): Statistik für Sozialwissenschaftler, Springer: Berlin.
  • Sachs, L. (2003): Angewandte Statistik – Anwendung statistischer Methoden, Springer: Berlin

Wikimedia Foundation.

Игры ⚽ Нужен реферат?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Test-driven development — (TDD ) is a software development technique consisting of short iterations where new test cases covering the desired improvement or new functionality are written first, then the production code necessary to pass the tests is implemented, and… …   Wikipedia

  • Test pilot — Test pilots are aviators who fly new and modified aircraft in specific maneuvers, allowing the results to be measured and the design to be evaluated. Test pilots may work for military organizations or private, (mostly aerospace) companies.… …   Wikipedia

  • Test logiciel — Test (informatique) En informatique, un test (anglicisme) désigne une procédure de vérification partielle d un système informatique. Le but en est de trouver un nombre maximum de comportements problématiques du logiciel, car il est impossible de… …   Wikipédia en Français

  • Test Card F — is a test card that was created by the BBC and used on television in the United Kingdom and in countries elsewhere in the world for more than four decades. Like other test cards, it was usually shown while no programmes were being broadcast, but… …   Wikipedia

  • Test the Nation — is a television programme, first broadcast in 2001 by BNN in The Netherlands where the concept is owned by [http://www.eyeworks.tv/ Eyeworks Holding] who license it to TV production companies around the world. how FormatThe format is designed to… …   Wikipedia

  • Test and tagging — is a generic name given to the process of visually inspecting and electrically testing in service electrical equipment for personal use and/or safety. Colloquially, it is also referred to as; tagging, test tag, test and tag, electrical tagging,… …   Wikipedia

  • Test Rorschach — Test de Rorschach La première planche parmi les dix du test de Rorschach Le test de Rorschach ou psychodiagnostik est un outil d évaluation psychologique de type projectif élaboré par le psychiatre et psychanalyste Hermann Rorschach en 1921. Il… …   Wikipédia en Français

  • Test de Charge — Test de performance Un test de performance ou benchmark est un test dont l objectif est de déterminer la performance d un système informatique. L acception la plus courante de ce terme est celle dans laquelle ces tests logiciels vont avoir pour… …   Wikipédia en Français

  • Test de Khi-2 — Test du χ²  Pour la loi de probabilité, voir Loi du χ². Densité du χ² en fonction du nombre de degrés de liberté Le test du χ² (prononcer …   Wikipédia en Français

  • Test de rorschach — La première planche parmi les dix du test de Rorschach Le test de Rorschach ou psychodiagnostik est un outil d évaluation psychologique de type projectif élaboré par le psychiatre et psychanalyste Hermann Rorschach en 1921. Il consiste en une… …   Wikipédia en Français

  • Test des taches d'encre — Test de Rorschach La première planche parmi les dix du test de Rorschach Le test de Rorschach ou psychodiagnostik est un outil d évaluation psychologique de type projectif élaboré par le psychiatre et psychanalyste Hermann Rorschach en 1921. Il… …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”