Scree-Test

Scree-Test

Der Scree-Test, auch Ellenbogenkriterium genannt, ist ein graphisches Verfahren zur Bestimmung der optimalen Faktorenzahl bei der Faktorenanalyse. Das Kriterium wurde in den 1960er Jahren von dem US-amerikanischen Psychologen Raymond Bernard Cattell entwickelt und findet aufgrund seiner Einfachheit bis heute Verwendung.

Inhaltsverzeichnis

Hintergrund zur Faktorenauswahl

Bei der Faktorenanalyse sollen nur diejenigen Faktoren extrahiert werden, die einen bedeutenden Teil der Varianz erklären und daher einen hohen Eigenwert besitzen. Dies ist bei dem ersten Faktor der Fall, in der Regel auch bei einigen weiteren Faktoren, wenngleich die Eigenwerte in der Regel stark abnehmen. Ab einem gewissen Faktor verharrt dann die zusätzliche Varianz, die durch jeden zusätzlichen Faktor erklärt wird, auf niedrigem Niveau.

Die Auswahl der Faktoren dient in erster Linie der Gewinnung von aussagekräftigen, gut interpretierbaren Ergebnissen und ist damit nur eingeschränkt objektivierbar.

Grundannahme

Die Grundannahme ist, dass nur diejenigen Faktoren bedeutsam seien, die eine stärkere Korrelation repräsentieren als die Korrelation von Zufallszahlen. Der Scree-Test macht sich nun die Tatsache zunutze, dass – im Gegensatz zu den Eigenwerten korrelierter Daten – die Eigenwerte von Zufallszahlen typischerweise annähernd konstant verlaufen.

Vorgehensweise

Zur Anwendung des Scree-Tests werden die abfallend sortierten Eigenwerte der möglichen Faktoren in einem sogenannten Eigenwertediagramm oder auch Scree-Plot betrachtet.

Nachdem die Eigenwerte der korrelierten Daten zunächst steil abfallen, zeichnet sich typischerweise eine Knickstelle („Ellenbogen“) ab. Die rechts daneben liegenden Werte stagnieren annähernd auf niedrigem Niveau; sie gelten als nicht bedeutsam, da sie sich in etwa auf (oder sogar unter) dem Niveau von Zufallskorrelationen bewegen.

Die links neben der Knickstelle liegenden Eigenwerte hingegen gelten als bedeutsam und sind in der Faktorenanalyse zu extrahieren. Bei mehreren Knickstellen ist der stärkere bzw. weiter rechts stehende Knick zu berücksichtigen. Gibt es keine Knickstelle, so hilft das Ellenbogenkriterium nicht weiter.

Kritik und Weiterentwicklungen

Kritik an der Objektivität

Screetest mit Parallelanalyse nach Horn
Screeplot mit verschiedenen Selektionskriterien (Horn, Kaiser-Guttmann, x%)

Der erstmals in Cattell (1966) publizierte Scree-Test wird häufig aufgrund seiner geringen Objektivität kritisiert. Ist keine eindeutige Knickstelle auszumachen, besteht Raum zur Interpretation.

Parallelanalyse

Die von J. L. Horn (1965) vorgestellte – oft als Parallelanalyse bezeichnete – Modifikation legt über das Eigenwertediagramm der korrelierten Daten ein zweites Eigenwertediagramm. Nur diejenigen untersuchten Eigenwerte, die höher sind als die Zufallseigenwerte, gelten als bedeutsam. Trotz der starken Ähnlichkeit kommen die beiden Varianten häufig zu abweichenden Ergebnissen. Obwohl Horns Modifikation objektiv anwendbar ist, konnte er Cattells Scree-Test nie verdrängen.

Die zweiten Eigenwerte werden berechnet unter der Annahme, dass

  1. die Variablen unkorreliert sind, d. h. die Korrelations- oder Kovarianzmatrix ist eine Diagonalmatrix und
  2. die Daten multivariat normalverteilt sind.

Auf dieser Basis werden B Zufallsdatendatensätze mit der gleichen Anzahl von Variablen und Beobachtungen wie der betrachtete Datensatz erzeugt und die Eigenwerte der dazugehörigen empirischen Korrelations- bzw. Kovarianzmatrix berechnet. Die B größten Eigenwerte approximieren die Verteilung des größten Eigenwertes, die B zweitgrößten Eigenwerte approximieren die Verteilung des zweitgrößten Eigenwertes, ... Dann wird z. B. das 95% Quantil der B größten Eigenwerte als Grenze g1 für den größten Eigenwert genommen. Ist der größte Eigenwert der Daten größer als g1, so ist dieser Eigenwert bedeutsam. Die zweite Abbildung rechts zeigt für den Boston Housing Datensatz mit der fallenden grauen Linie das Horn Kriterium.

Standard Error Scree

Neben weiteren, in den Folgejahrzehnten entstandenen Weiterentwicklungen und Verbesserungen stellen Zoski und Jurs (1996) einen Standard Error Scree vor.

Kritik an der Grundannahme

Auch die Grundannahme, dass Eigenwerte unterhalb von Zufallseigenwerten bedeutungslos seien, wurde von manchen Wissenschaftlern bezweifelt. Sie allein aufgrund ihrer Größe mit Zufalls- oder Fehlerergebnissen gleichzusetzen, sei unzulässig.

Alternativen

Als Alternative kommt das rigidere Kaiser-Guttman-Kriterium in Frage, das jedoch bisweilen zu schlecht interpretierbaren Lösungen führt.

Grundsätzlich sollten mehrere Kriterien herangezogen werden. Insbesondere im Zweifelsfall bietet es sich an, mehrere Faktorenzahlen durchzurechnen und im Hinblick auf Ladungen und Interpretierbarkeit zu überprüfen.

Literatur

Primärliteratur

  • Cattell, Raymond B.: The scree test for the number of factors in Multivariate Behavioral Research 1, 245-276, 1966. (Erstveröffentlichung)
  • Horn, J. L.: „A rationale and test for the number of factors in factor analysis“ in Psychometrika 30, 179-185, 1965. (Modifikation nach Horn)
  • Zoski, Keith W., Jurs Steven G.: „An objective counterpart to the visual scree test for factor analysis: The standard error scree“ in Educational and Psychological Measurement 56, 443-451, 1996. (Diskussion Weiterentwicklung nach Horn)

Sekundärliteratur

  • Bortz, Jürgen: Statistik für Sozialwissenschaftler. 5. Auflage, Berlin und Heidelberg: Springer, 1999, ISBN 3540650881 (Grundlegende, leichtverständliche Darstellung)

Weblinks


Wikimedia Foundation.

Игры ⚽ Нужно сделать НИР?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • scree test — An alternative method of deciding how many factors should be retained in any particular factor analysis . The principal method of deciding how many of the smaller factors to exclude, after retaining those which explain most of the common variance …   Dictionary of sociology

  • Scree-Plot — Der Scree Test, auch Ellenbogenkriterium genannt, ist ein graphisches Verfahren zur Bestimmung der optimalen Faktorenzahl bei der Faktorenanalyse. Das Kriterium wurde in den 1960er Jahren von dem US amerikanischen Psychologen Raymond Bernard… …   Deutsch Wikipedia

  • Screening-Test — Scree|ning Test [ßkri̱ning...; zu engl. to screen = durchsieben]: einfache Suchmethode, die an einer großen Zahl Personen durchgeführt werden kann, um eine bestimmte Krankheit zu erkennen (z. B. Diabetes mellitus, Harnwegserkrankungen) …   Das Wörterbuch medizinischer Fachausdrücke

  • Ellenbogen-Kriterium — Der Scree Test, auch Ellenbogenkriterium genannt, ist ein graphisches Verfahren zur Bestimmung der optimalen Faktorenzahl bei der Faktorenanalyse. Das Kriterium wurde in den 1960er Jahren von dem US amerikanischen Psychologen Raymond Bernard… …   Deutsch Wikipedia

  • Ellenbogenkriterium — Der Scree Test, auch Ellenbogenkriterium genannt, ist ein graphisches Verfahren zur Bestimmung der optimalen Faktorenzahl bei der Faktorenanalyse. Das Kriterium wurde in den 1960er Jahren von dem US amerikanischen Psychologen Raymond Bernard… …   Deutsch Wikipedia

  • Parallelanalyse — Der Scree Test, auch Ellenbogenkriterium genannt, ist ein graphisches Verfahren zur Bestimmung der optimalen Faktorenzahl bei der Faktorenanalyse. Das Kriterium wurde in den 1960er Jahren von dem US amerikanischen Psychologen Raymond Bernard… …   Deutsch Wikipedia

  • Screeplot — Der Scree Test, auch Ellenbogenkriterium genannt, ist ein graphisches Verfahren zur Bestimmung der optimalen Faktorenzahl bei der Faktorenanalyse. Das Kriterium wurde in den 1960er Jahren von dem US amerikanischen Psychologen Raymond Bernard… …   Deutsch Wikipedia

  • Screetest — Der Scree Test, auch Ellenbogenkriterium genannt, ist ein graphisches Verfahren zur Bestimmung der optimalen Faktorenzahl bei der Faktorenanalyse. Das Kriterium wurde in den 1960er Jahren von dem US amerikanischen Psychologen Raymond Bernard… …   Deutsch Wikipedia

  • Faktoranalyse — Die Faktorenanalyse, häufig auch Faktoranalyse, ist ein Verfahren der multivariaten Statistik. Es dient dazu, aus empirischen Beobachtungen verschiedener manifester Variablen (Observablen) auf zugrunde liegende latente Variable („Faktoren“) zu… …   Deutsch Wikipedia

  • Hauptfaktorenanalyse — Die Faktorenanalyse, häufig auch Faktoranalyse, ist ein Verfahren der multivariaten Statistik. Es dient dazu, aus empirischen Beobachtungen verschiedener manifester Variablen (Observablen) auf zugrunde liegende latente Variable („Faktoren“) zu… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”