Varianzhomogenität

Varianzhomogenität
Homoskedastizität
Heteroskedastizität
Heteroskedastizität

Heteroskedastizität (auch (Residuen)-Varianzheterogenität) bedeutet in der Statistik unterschiedliche Streuung innerhalb einer Datenmessung. Wenn die Varianz der Residuen (und somit die Varianz der erklärten Variablen selbst) für alle Ausprägungen der anderen (Prädiktor-) Variablen nicht signifikant unterschiedlich sind, liegt Homoskedastizität ((Residuen-)Varianzhomogenität) vor. Der Begriff spielt insbesondere in der Ökonometrie und der empirischen Forschung eine wichtige Rolle.

Häufig werden in der Statistik Methoden angewendet, bei denen mehrere gleichartige Merkmale eine Rolle spielen. Beispielsweise hat man in der Regressionsanalyse eine Menge von Datenpunkten gegeben, in die eine Gerade möglichst passgenau eingelegt wird. Die Abweichungen der Datenpunkte von der Geraden werden Störterme oder Residuen genannt und sind wahrscheinlichkeitstheoretisch jeweils Zufallsvariablen. Haben diese Störterme alle die gleiche Varianz, liegt Homoskedastizität vor. Wenn diese Störterme allerdings nicht die gleiche Varianz aufweisen, führt die einfache Kleinstquadratmethode nicht zu effizienten Schätzwerten für die Regressionskoeffizienten. Dies bedeutet, dass diese Schätzwerte nicht die kleinstmögliche Varianz aufweisen. Außerdem ist dann eine naive Anwendung des t-Testes nicht möglich; die t-Werte sind nicht mehr brauchbar. Abhilfe schafft in vielen Fällen eine geeignete Datennormalisierung: Herrscht Heteroskedastizität, kann es durchaus sinnvoll sein, die Daten mittels Anwendung des Logarithmus oder der Quadratwurzel zu transformieren um Homoskedastizität zu erreichen. Diese führt dann zur korrekten Verwendung des Gauss-Markov-Theorems.

Beispiel: Ein typisches Beispiel für Heteroskedastizität ist, wenn bei einer Zeitreihe die Abweichungen von der Trendgeraden mit Fortlauf der Zeit steigen (z. B. für die Treffgenauigkeit bei der Wettervorhersage: je weiter in der Zukunft, desto unwahrscheinlicher ist eine genaue Prognose). Allerdings können auch in Zeitreihen ohne konstante Varianz bestimmte charakteristische Auffälligkeiten wie z. B. Volatilitätscluster beobachtet werden. Deshalb wurde im Rahmen von Volatilitätsmodellen versucht, dem Verlauf der Varianz eine systematische Erklärung zu Grunde zu legen.

Bekannte Verfahren, um die Nullhypothese „Homoskedastizität“ zu überprüfen, sind der Goldfeld-Quandt-Test, der White-Test, der Glejser-Test und der Breusch-Pagan-Test (siehe englische Wikipedia: Breusch-Pagan statistic).


Wikimedia Foundation.

Игры ⚽ Поможем сделать НИР

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Post-Hoc-Test — Post Hoc Tests sind Signifikanztests aus der mathematischen Statistik. Mit der einfaktoriellen ANOVA, dem Kruskal Wallis Test oder dem Median Test wird nur festgestellt, dass es in einer Gruppe von Mittelwerten signifikante Unterschiede gibt. Die …   Deutsch Wikipedia

  • ANOVA — Als Varianzanalyse bezeichnet man eine große Gruppe datenanalytischer und mustererkennender statistischer Verfahren, die zahlreiche unterschiedliche Anwendungen zulassen. Ihnen gemeinsam ist, dass sie Varianzen und Prüfgrößen berechnen, um… …   Deutsch Wikipedia

  • Einfachregression — Die Regressionsanalyse ist ein statistisches Analyseverfahren. Ziel ist es, Beziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen festzustellen. Allgemein wird eine metrische Variable Y betrachtet, die von einer… …   Deutsch Wikipedia

  • Fehler-Fortpflanzung — Bei vielen Messaufgaben ist eine Größe nicht direkt messbar, sondern sie ist indirekt aus mehreren messbaren Größen nach einer festgelegten mathematischen Beziehung zu bestimmen. Da jeder Messwert der einzelnen Größen von seinem richtigen Wert… …   Deutsch Wikipedia

  • Gaußsches Fehlerfortpflanzungsgesetz — Bei vielen Messaufgaben ist eine Größe nicht direkt messbar, sondern sie ist indirekt aus mehreren messbaren Größen nach einer festgelegten mathematischen Beziehung zu bestimmen. Da jeder Messwert der einzelnen Größen von seinem richtigen Wert… …   Deutsch Wikipedia

  • Größtfehler — Bei vielen Messaufgaben ist eine Größe nicht direkt messbar, sondern sie ist indirekt aus mehreren messbaren Größen nach einer festgelegten mathematischen Beziehung zu bestimmen. Da jeder Messwert der einzelnen Größen von seinem richtigen Wert… …   Deutsch Wikipedia

  • Lineare Regression — Die lineare Regression ist ein Spezialfall des allgemeinen Konzepts der Regressionsanalyse, mit der versucht wird, eine abhängige Variable durch eine oder mehrere unabhängige Variablen zu erklären das Beiwort linear ergibt sich dabei daraus, dass …   Deutsch Wikipedia

  • Lineare Regressionsanalyse — Die Regressionsanalyse ist ein statistisches Analyseverfahren. Ziel ist es, Beziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen festzustellen. Allgemein wird eine metrische Variable Y betrachtet, die von einer… …   Deutsch Wikipedia

  • Logit-Modell — Logistische Funktion Unter logistischer Regression oder Logit Modell versteht man ein Verfahren zur (meist multivariaten) Analyse diskreter (z. B. binärer) abhängiger Variablen. Hierbei hat man Daten gegeben, wobei Yi einen binären …   Deutsch Wikipedia

  • Logitmodell — Logistische Funktion Unter logistischer Regression oder Logit Modell versteht man ein Verfahren zur (meist multivariaten) Analyse diskreter (z. B. binärer) abhängiger Variablen. Hierbei hat man Daten gegeben, wobei Yi einen binären …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”