Goldfeld-Quandt-Test

Goldfeld-Quandt-Test

Der Goldfeld-Quandt-Test ist ein statistischer Test zum Nachweis von Heteroskedastizität (Nicht-konstante Varianz) bei der Regressionsanalyse. Der Test basiert auf dem Vergleich zweier Stichprobenhälften. Er wurde benannt nach Stephen Goldfeld and Richard E. Quandt.[1]

Inhaltsverzeichnis

Vorgehen

Vorgehensweise beim Goldfeld-Quandt-Test.

Die Stichprobe wird in zwei Teile bzgl. einer erklärenden Variablen geteilt; siehe Grafik. Die beiden Teile müssen disjunkt sein (also keine Beobachtung darf in beiden Teilen sein), beide Teile müssen aber nicht die gesamte Stichprobe umfassen. In der Grafik ist z.B. der Mittelteil der Beobachtungen in keinem Teil (grau). Für beide Teile wird eine Regression geschätzt und die Varianz der Residuen berechnet. Bei Vorliegen von Heteroskedastiztät weist ein Teil der Stichprobe eine hohe Residualvarianz (rot) auf, während ein anderer Teil eine niedrige Residualvarianz (blau) aufweist.

Danach wird für jeden Teil die Stichprobenvarianz der Residuen {s_i^2} für i=1,2 bestimmt (mit s_1^2>s_2^2) und der Prüfwert \tfrac{s_1^2}{s_2^2} mit einem kritischen Wert aus der F-Verteilung verglichen.

Mathematische Formulierung

Voraussetzung

Im klassischen Regressionsmodell gilt Yi1 = f1(xi1) + Ui1 bzw. Yi2 = f2(xi2) + Ui2 mit Ui1N(0;σ1) und Ui1N(0;σ2). Der Test reagiert sensitiv auf Verletzungen der Normalverteilung der Residuen.

Hypothesen und Teststatistik

Die Null - und die Alternativhypothese lauten

H_0: \sigma_1=\sigma_2\, (Homoskedastizität) vs. H_1: \sigma_1\neq\sigma_2 (Heteroskedastizität).

Die Verteilung der Teststatistik ergibt sich als

F=\frac{S_1^2}{S_2^2}\sim F_{n_1-k;n_2-k}

mit ni die Anzahl der Beobachtungen im iten Teil und k die Anzahl der geschätzten Regressionsparameter sowie

S_i^2 = \frac{1}{n_i-k} \sum_{j=1}^{n_i} U_{ji}^2.

Die Nullhypothese (Homoskedastizität) wird verworfen, wenn der Prüfwert größer ist als der kritische Wert F_{n_1-k;n_2-k}(1-\alpha) aus der F-Verteilung mit n1k und n2k Freiheitsgraden und einem vorgegebenen Signifikanzniveau α.

Beispiel

Variable Bedeutung
medv Mittlerer Kaufpreis eines
Hauses in 1000 US$
lstat Anteil Unterschichtbevölkerung
rm Durchschnittliche Raumzahl
dis Gewichtete Entfernung zu den fünf
wichtigsten Beschäftigtenzentren

Für das Beispiel wurden lineare Regressionen mit dem Boston Housing Datensatz durchgeführt. Für jeden der 506 Bezirke wurden die rechts stehenden Variablen erhoben und eine lineare Regression durchgeführt:

medv_i=2,8083-0,7233 lstat_i + 4,8734 rm_i -0,4613 dis_i + \hat{u}_i.

Plottet man die Residuen gegen die Variable dis (Grafik oben) so sieht man, dass die Varianz der Residuen abnimmt, wenn die Werte von dis zunehmen. Man teilt die Daten nun in zwei Teile: den roten und den blauen Teil. Dann fittet man zwei Regressionsmodelle und berechnet die Summe der quadrierten Residuen.

Rot medv_{i1}=+56,116-1,002 lstat_{i1}+0,664 rm_{i1} -14,106 dis_{i1} + \hat{u}_{i1}
s_1^2=\frac1{n_1-k}\sum_{i=1}^{n_1} \hat{u}_{i1}^2 = \frac{4899,807}{112-4}=45,369
Blau medv_{i2}=-40,858-0,044 lstat_{i2}+9,895 rm_{i2} +0,233 dis_{i2} + \hat{u}_{i2}
s_2^2=\frac1{n_2-k}\sum_{i=1}^{n_2} \hat{u}_{i2}^2 = \frac{179,927}{49-4}=3,998

Dann ergibt sich der Prüfwert zu f=\tfrac{45,369}{3,998}=11,347 und der kritische Wert für ein Signifikanzniveau α = 5% aus der F-Verteilung mit 108 und 45 Freiheitsgraden zu c = 1,548. Da der Prüfwert größer ist als der kritische Wert muss die Nullhypothese der Homoskedastizität abgelehnt werden.

Einzelnachweise

  1. Stephen M. Goldfeld, Quandt, R. E.: Some Tests for Homoscedasticity. In: Journal of the American Statistical Association. 60, Nr. 310, Juni 1965, S. 539–547.

Literatur

Griffiths, William E. / Hill, R. Carter / Judge, George G.: Learning and Practicing Econometrics, 1. Auflage, 1993, Seite 494 ff., ISBN 0471513644


Wikimedia Foundation.

Игры ⚽ Поможем сделать НИР

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Goldfeld-Quandt-Test — einfach durchzuführender Heteroskedastizitätstest (⇡ Heteroskedastizität). Der Stützbereich für die Schätzung wird dazu in zwei Bereiche unterteilt, und auf der Basis zweier gewöhnlicher Kleinst Quadrate Schätzungen (⇡ gewöhnliche Methode der… …   Lexikon der Economics

  • Goldfeld — ist im Bergbau die Bezeichnung für eine Goldlagerstätte. Goldfeld ist der Familienname von Dorian Goldfeld (* 1947), US amerikanischer Mathematiker Julius Goldfeld (1860−1937), deutscher Jurist und Politiker Siehe auch: Goldfeld Quandt Test …   Deutsch Wikipedia

  • Test de Goldfeld et Quandt — Le test de Goldfeld et Quandt (formulé en 1965) est un test statistique, très utilisé en économétrie dans le cadre d un modèle linéaire multiple estimé par la méthode des moindres carrés afin de savoir si les perturbations sont hétéroscédastiques …   Wikipédia en Français

  • Heteroskedastie — Homoskedastizität Heteroskedastizität …   Deutsch Wikipedia

  • Heteroskedastizität — Homoskedastizität Heteroskedastizität …   Deutsch Wikipedia

  • Homoskedastie — Homoskedastizität Heteroskedastizität …   Deutsch Wikipedia

  • Homoskedastizität — Heteroskedastizität …   Deutsch Wikipedia

  • Skedastizität — Homoskedastizität Heteroskedastizität …   Deutsch Wikipedia

  • Varianzheterogenität — Homoskedastizität Heteroskedastizität …   Deutsch Wikipedia

  • Varianzhomogenität — Homoskedastizität Heteroskedastizität …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”