Fixed-effects- und Random-effects-Modell

Fixed-effects- und Random-effects-Modell
Racine carrée bleue.svg
Dieser Artikel wurde auf der Qualitätssicherungsseite des Portals Mathematik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Mathematik auf ein akzeptables Niveau zu bringen.

Bitte hilf mit, die Mängel dieses Artikels zu beseitigen, und beteilige dich bitte an der Diskussion!

Als Fixed-effects- und Random-effects-Modelle bezeichnet man verfeinerte Verfahren der linearen Regressionsanalyse, die in Verbindung mit Paneldaten verwendet werden können. Random-effects und insbesondere Fixed-effects-Modelle erlauben eine konsistente Schätzung kausaler Effekte unter weniger restriktiven Annahmen als die klassische Kleinste-Quadrate-Schätzung.

Inhaltsverzeichnis

Kleinste-Quadrate-Schätzung in Paneldaten

In Paneldatensätzen werden Variablen von der gleichen Beobachtungseinheit i=1...N für mehrere Zeitperioden t=1...T erhoben, sodass insgesamt N*T Beobachtungen zur Verfügung stehen. Ein grundsätzliches Modell könnte hierbei wie folgt aussehen [1]

yit = αit + x'itβit + uit

wobei x einen Vektor darstellt, der die k erklärenden Variablen enthält; α und β sind die zu erklärenden Koeffizienzen und u stellt einen Fehlerterm dar. Dieses Modell kann so nicht geschätzt werden, da es zu viele zu schätzende Koeffizienten enthält.[2] Die klassische Kleinste-Quadrat-Schätzung (auch OLS- für ordinary least squares) nimmt deswegen vereinfachend an, dass alle Koeffizienten üher die Zeit und über Individuen konstant sind[3]:

yit = α + x'itβ + uit

Dieses Modell ist auch als Pooled OLS bekannt. Damit der Effekt der erklärenden Variablen x auf y konsistent geschätzt werden kann, muss darüber hinaus angenommen werden, dass die erklärenden Variablen und die Fehlerterme unkorelliert sind[4]: Cov(uit,xit) = 0.

Random- und Fixed-Effects-Modelle erlauben es, von der Annahme ausschließlich konstanter Koeffizienten abzuweichen und ein Modell der Form

yit = αi + x'itβ + uit

zu schätzen. Dieses Modell wird auch als Modell mit Individuen-spezifischen Effekten (individual-specific effects model)[5] oder Modell für unbeobachtete Effekte (unobserved effects model) [6] bezeichnet. Die Terme αi sind unter anderem als "unbeobachtete Heterogenität", "latente Variable" oder "individuelle Heterogenität" bekannt.[7]. Der Unterschied zwischen Random- und Fixed-Effects-Modell besteht in der unterstellten Korrelation zwischen den erklärenden Variablen und der unbeobachteten Heterogenität.

Random-Effects-Modell

Grundgedanke und Implementierung

Das Random Effects-Modell (zur Abgrenzung manchmal auch random intercept model [8]) macht die Annahme, dass die unbeobachtete Heterogenität orthogonal zu den erklärenden Variablen steht:

Ei | xi) = Ei) = 0

wobei x einen T-dimensionalen Vektor darstellt. Darüber hinaus muss auch strikte Exogenität des Fehlerterms angenommen werden:

E(uit | xii) = 0,t = 1,...T [9]

Unter diesen Annahmen kann die individuelle Heterogenität als ein weiterer Fehlerterm gesehen werden, d.h. das zu schätzende Modell kann umgeschrieben werden als

 y_{it}=x_{it}\cdot\beta + v_it

wobei

vit = uit + αi

Aufgrund der obigen Annahmen ist dann E(vit | xi = 0,t = 1,...T. [10] Das Random-Effects-Modell erfüllt also die Anforderung, dass der Fehlerterm der Regression und die erklärenden Variablen unkorreliert sind. Aus diesem Grund würde eine klassische Kleinste-Quadrate-Schätzung konsistenten Schätzern für Beta führen. Aufgrund der individuellen Heterogenität erfüllt das Random-Effects-Modell allerdings die Annahme der Homoskedastie nicht. Selbst wenn

 E(u_{it}^{2}) = \sigma^{2}_{u} und
E(\alpha_{t}^{2}) = \sigma^{2}_{\alpha}

Konstanten sind und die idiosynkratischen Fehlerterme unkorreliert sind (E(uit + uis) = 0, t≠s), wird zwischen den zusammengesetzten Fehlertermen des gleichen Individuums für verschiedene Zeitpunkte eine Korrelation bestehen:

E(v_{it}\cdot v_{is})= E((u_{it}+\alpha_{i})\cdot(u_{is}+\alpha_{i}))=E(c_{i}^{2})=\sigma^2_\alpha) [11]

Aus diesem Grund wird die Varianz-Kovarianzmatrix eine NTxNT-Matrix sein, gegeben durch

 \Omega = \begin{pmatrix}
  \Omega_i & 0 & \cdots & 0 \\ 
  0 & \Omega_i & \ddots & \vdots \\
  \vdots & \ddots & \ddots & 0 \\
  0 & \cdots & 0 & \Omega_n
\end{pmatrix}

Wobei die einzelnen Diagonalelemente gegeben sind durch TxT-Matrizen

 \Omega_i = \begin{pmatrix}
  \sigma^2_u & \sigma^2_u + \sigma^2_\alpha & \cdots & \sigma^2_u + \sigma^2_\alpha \\ 
  \sigma^2_u + \sigma^2_\alpha & \sigma^2_u & \ddots & \vdots \\
  \vdots & \ddots & \ddots & \sigma^2_u + \sigma^2_\alpha \\
  \sigma^2_u + \sigma^2_\alpha & \cdots & \sigma^2_u + \sigma^2_\alpha & \sigma^2_u
\end{pmatrix}.

Ω ist also keine Diagonalmatrix, sondern eine Block-diagonale Matrix. Die besondere Struktur mit nur zwei Parametern (\sigma^2_u und \sigma^2_\alpha) wird auch als Random-Effects-Struktur bezeichnet.[12] Eine Matrix mit der Random-Effects-Struktur erfüllt die für den Satz von Gauß-Markov zentrale Annahme der Homoskedastie (die eine diagonale Varianz-Kovarianzmatrix mit konstantem Diagonalelement erfordert) nicht. Aus diesem Grund ist die gewöhnliche Kleinste-Quadrat-Schätzung (OLS) im Random-Effects-Modell nicht effizient. Darüber hinaus sind die auf Basis der normalen OLS-Schätzung geschätzten Standardfehler nicht korrekt (da dabei die Korrelation über Zeit ignoriert wird). Für Inferenz und Hypothesentests müssten die Standardfehler also angepasst werden.[13]

Der Random-Effects-Schätzer („RE estimator“) schafft an dieser Stelle Abhilfe. Konkret handelt es sich dabei um den auf das Random-Effects-Modell angewandten „Feasible Generalised Least Squares“-Schätzer. Hierbei wird das zugrunde liegende Modell zunächst mit einer normalen OLS-Regression geschätzt, die, wie oben ausgeführt, zu konsistenten Schätzern führt. Auf Basis dieser OLS-Regression und ihrer Residuen können dann konsistente Schätzer  \widehat{\sigma^2_u} und  \widehat{\sigma^2_\alpha} berechnet[14] und mit ihnen eine geschätzte Varianz-Kovarianzmatrix  \widehat{\Omega} konstruiert werden.  \widehat{\Omega} wird dann benutzt, um das zugrundeliegende Modell zu transformieren:

 \widehat{\Omega}^{-1/2} \cdot y_{it}=\widehat{\Omega}^{-1/2} \cdot x_{it}\cdot\beta + \widehat{\Omega}^{-1/2} \cdot v_{it}

Anschließend wird dieses transformierte Modell wieder mit einer OLS-Schätzung geschätzt, woraus sich der FGLS bzw. RE-Schätzer ergibt:

 \widehat{\beta^{RE}} = (X'\widehat{\Omega}^{-1}X)^{-1}X'\widehat{\Omega}^{-1}y [15]

Der Random-Effects-Schätzer als Mitglieder der FGLS-Familie weist auch die gleichen wünschenswerten Eigenschaften wie andere FGLS-Schätzer auf: Er ist asymptotisch äquivalent zum GLS-Schätzer und deswegen asymptotisch effizient.[16] Zur einfachen Implementierung des RE-Schätzers kann bei modernen Statistik-Programmen wie z.B. Stata auf bereits programmierte Routinen zurückgegriffen werden.

Potentielle Probleme

Das Random-Effects-Modell erlaubt, wie beschrieben, die Schätzung eines Modelles mit individueller Heterogenität, sofern diese nicht mit den anderen erklärenden Variablen korreliert ist. Falls jedoch  E(\alpha_{i}|x_{i}) \neq 0, so ist der Random-Effects-Schätzer (genau wie der normale OLS-Schätzer) inkosistent. Ein intuitives Beispiel für die damit einhergehende Problematik kann in der Arbeitsökonomik gefunden werden. Eine wichtige Frage in diesem Teilbereich der Ökonomie ist, welche Einfluss Bildung auf das Einkommen einer Person hat.[17] Eine mögliche Regression wäre also

einkommenit = αi + βitJahreBildungit + x'itγ + uit

wobei x einen Vektor mit zusätzlichen Kontrollvariablen wie Alter, Erfahrung u.ä. darstellt. αi wird hierbei alle Effekte auffangen, die bei einem Individuum über Zeit konstant sind und nicht in die Regression mit aufgenommen werden können. Ein Beispiel hierfür ist die Fähigkeit („ability“) der beobachteten Individuen. Die Konsistenz des Random-Effects-Schätzers erfordert also, dass die Fähigkeit einer Person nicht mit ihrer Bildung korrelliert ist. Hier wird ersichtlich, dass die zugrunde liegenden Annahmen des RE-Schätzers sehr stark und insbesondere in mikroökonometrischen Analysen oft verletzt sind. Der RE-Schäzer wird dort deswegen eher selten verwandt.[18]

Fixed-Effects-Modelle

Der Fixed-Effects-Schätzer

Das Fixed-Effects-Modell und der Fixed-Effects-Schätzer ermöglichen es, auch dann die kausalen Effekte der erklärenden Variablen konsistent zu schätzen, wenn die individuelle, zeitkonstante Heterogenität mit den erklärenden Variablen korreliert ist. Das zugrundeliegende Modell sei wiederum

yit = αi + x'itβ + uit

Weiter gelte die Annahme der strikten Exogenität in Bezug auf u:

E(uit | xii) = 0,t = 1,...T

Im Gegensatz zum Random-Effects-Modell kann jedoch  E(\alpha_{i}|x_{i}) \neq 0 sein. Falls dies der Fall ist, ist

 E(v_{it}\cdot x_{it})=E((u_{it}+\alpha_i)x_{it})=E(x_{it} \cdot \alpha_i) \neq 0

Eine gewöhnliche OLS- oder RE-Schätzung wird aus diesem Fall nicht konsistent sein. Eine Abhilfe ist der sogenannte Fixed-Effects-Schätzer (manchmal auch Within Estimator[19]). Die Idee hierbei ist, die über die Zeit konstante, individuums-spezifische Heterogenität dadurch zu eliminieren, dass von jeder Beobachtung der individuums-spezifische Durchschnitt über die Zeitperioden subtrahiert wird. Das zu schätzende Modell wird also zu

 y_{it}-\bar{y_{i}} = (x_{it} - \bar{x_{i}})'\beta + (u_{it} - \bar{u_{i}})

wobei \bar{y_{i}} = \tfrac 1T \sum_{t=1}^{T}y_{it} und ähnlich für die anderen Variablen. Da \tfrac 1T \sum_{t=1}^{T}c_{i}= c_{i} fällt die individuums-spezifische Heterogenität (der „fixe Effekt“) aus dem Modell heraus. [20] Der FE-Schätzer ergibt sich dann durch eine gewöhnliche OLS-Schätzung des transformierten Modelles. Der FE- oder Within-Schätzer ist konsistent und, unter der Annahme dass die Fehlerterme für eine Beobachtungseinheit über die Zeit hinweg eine konstante Varianz haben und nicht miteinander korreliert sind, auch effizient.[21]

Alternative Schätzer

Anstatt der geschilderten Transformation des Modells durch Subtration der individuellen Durchschnitte über Zeit können auch andere Schätzer verwendet werden. Der sogenannte Least Squares Dummy Variable-Schätzer beispielsweise fügt den erklärenden Variablen des Modells noch Dummy-Variablen für jede Beobachtungseinheit hinzu; anschließend wird eine gewöhnliche OLS-Schätzung dieses erweiterten Modells durchgeführt. Mithilfe des Theorems von Frisch, Waugh und Lovell lässt dich zeigen, dass die daraus resultierenden Schätzer für die beta-Koeffizienten identisch zu denen des FE-Schätzers sind. Darüber hinaus ergibt die LSDV-Regression auch Schätzungen für die individuellen Terme αi. Diese sind allerdings nur dann konsistent, wenn die Anzahl der Zeitperioden groß ist.[22]

Vergleich der Modelle

  • Lineares Regressionsmodell zum Vergleich: y_{ij}=\beta_{0} + \beta_{1} x_{ij}+ \epsilon_{ij}
  • Bei Fixed Effect-Modellen wird die gleiche Steigung unterstellt, aber Niveauunterschiede (Achsenabschnitte) zugelassen. Das Fixed Effect Modell geht davon, dass die β0j fixe Effekte sind, also als Parameter eines linearen Regressionsmodellen mit entsprechenden Dummyvariablen für die Gruppe j geschätzt werden können:
Fixed Effect Modell: y_{ij}=\beta_{0j} + \beta_{1} x_{ij}+ \epsilon_{ij} (z.B. mit der Bedingung \sum \beta_{0j}=0)
  • Random Effect Modelle

Bei Random Effect-Modellen werden unterschiedliche Steigungen zugelassen, aber ein gleichen Ausgangsniveau erzwungen. Im Random Intercept Modell sind die β0j fehlerbehaftete Größen (random effects). Der Fehler setzt sich dann aus zwei Komponenten zusammen: den inviduellen Fehlern \epsilon_{ij} und den Gruppenfehlern \epsilon_j^{(0)}.

Random Intercept Modell: y_{ij}= \underbrace{(\gamma_{0}+...+\epsilon_j^{(0)})}_{=: \beta_{0j}} + \beta_{1} x_{ij}+ \epsilon_{ij}
Random Slope Modell: y_{ij}= \beta_0 + (\delta_{0}+...+\epsilon_j^{(1)}) x_{ij}+ \epsilon_{ij}

Anwendung

werden im Rahmen der Mehrebenenanalyse und Paneldatenanalyse verwendet. Bei der Mehrebenenanalyse können die fixen Effekte z.B. Niveauunterschiede zwischen Ländern sein, in denen Informationen zu Personen vorliegen. Im Rahmen der Paneldatenanalyse können unterschiedliche Entwicklungen über die Zeit aufgrund von Drittvariablen kontrolliert werden.

Weblinks

Literatur

  • Joshua D. Angrist und Jörn-Steffen Pischke: Mostly Harmless Econometrics: An Empiricist's Companion, Princeton University Press, 2008
  • A.Colin Cameron und Pravin K. Trivedi: Microeconometrics- Methods and Applications, Cambridge University Press, 2005, ISBN 0521848059, insb. Kapitel 21
  • Ronald Christensen: Plane Answers to Complex Questions: The Theory of Linear Models, Third, New York: Springer 2002, ISBN 0-387-95361-2
  • FAQ:What is the between estimator?. Abgerufen am 5. Oktober 2011.
  • FAQ: Fixed-, between-, and random-effects and xtreg. Abgerufen am 5. Oktober 2011.
  • Jeffrey M. Wooldridge: Econometric Analysis of Cross Section and Panel Data: Second Edition, Cambridge: MIT Press, 2002, insb. Kapitel 10

Einzelnachweise

  1. Cameron & Trivedi, 2005, S.698
  2. Es müssten schon alleine N*T verschiedene alphas geschätzt werden, und dazu noch N*T*K verschiedene betas.
  3. Cameron & Trivedi, 2005, S.699
  4. Cameron und Trivedi, 2005, S. 702
  5. Cameron & Trivedi, 2005, S. 700
  6. Wooldridge, 2002, S. 251
  7. Wooldridge, 2002, S. 251
  8. Cameron & Trivedi, 2005, S. 700
  9. Wooldridge, 2002, S. 257
  10. Wooldridge, 2002, S. 258
  11. Wooldridge, 2002, S. 258f.
  12. Wooldridge, 2002, S. 259
  13. Cameron & Trivedi, 2005, S.703
  14. Für die genaue Berechnung siehe Wooldridge, 2002, S. 260f.
  15. Cameron & Trivedi, 2005, S. 81f.
  16. Wooldridge, 2002, S. 260
  17. Für einen Überblick hierzu, siehe u.a. David Card: Estimating the Return to Schooling: Progress on Some Persistent Econometric Problems, Econometrica, 69.5, September 2001, S. 1127-1160
  18. Cameron & Trivedi, 2002, S. 702
  19. Cameron & Trivedi, 2005, S. 726
  20. Cameron & Trivedi, 2005, S.726
  21. Wooldridge, 2002, S. 269f.
  22. Cameron & Trivedi, 2005, S. 732f.

Wikimedia Foundation.

Игры ⚽ Нужно сделать НИР?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Fixed-Effects-Modell — Inhaltsverzeichnis 1 Abgrenzung statische und dynamische Modelle 2 Schätzverfahren in den statischen Modellen 3 Schätzverfahren in den dynamischen Modellen 4 Literatur // …   Deutsch Wikipedia

  • Random-Effects-Modell — Inhaltsverzeichnis 1 Abgrenzung statische und dynamische Modelle 2 Schätzverfahren in den statischen Modellen 3 Schätzverfahren in den dynamischen Modellen 4 Literatur // …   Deutsch Wikipedia

  • Paneldatenanalyse — ist die statistische Analyse von Paneldaten im Rahmen der Panelforschung. Bei der Paneldatenanalyse werden sowohl dynamische Aspekte (wie entwickelt sich ein Merkmal im Zeitablauf?) als auch die Heterogenität (Unterschiedlichkeit) der Individuen… …   Deutsch Wikipedia

  • Panel-Analyse — Inhaltsverzeichnis 1 Abgrenzung statische und dynamische Modelle 2 Schätzverfahren in den statischen Modellen 3 Schätzverfahren in den dynamischen Modellen 4 Literatur // …   Deutsch Wikipedia

  • Hausman-Test — Der Hausman Spezifikationstest (Test auf Endogenität, das heißt ein Test auf den Zusammenhang zwischen den erklärenden (unabhängigen) Variablen und der Störgröße) ist ein Testverfahren aus der Mathematischen Statistik. Er wurde 1978 von Jerry… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”