- Fixed-effects- und Random-effects-Modell
-
Dieser Artikel wurde auf der Qualitätssicherungsseite des Portals Mathematik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Mathematik auf ein akzeptables Niveau zu bringen. Bitte hilf mit, die Mängel dieses Artikels zu beseitigen, und beteilige dich bitte an der Diskussion!
Als Fixed-effects- und Random-effects-Modelle bezeichnet man verfeinerte Verfahren der linearen Regressionsanalyse, die in Verbindung mit Paneldaten verwendet werden können. Random-effects und insbesondere Fixed-effects-Modelle erlauben eine konsistente Schätzung kausaler Effekte unter weniger restriktiven Annahmen als die klassische Kleinste-Quadrate-Schätzung.
Inhaltsverzeichnis
Kleinste-Quadrate-Schätzung in Paneldaten
In Paneldatensätzen werden Variablen von der gleichen Beobachtungseinheit i=1...N für mehrere Zeitperioden t=1...T erhoben, sodass insgesamt N*T Beobachtungen zur Verfügung stehen. Ein grundsätzliches Modell könnte hierbei wie folgt aussehen [1]
- yit = αit + x'itβit + uit
wobei x einen Vektor darstellt, der die k erklärenden Variablen enthält; α und β sind die zu erklärenden Koeffizienzen und u stellt einen Fehlerterm dar. Dieses Modell kann so nicht geschätzt werden, da es zu viele zu schätzende Koeffizienten enthält.[2] Die klassische Kleinste-Quadrat-Schätzung (auch OLS- für ordinary least squares) nimmt deswegen vereinfachend an, dass alle Koeffizienten üher die Zeit und über Individuen konstant sind[3]:
- yit = α + x'itβ + uit
Dieses Modell ist auch als Pooled OLS bekannt. Damit der Effekt der erklärenden Variablen x auf y konsistent geschätzt werden kann, muss darüber hinaus angenommen werden, dass die erklärenden Variablen und die Fehlerterme unkorelliert sind[4]: Cov(uit,xit) = 0.
Random- und Fixed-Effects-Modelle erlauben es, von der Annahme ausschließlich konstanter Koeffizienten abzuweichen und ein Modell der Form
- yit = αi + x'itβ + uit
zu schätzen. Dieses Modell wird auch als Modell mit Individuen-spezifischen Effekten (individual-specific effects model)[5] oder Modell für unbeobachtete Effekte (unobserved effects model) [6] bezeichnet. Die Terme αi sind unter anderem als "unbeobachtete Heterogenität", "latente Variable" oder "individuelle Heterogenität" bekannt.[7]. Der Unterschied zwischen Random- und Fixed-Effects-Modell besteht in der unterstellten Korrelation zwischen den erklärenden Variablen und der unbeobachteten Heterogenität.
Random-Effects-Modell
Grundgedanke und Implementierung
Das Random Effects-Modell (zur Abgrenzung manchmal auch random intercept model [8]) macht die Annahme, dass die unbeobachtete Heterogenität orthogonal zu den erklärenden Variablen steht:
- E(αi | xi) = E(αi) = 0
wobei x einen T-dimensionalen Vektor darstellt. Darüber hinaus muss auch strikte Exogenität des Fehlerterms angenommen werden:
- E(uit | xi,αi) = 0,t = 1,...T [9]
Unter diesen Annahmen kann die individuelle Heterogenität als ein weiterer Fehlerterm gesehen werden, d.h. das zu schätzende Modell kann umgeschrieben werden als
wobei
- vit = uit + αi
Aufgrund der obigen Annahmen ist dann E(vit | xi = 0,t = 1,...T. [10] Das Random-Effects-Modell erfüllt also die Anforderung, dass der Fehlerterm der Regression und die erklärenden Variablen unkorreliert sind. Aus diesem Grund würde eine klassische Kleinste-Quadrate-Schätzung konsistenten Schätzern für Beta führen. Aufgrund der individuellen Heterogenität erfüllt das Random-Effects-Modell allerdings die Annahme der Homoskedastie nicht. Selbst wenn
- und
Konstanten sind und die idiosynkratischen Fehlerterme unkorreliert sind (E(uit + uis) = 0, t≠s), wird zwischen den zusammengesetzten Fehlertermen des gleichen Individuums für verschiedene Zeitpunkte eine Korrelation bestehen:
Aus diesem Grund wird die Varianz-Kovarianzmatrix eine NTxNT-Matrix sein, gegeben durch
Wobei die einzelnen Diagonalelemente gegeben sind durch TxT-Matrizen
- .
Ω ist also keine Diagonalmatrix, sondern eine Block-diagonale Matrix. Die besondere Struktur mit nur zwei Parametern ( und ) wird auch als Random-Effects-Struktur bezeichnet.[12] Eine Matrix mit der Random-Effects-Struktur erfüllt die für den Satz von Gauß-Markov zentrale Annahme der Homoskedastie (die eine diagonale Varianz-Kovarianzmatrix mit konstantem Diagonalelement erfordert) nicht. Aus diesem Grund ist die gewöhnliche Kleinste-Quadrat-Schätzung (OLS) im Random-Effects-Modell nicht effizient. Darüber hinaus sind die auf Basis der normalen OLS-Schätzung geschätzten Standardfehler nicht korrekt (da dabei die Korrelation über Zeit ignoriert wird). Für Inferenz und Hypothesentests müssten die Standardfehler also angepasst werden.[13]
Der Random-Effects-Schätzer („RE estimator“) schafft an dieser Stelle Abhilfe. Konkret handelt es sich dabei um den auf das Random-Effects-Modell angewandten „Feasible Generalised Least Squares“-Schätzer. Hierbei wird das zugrunde liegende Modell zunächst mit einer normalen OLS-Regression geschätzt, die, wie oben ausgeführt, zu konsistenten Schätzern führt. Auf Basis dieser OLS-Regression und ihrer Residuen können dann konsistente Schätzer und berechnet[14] und mit ihnen eine geschätzte Varianz-Kovarianzmatrix konstruiert werden. wird dann benutzt, um das zugrundeliegende Modell zu transformieren:
Anschließend wird dieses transformierte Modell wieder mit einer OLS-Schätzung geschätzt, woraus sich der FGLS bzw. RE-Schätzer ergibt:
Der Random-Effects-Schätzer als Mitglieder der FGLS-Familie weist auch die gleichen wünschenswerten Eigenschaften wie andere FGLS-Schätzer auf: Er ist asymptotisch äquivalent zum GLS-Schätzer und deswegen asymptotisch effizient.[16] Zur einfachen Implementierung des RE-Schätzers kann bei modernen Statistik-Programmen wie z.B. Stata auf bereits programmierte Routinen zurückgegriffen werden.
Potentielle Probleme
Das Random-Effects-Modell erlaubt, wie beschrieben, die Schätzung eines Modelles mit individueller Heterogenität, sofern diese nicht mit den anderen erklärenden Variablen korreliert ist. Falls jedoch , so ist der Random-Effects-Schätzer (genau wie der normale OLS-Schätzer) inkosistent. Ein intuitives Beispiel für die damit einhergehende Problematik kann in der Arbeitsökonomik gefunden werden. Eine wichtige Frage in diesem Teilbereich der Ökonomie ist, welche Einfluss Bildung auf das Einkommen einer Person hat.[17] Eine mögliche Regression wäre also
- einkommenit = αi + βitJahreBildungit + x'itγ + uit
wobei x einen Vektor mit zusätzlichen Kontrollvariablen wie Alter, Erfahrung u.ä. darstellt. αi wird hierbei alle Effekte auffangen, die bei einem Individuum über Zeit konstant sind und nicht in die Regression mit aufgenommen werden können. Ein Beispiel hierfür ist die Fähigkeit („ability“) der beobachteten Individuen. Die Konsistenz des Random-Effects-Schätzers erfordert also, dass die Fähigkeit einer Person nicht mit ihrer Bildung korrelliert ist. Hier wird ersichtlich, dass die zugrunde liegenden Annahmen des RE-Schätzers sehr stark und insbesondere in mikroökonometrischen Analysen oft verletzt sind. Der RE-Schäzer wird dort deswegen eher selten verwandt.[18]
Fixed-Effects-Modelle
Der Fixed-Effects-Schätzer
Das Fixed-Effects-Modell und der Fixed-Effects-Schätzer ermöglichen es, auch dann die kausalen Effekte der erklärenden Variablen konsistent zu schätzen, wenn die individuelle, zeitkonstante Heterogenität mit den erklärenden Variablen korreliert ist. Das zugrundeliegende Modell sei wiederum
- yit = αi + x'itβ + uit
Weiter gelte die Annahme der strikten Exogenität in Bezug auf u:
- E(uit | xi,αi) = 0,t = 1,...T
Im Gegensatz zum Random-Effects-Modell kann jedoch sein. Falls dies der Fall ist, ist
Eine gewöhnliche OLS- oder RE-Schätzung wird aus diesem Fall nicht konsistent sein. Eine Abhilfe ist der sogenannte Fixed-Effects-Schätzer (manchmal auch Within Estimator[19]). Die Idee hierbei ist, die über die Zeit konstante, individuums-spezifische Heterogenität dadurch zu eliminieren, dass von jeder Beobachtung der individuums-spezifische Durchschnitt über die Zeitperioden subtrahiert wird. Das zu schätzende Modell wird also zu
wobei und ähnlich für die anderen Variablen. Da fällt die individuums-spezifische Heterogenität (der „fixe Effekt“) aus dem Modell heraus. [20] Der FE-Schätzer ergibt sich dann durch eine gewöhnliche OLS-Schätzung des transformierten Modelles. Der FE- oder Within-Schätzer ist konsistent und, unter der Annahme dass die Fehlerterme für eine Beobachtungseinheit über die Zeit hinweg eine konstante Varianz haben und nicht miteinander korreliert sind, auch effizient.[21]
Alternative Schätzer
Anstatt der geschilderten Transformation des Modells durch Subtration der individuellen Durchschnitte über Zeit können auch andere Schätzer verwendet werden. Der sogenannte Least Squares Dummy Variable-Schätzer beispielsweise fügt den erklärenden Variablen des Modells noch Dummy-Variablen für jede Beobachtungseinheit hinzu; anschließend wird eine gewöhnliche OLS-Schätzung dieses erweiterten Modells durchgeführt. Mithilfe des Theorems von Frisch, Waugh und Lovell lässt dich zeigen, dass die daraus resultierenden Schätzer für die beta-Koeffizienten identisch zu denen des FE-Schätzers sind. Darüber hinaus ergibt die LSDV-Regression auch Schätzungen für die individuellen Terme αi. Diese sind allerdings nur dann konsistent, wenn die Anzahl der Zeitperioden groß ist.[22]
Vergleich der Modelle
- Lineares Regressionsmodell zum Vergleich:
- Bei Fixed Effect-Modellen wird die gleiche Steigung unterstellt, aber Niveauunterschiede (Achsenabschnitte) zugelassen. Das Fixed Effect Modell geht davon, dass die β0j fixe Effekte sind, also als Parameter eines linearen Regressionsmodellen mit entsprechenden Dummyvariablen für die Gruppe j geschätzt werden können:
- Fixed Effect Modell: (z.B. mit der Bedingung )
- Random Effect Modelle
Bei Random Effect-Modellen werden unterschiedliche Steigungen zugelassen, aber ein gleichen Ausgangsniveau erzwungen. Im Random Intercept Modell sind die β0j fehlerbehaftete Größen (random effects). Der Fehler setzt sich dann aus zwei Komponenten zusammen: den inviduellen Fehlern und den Gruppenfehlern .
-
-
- Random Intercept Modell:
- Random Slope Modell:
-
Anwendung
werden im Rahmen der Mehrebenenanalyse und Paneldatenanalyse verwendet. Bei der Mehrebenenanalyse können die fixen Effekte z.B. Niveauunterschiede zwischen Ländern sein, in denen Informationen zu Personen vorliegen. Im Rahmen der Paneldatenanalyse können unterschiedliche Entwicklungen über die Zeit aufgrund von Drittvariablen kontrolliert werden.
Weblinks
- Fixed and random effects models
- Distinguishing Between Random and Fixed: Variables, Effects, and Coefficients
- How to Conduct a Meta-Analysis: Fixed and Random Effect Models
Literatur
- Joshua D. Angrist und Jörn-Steffen Pischke: Mostly Harmless Econometrics: An Empiricist's Companion, Princeton University Press, 2008
- A.Colin Cameron und Pravin K. Trivedi: Microeconometrics- Methods and Applications, Cambridge University Press, 2005, ISBN 0521848059, insb. Kapitel 21
- Ronald Christensen: Plane Answers to Complex Questions: The Theory of Linear Models, Third, New York: Springer 2002, ISBN 0-387-95361-2
- FAQ:What is the between estimator?. Abgerufen am 5. Oktober 2011.
- FAQ: Fixed-, between-, and random-effects and xtreg. Abgerufen am 5. Oktober 2011.
- Jeffrey M. Wooldridge: Econometric Analysis of Cross Section and Panel Data: Second Edition, Cambridge: MIT Press, 2002, insb. Kapitel 10
Einzelnachweise
- ↑ Cameron & Trivedi, 2005, S.698
- ↑ Es müssten schon alleine N*T verschiedene alphas geschätzt werden, und dazu noch N*T*K verschiedene betas.
- ↑ Cameron & Trivedi, 2005, S.699
- ↑ Cameron und Trivedi, 2005, S. 702
- ↑ Cameron & Trivedi, 2005, S. 700
- ↑ Wooldridge, 2002, S. 251
- ↑ Wooldridge, 2002, S. 251
- ↑ Cameron & Trivedi, 2005, S. 700
- ↑ Wooldridge, 2002, S. 257
- ↑ Wooldridge, 2002, S. 258
- ↑ Wooldridge, 2002, S. 258f.
- ↑ Wooldridge, 2002, S. 259
- ↑ Cameron & Trivedi, 2005, S.703
- ↑ Für die genaue Berechnung siehe Wooldridge, 2002, S. 260f.
- ↑ Cameron & Trivedi, 2005, S. 81f.
- ↑ Wooldridge, 2002, S. 260
- ↑ Für einen Überblick hierzu, siehe u.a. David Card: Estimating the Return to Schooling: Progress on Some Persistent Econometric Problems, Econometrica, 69.5, September 2001, S. 1127-1160
- ↑ Cameron & Trivedi, 2002, S. 702
- ↑ Cameron & Trivedi, 2005, S. 726
- ↑ Cameron & Trivedi, 2005, S.726
- ↑ Wooldridge, 2002, S. 269f.
- ↑ Cameron & Trivedi, 2005, S. 732f.
Kategorien:- Regressionsmodell
- Schätztheorie
- Regressionsanalyse
- Ökonometrie
Wikimedia Foundation.