Instrumentvariable

Instrumentvariable

Die Methode der Instrumentenvariablen (IV, Instrument) ist ein Oberbegriff für bestimmte Schätzverfahren in der schließenden Statistik. Sie zählt zur Familie der GMM-Schätzer (en:Generalized method of moments), eine Verallgemeinerung der Momentenmethode, die 1982 von Hansen vorgeschlagen wurde.

Ziel der IV-Methode ist es, bei einer Regressionsanalyse eine zwischen dem Fehlerterm und den erklärenden Variablen auftretende Korrelation zumindest asymptotisch zu eliminieren, indem man die erklärenden Variablen durch andere Größen ersetzt, die zwar in engem Zusammenhang mit ihnen stehen, aber nicht mit dem Fehlerterm korrelieren oder eine Linearkombination anderer erklärender Variablen darstellen.

Inhaltsverzeichnis

Idee

In vielen Situationen, in denen kausale Effekte untersucht und quantifiziert werden sollen, besteht eine Korrelation zwischen dem Fehlerterm und der erklärenden Variable. Möchte man zum Beispiel den Effekt von Bildung (X) auf das Arbeitseinkommen einer Person (Y) untersuchen, so könnte man zum Beispiel ein Modell folgender Art schätzen:

yi = α + βxi + ui, wobei u einen Fehlerterm darstellt.

Eine Möglichkeit zur Schätzung von β wäre die Methode der kleinsten Quadrate. Diese beruht jedoch auf mehreren Annahmen, unter anderem darauf, dass der Fehlerterm und die erklärende Variable unkorreliert sind. Dies ist jedoch im genannten Beispiel sehr unwahrscheinlich. Es lassen sich leicht viele Variablen ermitteln, die nicht im Modell auftauchen, allerdings sowohl einen Effekt auf Bildung, als auch auf das Einkommen haben. Manche dieser Variablen sind obendrein kaum oder gar nicht messbar und können deswegen auch nicht als Kontrollvariablen mit in das Modell aufgenommen werden. So ist zum Beispiel der Fleiß einer Person mit großer Wahrscheinlichkeit sowohl mit dem Bildungsgrad dieser Person, als auch mit ihrem Einkommen korreliert; da der Fleiß auch nicht messbar ist und deswegen im Fehlerterm verbleibt, wird somit eben jene Korrelation zwischen der erklärenden Variable und dem Fehlerterm bestehen, die für die Validität der Methode der Kleinsten Quadrate nicht bestehen darf. In einem solchen Fall besteht ein Problem aufgrund ausgelassener Variablen (omitted variables), und der KQ-Schätzer wird inkonsistent sein. Die Korrelation zwischen dem Fehlerterm und den erklärenden Variablen wird als Endogenität bezeichnet. Neben ausgelassenen Variablen kann dieses Problem auch entstehen, wenn die Variablen nicht genau, sondern nur mit Messfehler gemessen werden können und wenn eine beidseitige, simultane Kausalität besteht (x hat einen kausalen Effekt auf y, y hat einen kausalen Effekt auf x). Weitere Ansätze zur Lösung von Endogenitätsproblemen sind Regressions-Diskontinuitäts-Analyse, Paneldaten und darauf aufbauende Schätzmethoden sowie das klassische Experiment.

Mathematischer Hintergrund

Für den Kleinste-Quadrate-Schätzer gilt (im bivariaten Regressionsmodell mit einer erklärenden Variable):

 \widehat{\beta}_\mathrm{OLS} = \frac{\sum_i x_i y_i}{\sum_i x_i^2} = \frac{\sum_i x_i (x_i \beta + \epsilon_i)}{\sum_i x_i^2} =
\beta + \frac{\sum_i x_i \epsilon_i}{\sum_i x_i^2}.

Wenn x und ε nicht korreliert sind, geht der zweite Term bei unendlich vielen Beobachtungen gegen Null und der Schätzer ist konsistent. Wenn x und ε korreliert sind, ist der Schätzer inkonsistent.

Eine Instrumentvariable ist mit der erklärenden Variable, aber nicht mit dem Fehlerterm korreliert. Der Schätzer lautet:

 \widehat{\beta}_\mathrm{IV} = \frac{\sum_i z_i y_i}{\sum_i z_i x_i} = \frac{\sum_i z_i (x_i \beta + \epsilon_i)}{\sum_i z_i x_i} = \beta + \frac{\sum_i z_i \epsilon_i}{\sum_i z_i x_i}.

Wenn z und ε nicht korreliert sind, verschwindet der letzte Term und führt zu einem konsistenten Schätzer. Beachte: Ist x nicht mit dem Fehlerterm korreliert, ist x selbst eine Instrumentenvariable. In diesem Fall ist der KQ-Schätzer mit dem IV-Schätzer identisch.

Der Ansatz oben kann leicht zu einer Regression mit mehreren erklärenden Variablen verallgemeinert werden. X sei eine T x K Matrix von erklärenden Variablen, die aus T Beobachtungen von K Variablen resultiert. Z sei eine T x K Matrix von Instrumentvariablen. Dann folgt

 \widehat{\beta}_\mathrm{IV} = (Z'X)^{-1}Z'Y = (Z'X)^{-1}Z'(X\beta+\epsilon) = \beta + (Z'X)^{-1}Z'\epsilon.

Diese Technik wird häufig mittels two-stage least-squares (2SLS) implementiert. Im ersten Schritt des 2SLS-Ansatzes wird jede endogene erklärende Variable auf alle gültigen Instrumente sowie alle exogenen Variablen regressiert. Da die Instrumente exogen sind, wird diese Approximation der endogenen Variablen nicht mit dem Fehlerterm korrelieren.

Intuitiv: Es wird die Beziehung zwischen y und den endogenen erklärenden Variablen untersucht. Im zweiten Schritt wird die interessierende Regression wie gewohnt geschätzt, aber alle endogenen erklärenden Variablen werden durch die Näherungswerte aus Schritt 1 ersetzt

Der so gewonnene Schätzer ist konsistent. Damit die Standardfehler richtig berechnet werden, muss nun nur noch die Summe der quadrierten Fehlerterme korrigiert werden

Schritt 1: \widehat{X}= Z(Z'Z)^{-1}Z'X
Schritt 2: \widehat{B}_\mathrm{IV} = (\widehat{X}'\widehat{X})^{-1}\widehat{X}'Y

Mögliche Probleme

Ein grundlegendes Problem ist es, ein gültiges Instrument zu finden, also eine Variable, die außer über die exogene Variable nicht mit der erklärenden Variable korreliert ist. Schwierig ist hierbei vor allem, dass diese Annahme nicht auf Basis der vorhandenen Daten statistisch getestet werden kann. Darüber hinaus sind Schätzer auf Basis von gültigen Instrumentvariablen zwar konsistent, aber in der Regel nicht unverzerrt, sodass größere Stichproben benötigt werden[1]. Ein weiteres Problem tritt auf, wenn die Instrumente nur schwach mit der/den endogenen Variable(n) korreliert sind (weak instrument). Als Faustregel gilt, dass bei einer endogenen Variable die F-Statistik der Regression in Schritt 1 größer als 10 sein sollte.

Geschichte

Während Instrumentvariablen heutzutage vor allem in Situationen mit ausgelassenen Variablen angewandt werden, wurden sie historisch zunächst als Lösung für Probleme aufgrund von Gleichzeitigkeit benutzt. Bei der Schätzung von Angebots- und Nachfragekurgen zum Beispiel ergibt sich das Problem, dass als Datenpunkte nur Gleichgewichtspreise- und mengen bereitstehen, also Mengen, bei denen Angebot und Nachfrage aufeinander abgestimmt sind [2].Der amerikanische Ökonom Philip G. Wright veröffentlichte 1928 ein Buch unter dem Titel The Tariff on Animal and Vegetable Oils. In einem der Anhänge zu diesem Buch stellte Wright eine Methode dar, mit der die Nachfrage- und Angebotselatizitäten von Butter und Leinsamöl geschätzt werden können. Dies gilt als die erste Studie, die den Instrumentalvariablenansatz benutzte.[3] Als zweites Anwendungsgebiet von Instrumentvariablen wurde danach entdeckt, dass sie auch Probleme aufgrund von Messfehlern bereinigen können. Die heute verbreitete Anwendung zur Lösung von Verzerrungen aufgrund ausgelassener Variablen kam zeitlich gesehen als letztes Anwendungsfeld für Instrumentvariablen hinzu.[4].

Literatur

Lehrbücher und Übersichtsartikel

  • Ahn, Seung C.; Schmidt, Peter: Efficient estimation of models for dynamic panel data. in: Journal of Econometrics, Vol. 68, Iss. 1, 1995, Seite 5-27.
  • Angrist, Joshua D./Pischke, Jörn-Steffen: Mostly Harmless Econometrics:An Empiricist's Companion, Princeton University Press, 2008
  • Angrist, Joshua D./Krueger, Alan B.: „Instrumental Variables and the Search for Identification: From Supply and Demand to Natural Experiments“, Journal of Economic Perspectives, Volume 15, Number 4, Herbst 2001, S.69–85
  • Eckey, Hans-Friedrich/Kosfeld, Reinhold/Dreger, Christian: Ökonometrie. 3., überarb. und erw. Aufl., Wiesbaden: Gabler, 2004.
  • Greene, William H.: Econometric Analysis. 5. Aufl., Upper Saddle River, NJ: Prentice Hall, 2003.
  • Stock, James H./Watson, Mark W.:Introduction to Econometrics. 2.Auflage, Pearson Education, 2007
  • Verbeek, Marno (2004): A Guide to Modern Econometrics: 2. Aufl., Chichester: John Wiley & Sons, 2004.
  • Wooldridge, Jeffrey M. (2002): Econometric Analysis of Cross Section and Panel Data, Cambridge, Mass. [u.a.] : MIT Press, 2002.

Beispiele für Studien auf Basis von Instrumentvariablen

  • Acemoglu, Daron/Johnson, Simon/Robinson, James A.: „The Colonial Origins of Comparative Development: An Empirical Investigation“, American Economic Review, December 2001, S. 1369-1401
  • Angrist, Joshua D./Krueger, Alan B.: „Does Compulsory School Attendance Affect Schooling and Earnings?“, Quarterly Journal of Economics, 1991, Vol. 106, S. 979-1014
  • Levitt, Steven D.: „The Effect of Prison Population Size on Crime Rates: Evidence from Prison Overcrowding Litigation“ Quarterly Journal of Economics, 1996, Vol. 111, No. 2, S.319–51.

Anmerkungen

  1. Angrist & Krueger, 2001, S.71
  2. Angrist & Krueger, 2001, S. 69
  3. Stock & Watson, S. 425
  4. Angrist & Krueger, 2001, S.71f.

Wikimedia Foundation.

Игры ⚽ Нужен реферат?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Endogen — (griech. im Inneren erzeugt) bedeutet, dass etwas aus inneren Ursachen entsteht oder aus dem Inneren eines Systems heraus nach innen oder außen wirkt. Das Gegenteil ist exogen. Diese Begriffe finden in verschiedenen Wissenschaften Verwendung: Die …   Deutsch Wikipedia

  • Endogenisierung — endogen (griech. im Inneren erzeugt) bedeutet, dass etwas aus inneren Ursachen entsteht oder aus dem Inneren eines Systems heraus nach innen oder außen wirkt. Das Gegenteil ist exogen. Diese Begriffe finden in verschiedenen Wissenschaften… …   Deutsch Wikipedia

  • I.V. — Die Abkürzung IV steht für: Individualverkehr: eine in der Verkehrsplanung gängige Abkürzung Industriellenvereinigung, österreichische Interessenvertretung von Industriellen in Österreich Informationsverarbeitung, siehe Datenverarbeitung… …   Deutsch Wikipedia

  • I. V. — Die Abkürzung IV steht für: Individualverkehr: eine in der Verkehrsplanung gängige Abkürzung Industriellenvereinigung, österreichische Interessenvertretung von Industriellen in Österreich Informationsverarbeitung, siehe Datenverarbeitung… …   Deutsch Wikipedia

  • Instrumentarium — Instrument, und teils analog der Sammelbegriff Instrumentarium, steht: allgemein, im technischen und übertragenen Sinne, für ein Werkzeug für Musikinstrument, ein Gerät zur Erzeugung von Klängen für ein Anzeigeinstrument, siehe Anzeige (Technik)… …   Deutsch Wikipedia

  • Iv — Die Abkürzung IV steht für: Individualverkehr: eine in der Verkehrsplanung gängige Abkürzung Industriellenvereinigung, österreichische Interessenvertretung von Industriellen in Österreich Informationsverarbeitung, siehe Datenverarbeitung… …   Deutsch Wikipedia

  • Fixed-Effects-Modell — Inhaltsverzeichnis 1 Abgrenzung statische und dynamische Modelle 2 Schätzverfahren in den statischen Modellen 3 Schätzverfahren in den dynamischen Modellen 4 Literatur // …   Deutsch Wikipedia

  • IV — ist die Abkürzung für: Individualverkehr, eine in der Verkehrsplanung gängige Abkürzung Industriellenvereinigung, österreichische Interessenvertretung von Industriellen in Österreich Informationsverarbeitung, siehe Datenverarbeitung… …   Deutsch Wikipedia

  • Instrument — Instrument, und teils analog der Sammelbegriff Instrumentarium, steht: allgemein, im technischen und übertragenen Sinne, für ein Werkzeug für Musikinstrument, ein Gerät zur Erzeugung von Klängen für anzeigende Messgeräte, siehe Anzeige (Technik)… …   Deutsch Wikipedia

  • Instrumentenvariable — Die Methode der Instrumentenvariablen (IV, Instrument) ist ein Oberbegriff für bestimmte Schätzverfahren in der schließenden Statistik. Sie zählt zur Familie der GMM Schätzer (en:Generalized method of moments), eine Verallgemeinerung der… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”