- Lineare Modelle
-
Das Lineare Modell ist eines der am häufigsten untersuchten Modelle in der Statistik. Viele statistische Verfahren wie Mittelwertsvergleiche und varianzanalytische Verfahren, Korrelations- und Regressionsrechnung kann man als Spezialfälle linearer Modelle ansehen.
Inhaltsverzeichnis
Modellbeschreibung
Grundvoraussetzung für die Anwendung solcher Modelle in der statistischen Praxis ist die Annahme, dass ein linearer Zusammenhang zwischen den beobachteten Daten und den bekannten Einflussvariablen besteht. Die Methoden der Statistik (prominent ist vor allem die Methode der kleinsten Quadrate) liefern dann rein quantitative Resultate über den konkreten Zusammenhang zwischen Beobachtungen und Einflüssen.
Damit solche Modelle überhaupt statistisch beobachtet werden können, wird zusätzlich angenommen, dass die Daten nicht direkt beobachtet werden können, sondern mit Fehlern behaftet sind. Formal lassen sich allgemeine lineare Modelle dann durch Matrixgleichungen der Form
darstellen, dabei ist
der Vektor der abhängigen Variablen,
die Matrix der unabhängigen Variablen, auch Designmatrix genannt,
der Vektor der Gewichte der mit X beschriebenen Variablen sowie
der Vektor der Fehler bzw. Residuen.
Voraussetzungen
Die wesentliche Voraussetzung an das lineare Modell ist, dass es bis auf den Fehlerterm das „wirkliche“ Modell beschreibt. Dabei wird in der Regel nicht genau spezifiziert, von welcher Art der Fehler ist; er kann beispielsweise von zusätzlichen Faktoren oder Messfehlern herrühren. Jedoch nimmt man als Grundvoraussetzung an, dass dessen Erwartungswert (in allen Komponenten) 0 ist. Diese Annahme bedeutet, dass das Modell
grundsätzlich für korrekt gehalten wird und die beobachtete Abweichung als zufällig angesehen wird oder von vernachlässigbaren äußeren Einflüssen herrührt.
Über diese grundlegende Annahme hinaus sind grundsätzlich alle Verteilungsannahmen an erlaubt. Typisch ist die Annahme, dass die Komponenten des Vektors unkorreliert sind und dieselbe Varianz σ2 besitzen, wodurch sich mit Hilfe klassischer Verfahren wie der Methode der kleinsten Quadrate einfache Schätzer für und σ2 ergeben. Wird zudem vorausgesetzt, dass der Vektor multivariat normalverteilt ist, lässt sich ferner zeigen, dass die beiden Schätzer Lösungen der Maximum-Likelihood-Gleichungen sind. Im diesem Modell ist die Unabhängigkeit der Fehler dann gleichbedeutend mit der der yi.
In der Realität ergeben sich oft Situationen, in denen die Annahme der identisch normalverteilten und unabhängigen Fehler nicht haltbar ist. Dieser Fall liegt vor, wenn einige der unabhängigen Variablen und somit auch die Fehler teilweise korreliert sind. Diese notwendige Abweichung von der Annahme der Unabhängigkeit bringt erhebliche methodische Probleme mit sich, da einige der üblichen Schätzverfahren nicht mehr anwendbar sind.
Ziel
Mit Methoden der Regressionsanalyse lassen sich in vielen Fällen aus den Daten sinnvolle Schätzungen und Grenzwertsätze für herleiten. Ob tatsächlich ein linearer Zusammenhang zwischen und der Matrix besteht, wird dabei nicht untersucht. Lineare Modelle lassen sich immer „hinschreiben“, nur: Ob sie für den konkreten Fall wirklich geeignet sind, muss vorher theoretisch geklärt werden. In den meisten Fällen wird diese Untersuchung jedoch nicht vorgenommen – in bestimmten Situationen liegen überhaupt keine Informationen über die Struktur des Zusammenhangs vor, in anderen Situationen wird ein lineares Modell aufgrund der vergleichsweise einfachen mathematischen Behandlung gewählt.
Die Frage nach der Güte des linearen Zusammenhangs zwischen den beobachteten Daten und den Regressoren wird üblicherweise mit Hilfe des (korrigierten) Bestimmtheitsmaßes R2 beantwortet. Mit dessen Hilfe lässt sich klären, welcher Anteil der Variabilität im Modell durch die gewählten Regressoren erklärt werden kann. Ist dieses Maß klein, so werden üblicherweise weitere Regressoren hinzugenommen.
Varianten
Lineare Modelle lassen sich dahingehend erweitern, dass keine feste Designmatrix untersucht wird, sondern auch diese zufallsbehaftet ist. Die Untersuchungsmethoden ändern sich in diesem Fall nicht substantiell, werden aber deutlich komplizierter und damit rechenaufwendiger.
Sonstiges
Lineare statistische Modelle lassen sich bei entsprechender Umformung im Rahmen einer allgemein gültigen Regressionsgleichung darstellen. Entsprechend können aus der allgemeinen Form (neue) spezielle lineare Verfahren abgeleitet werden.
Literatur
- Andres, J.: Das allgemeine lineare Modell. In Edgar Erdfelder, Rainer Mausfeld, Thorsten Meiser & Georg Rudinger (Hrsg.), Handbuch quantitative Methoden, 1996 (S.185-200); Weinheim: Belz.
- Moosbrugger, H.: "Lineare Modelle: Regressions- und Varianzanalysen" (3. Auflage), 2002; Bern, Göttingen, Toronto, Seattle: Verlag Hans Huber
- Werner, J.: Lineare Statistik, 1997, Weinheim: Belz.
Weblinks
Wikimedia Foundation.