Generalisierte Lineare Modelle

Generalisierte Lineare Modelle

Generalisierte Lineare Modelle (GLM, auch Verallgemeinerte lineare Modelle) sind eine 1972 von John Nelder und Robert Wedderburn eingeführte Verallgemeinerung der klassischen linearen Modelle.[1] Während man in linearen Modellen annimmt, dass die Zielvariable normalverteilt ist, kann sie in GLMs eine Verteilung aus der Klasse der exponentiellen Familien besitzen. Diese Verteilungsklasse beinhaltet neben der Normalverteilung auch die Binomial-, Poisson-, Gamma- und inverse Gaußverteilung.

Modellkomponenten

Die GLMs bestehen aus drei Komponenten:

  • Zufallskomponente: Wie bei den klassischen linearen Modellen ist man an einem Response \underline{Y}=(Y_1,\ldots,Y_n)^T und einem unabhängigen Kovariablenvektoren \underline{X}_k=(x_{1k},x_{2k},\ldots,x_{nk})^T, wobei k=1,\ldots,p, interessiert. Hierbei sind die Yi unabhängig und besitzen eine Verteilung aus der exponentiellen Familie.
  • Systematische Komponente: Gegeben sind Kovariablenvektoren \underline{x}_1,\ldots,\underline{x}_p \in \mathbb{R}^{n \times 1}, welche die Verteilung von \underline{Y} nur durch eine lineare Funktion beeinflussen. Diese lineare Funktion heißt Linearer Prädiktor und ist in folgender Form gegeben:
\underline{\eta}:=\beta_0^T+\beta_1^T \underline{X}_1+\cdots+\beta_p^T\underline{X}_p=\underline{\beta}^T\underline{X}. Hier erkennt man, dass der lineare Prädiktor die Regressionsparameter \underline{\beta}=(\beta_0,\ldots, \beta_p)^T in das Modell miteinführt.
  • Parametrische Link-Komponente: Der Erwartungsvektor \underline{\mu}=(\mu_1,\ldots,\mu_n)^T ist eine differenzierbare, monotone und damit invertierbare Funktion von dem linearen Prädiktor \underline{\eta}. Dabei wird der Erwartungswert \underline{\mu} über eine Responsefunktion m mit dem linearen Prädiktor \underline{\eta} verknüpft:
\underline{\mu}=m(\underline{\eta}) , \quad \underline{\eta}=m^{-1}(\underline{\mu})=:g(\underline{\mu}), wobei g: \mathbb{R} \rightarrow \mathbb{R} als Linkfunktion bezeichnet wird.

Exponentielle Familie

Die Verteilung einer Zielvariablen gehört zur exponentiellen Familie, wenn sich die Dichtefunktion bzw. Wahrscheinlichkeitsfunktion in folgender Form schreiben lässt:

f(y,\theta,\psi)=\exp\left(\frac{y\theta-b(\theta)}{a(\psi)}+c(y,\psi)\right)

Für alle Verteilungen der exponentiellen Familie gilt:

  1. E(Y) = \mu = b^\prime(\theta)
  2. Var(Y) = \sigma^2 = b^{\prime\prime}(\theta)a(\psi)

Beispiele für Verteilungen, die zur exponentiellen Familie gehören:

Verteilung
E(Y) = μ
θ ψ a(ψ) b(θ) c(y,ψ) f(y)
Normalverteilung μ σ ψ2 \frac{\theta^2}{2} \frac{-y^2}{2\psi}-\log\left(\sqrt{2\pi\psi}\right) \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(y-\mu)^2}{2\sigma^2}\right)
Bernoulli-Verteilung \log\left(\frac{\mu}{1-\mu}\right) 1 log(1 + eθ) 0 \mu^y(1-\mu)^{1-y}\,
mit y = 0 oder 1
Binomialverteilung \log\left(\frac{\mu}{n-\mu}\right) 1 nlog(1 + eθ) \log\binom{n}{y} \binom{n}{y}\left(\frac{\mu}{n}\right)^y\left(1-\frac{\mu}{n}\right)^{n-y}\,
mit y = 0,1,...,n
Poisson-Verteilung log(μ) 1 exp(θ) − log(y!) \frac{\mu^y}{y!} \exp(-\mu)
mit y = 0,1,...

Belege

  1. Robert Wedderburn: Generalized Linear Models. In: Journal of the Royal Statistical Society. Series A (General). 135, Nr. 3, 1972, S. 370–384, S. 370.

Wikimedia Foundation.

Игры ⚽ Нужно сделать НИР?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Verallgemeinerte Lineare Modelle — Generalisierte Lineare Modelle (GLM) stellen eine Verallgemeinerung der klassischen linearen Modelle dar. Während man in linearen Modellen annimmt, dass die Zielvariable normalverteilt ist, kann sie in GLMs eine Verteilung aus der Klasse der… …   Deutsch Wikipedia

  • Lineare Regressionsanalyse — Die Regressionsanalyse ist ein statistisches Analyseverfahren. Ziel ist es, Beziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen festzustellen. Allgemein wird eine metrische Variable Y betrachtet, die von einer… …   Deutsch Wikipedia

  • Lineare Regression — Die lineare Regression ist ein Spezialfall des allgemeinen Konzepts der Regressionsanalyse, mit der versucht wird, eine abhängige Variable durch eine oder mehrere unabhängige Variablen zu erklären das Beiwort linear ergibt sich dabei daraus, dass …   Deutsch Wikipedia

  • Generalisiertes lineares Modell — Generalisierte Lineare Modelle (GLM) stellen eine Verallgemeinerung der klassischen linearen Modelle dar. Während man in linearen Modellen annimmt, dass die Zielvariable normalverteilt ist, kann sie in GLMs eine Verteilung aus der Klasse der… …   Deutsch Wikipedia

  • Verallgemeinertes lineares Modell — Generalisierte Lineare Modelle (GLM) stellen eine Verallgemeinerung der klassischen linearen Modelle dar. Während man in linearen Modellen annimmt, dass die Zielvariable normalverteilt ist, kann sie in GLMs eine Verteilung aus der Klasse der… …   Deutsch Wikipedia

  • Regressionsanalyse — Die Regressionsanalyse ist eine Sammlung von statistischen Analyseverfahren. Ziel bei den am häufigsten eingesetzten Analyseverfahren ist es, Beziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen festzustellen. Sie… …   Deutsch Wikipedia

  • Einfachregression — Die Regressionsanalyse ist ein statistisches Analyseverfahren. Ziel ist es, Beziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen festzustellen. Allgemein wird eine metrische Variable Y betrachtet, die von einer… …   Deutsch Wikipedia

  • Multiple Regression — Die Regressionsanalyse ist ein statistisches Analyseverfahren. Ziel ist es, Beziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen festzustellen. Allgemein wird eine metrische Variable Y betrachtet, die von einer… …   Deutsch Wikipedia

  • OLS-Regression — Die Regressionsanalyse ist ein statistisches Analyseverfahren. Ziel ist es, Beziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen festzustellen. Allgemein wird eine metrische Variable Y betrachtet, die von einer… …   Deutsch Wikipedia

  • Ordinary Least Squares — Die Regressionsanalyse ist ein statistisches Analyseverfahren. Ziel ist es, Beziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen festzustellen. Allgemein wird eine metrische Variable Y betrachtet, die von einer… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”