Generalisierte Lineare Modelle

Generalisierte Lineare Modelle (GLM, auch Verallgemeinerte lineare Modelle) sind eine 1972 von John Nelder und Robert Wedderburn eingeführte Verallgemeinerung der klassischen linearen Modelle.^[1] Während man in linearen Modellen annimmt, dass die Zielvariable normalverteilt ist, kann sie in GLMs eine Verteilung aus der Klasse der exponentiellen Familien besitzen. Diese Verteilungsklasse beinhaltet neben der Normalverteilung auch die Binomial-, Poisson-, Gamma- und inverse Gaußverteilung.

Modellkomponenten

Die GLMs bestehen aus drei Komponenten:

Zufallskomponente: Wie bei den klassischen linearen Modellen ist man an einem Response $\underline{Y}=(Y_1,\ldots,Y_n)^T$ und einem unabhängigen Kovariablenvektoren $\underline{X}_k=(x_{1k},x_{2k},\ldots,x_{nk})^T$ , wobei $k=1,\ldots,p$ , interessiert. Hierbei sind die $Y i$ unabhängig und besitzen eine Verteilung aus der exponentiellen Familie.

Systematische Komponente: Gegeben sind Kovariablenvektoren $\underline{x}_1,\ldots,\underline{x}_p \in \mathbb{R}^{n \times 1}$ , welche die Verteilung von $\underline{Y}$ nur durch eine lineare Funktion beeinflussen. Diese lineare Funktion heißt Linearer Prädiktor und ist in folgender Form gegeben:

$\underline{\eta}:=\beta_0^T+\beta_1^T \underline{X}_1+\cdots+\beta_p^T\underline{X}_p=\underline{\beta}^T\underline{X}.$ Hier erkennt man, dass der lineare Prädiktor die Regressionsparameter $\underline{\beta}=(\beta_0,\ldots, \beta_p)^T$ in das Modell miteinführt.

Parametrische Link-Komponente: Der Erwartungsvektor $\underline{\mu}=(\mu_1,\ldots,\mu_n)^T$ ist eine differenzierbare, monotone und damit invertierbare Funktion von dem linearen Prädiktor $\underline{\eta}$ . Dabei wird der Erwartungswert $\underline{\mu}$ über eine Responsefunktion $m$ mit dem linearen Prädiktor $\underline{\eta}$ verknüpft:

$\underline{\mu}=m(\underline{\eta}) , \quad \underline{\eta}=m^{-1}(\underline{\mu})=:g(\underline{\mu})$ , wobei $g: \mathbb{R} \rightarrow \mathbb{R}$ als Linkfunktion bezeichnet wird.

Exponentielle Familie

Die Verteilung einer Zielvariablen gehört zur exponentiellen Familie, wenn sich die Dichtefunktion bzw. Wahrscheinlichkeitsfunktion in folgender Form schreiben lässt:

$f(y,\theta,\psi)=\exp\left(\frac{y\theta-b(\theta)}{a(\psi)}+c(y,\psi)\right)$

Für alle Verteilungen der exponentiellen Familie gilt:

$E(Y) = \mu = b^\prime(\theta)$
$Var(Y) = \sigma^2 = b^{\prime\prime}(\theta)a(\psi)$

Beispiele für Verteilungen, die zur exponentiellen Familie gehören:

Verteilung $E (Y) = μ$	$θ$	$ψ$	$a (ψ)$	$b (θ)$	$c (y,ψ)$	$f (y)$
Normalverteilung	$μ$	$σ$	$ψ 2$	$\frac{\theta^2}{2}$	$\frac{-y^2}{2\psi}-\log\left(\sqrt{2\pi\psi}\right)$	$\frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(y-\mu)^2}{2\sigma^2}\right)$
Bernoulli-Verteilung	$\log\left(\frac{\mu}{1-\mu}\right)$	$-$	$1$	$log(1 + e θ)$	$0$	$\mu^y(1-\mu)^{1-y}\,$ mit $y = 0 oder 1$
Binomialverteilung	$\log\left(\frac{\mu}{n-\mu}\right)$	$-$	$1$	$n log(1 + e θ)$	$\log\binom{n}{y}$	$\binom{n}{y}\left(\frac{\mu}{n}\right)^y\left(1-\frac{\mu}{n}\right)^{n-y}\,$ mit $y = 0,1,..., n$
Poisson-Verteilung	$log(μ)$	$-$	$1$	$exp(θ)$	$- log(y!)$	$\frac{\mu^y}{y!} \exp(-\mu)$ mit $y = 0,1,...$

Belege

↑ Robert Wedderburn: Generalized Linear Models. In: Journal of the Royal Statistical Society. Series A (General). 135, Nr. 3, 1972, S. 370–384, S. 370.

Kategorie:

Regressionsmodell

Wikimedia Foundation.

Игры ⚽ Нужно решить контрольную?

Schlagen Sie auch in anderen Wörterbüchern nach:

Verallgemeinerte Lineare Modelle — Generalisierte Lineare Modelle (GLM) stellen eine Verallgemeinerung der klassischen linearen Modelle dar. Während man in linearen Modellen annimmt, dass die Zielvariable normalverteilt ist, kann sie in GLMs eine Verteilung aus der Klasse der… … Deutsch Wikipedia
Lineare Regressionsanalyse — Die Regressionsanalyse ist ein statistisches Analyseverfahren. Ziel ist es, Beziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen festzustellen. Allgemein wird eine metrische Variable Y betrachtet, die von einer… … Deutsch Wikipedia
Lineare Regression — Die lineare Regression ist ein Spezialfall des allgemeinen Konzepts der Regressionsanalyse, mit der versucht wird, eine abhängige Variable durch eine oder mehrere unabhängige Variablen zu erklären das Beiwort linear ergibt sich dabei daraus, dass … Deutsch Wikipedia
Generalisiertes lineares Modell — Generalisierte Lineare Modelle (GLM) stellen eine Verallgemeinerung der klassischen linearen Modelle dar. Während man in linearen Modellen annimmt, dass die Zielvariable normalverteilt ist, kann sie in GLMs eine Verteilung aus der Klasse der… … Deutsch Wikipedia
Verallgemeinertes lineares Modell — Generalisierte Lineare Modelle (GLM) stellen eine Verallgemeinerung der klassischen linearen Modelle dar. Während man in linearen Modellen annimmt, dass die Zielvariable normalverteilt ist, kann sie in GLMs eine Verteilung aus der Klasse der… … Deutsch Wikipedia
Regressionsanalyse — Die Regressionsanalyse ist eine Sammlung von statistischen Analyseverfahren. Ziel bei den am häufigsten eingesetzten Analyseverfahren ist es, Beziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen festzustellen. Sie… … Deutsch Wikipedia
Einfachregression — Die Regressionsanalyse ist ein statistisches Analyseverfahren. Ziel ist es, Beziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen festzustellen. Allgemein wird eine metrische Variable Y betrachtet, die von einer… … Deutsch Wikipedia
Multiple Regression — Die Regressionsanalyse ist ein statistisches Analyseverfahren. Ziel ist es, Beziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen festzustellen. Allgemein wird eine metrische Variable Y betrachtet, die von einer… … Deutsch Wikipedia
OLS-Regression — Die Regressionsanalyse ist ein statistisches Analyseverfahren. Ziel ist es, Beziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen festzustellen. Allgemein wird eine metrische Variable Y betrachtet, die von einer… … Deutsch Wikipedia
Ordinary Least Squares — Die Regressionsanalyse ist ein statistisches Analyseverfahren. Ziel ist es, Beziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen festzustellen. Allgemein wird eine metrische Variable Y betrachtet, die von einer… … Deutsch Wikipedia

Academic dictionaries and encyclopedias

Generalisierte Lineare Modelle

Modellkomponenten

Exponentielle Familie

Belege

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Academic dictionaries and encyclopedias

Deutsch Wikipedia

Generalisierte Lineare Modelle

Modellkomponenten

Exponentielle Familie

Belege

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Direct link