Mean squared error

Mean squared error
Zwei Schätzfunktionen: Die Wahl einer verzerrten Statistik kann hinsichtlich ihrer erwarteten Abweichung vom echten Wert gegenüber einer unverzerrten vorteilhaft sein.

Die mittlere quadratische Abweichung oder mittlerer quadratischer Fehler (engl. mean squared error und daher mit "MSE" abgekürzt) ist ein Begriff der mathematischen Statistik. Mit der mittleren quadratischen Abweichung kann die Abweichung eines Schätzers von dem zu schätzenden Wert (oder allgemeiner: von Funktionalen von ihnen) berechnet werden.

Inhaltsverzeichnis

Definition

Es seien X\; eine Zufallsvariable und f eine messbare Funktion. Wenn g geschätzt werden soll, dann ist die mittlere quadratische Abweichung eines Schätzers f(X)\; für g wie folgt definiert:

\mbox{MSE}(f,g) = E [ \| f(X) - g \|^2]\;

Im klassischen Falle reellwertiger Funktionen heißt das dann:

\mbox{MSE}(f,g)  = \mbox{Bias}^2(f(X))+ \mbox{Var}(f(X)). \;

Dabei ist die Verzerrung \mbox{Bias}(f(X)) := E[f(X) - g] \; und verschwindet also im Fall der Erwartungstreue (der MSE entspricht dann der Varianz).

Interpretation

Eine geringe mittlere quadratische Abweichung bedeutet im klassischen Fall, dass gleichzeitig Bias und Varianz des Schätzers klein sind. Man befindet sich mit dem Schätzer also im Mittel in der Nähe des zu schätzenden Funktionals (geringer Bias) und weiß gleichzeitig, dass die Schätzwerte wenig streuen (geringe Varianz) und mit großer Wahrscheinlichkeit auch in der Nähe ihres Erwartungswerts liegen.

Mit dem MSE ist es daher möglich, Schätzverfahren miteinander zu vergleichen. Die Idee ist, dass es vorteilhaft sein kann, einen leicht verzerrten Schätzer zu bevorzugen, der dafür eine wesentlich kleinere Varianz besitzt. Dabei gilt das Schätzverfahren mit dem kleineren MSE in der Regel als das bessere.

Problematisch ist, dass der MSE vom zu schätzenden, unbekannten Grundgesamtheitsparameter abhängt.

Beispiel

Ein typischer Fall ist die Schätzung des Mittelwerts einer Normalverteilung. Wir nehmen an, dass Zufallsvariablen X_1, \ldots X_n\; existieren, die jeweils normalverteilt mit unbekanntem Erwartungswert γ und Varianz 1 sind. Der klassische Schätzer ist das Stichprobenmittel \bar{X}_n. Hier ist die Verzerrung null:

\mbox{Bias}(\bar{X}_n) = 0

da der empirische Mittelwert erwartungstreu für γ ist. Da \bar{X}_n selbst normalverteilt mit Erwartungswert γ und Varianz \frac 1n ist, folgt

\mbox{MSE}(\bar{X}_n) = \frac 1n.

Ausweitung auf beliebige Verlustfunktionen

Eine Verallgemeinerung der mittleren quadratischen Abweichung ergibt sich, wenn man in der Definition an Stelle des quadratischen Abstandes von Schätzer und unbekanntem Funktional eine beliebige andere Funktion L\; ersetzt, die

  • symmetrisch ist,
  • Werte in \mathbb R^{+}_{0} besitzt und
  • in beiden Komponenten konvex ist.

Abbildungen dieser Art heißen Verlustfunktion, das Risiko eines Schätzers g\; ist dann definiert als

\mbox{R}_\vartheta(g) = E_{\vartheta}[L(g(X), \gamma (\vartheta))].


Wikimedia Foundation.

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Mean squared error — In statistics, the mean squared error (MSE) of an estimator is one of many ways to quantify the difference between values implied by a kernel density estimator and the true values of the quantity being estimated. MSE is a risk function,… …   Wikipedia

  • Mean percentage error — In statistics, the mean percentage error (MPE) is the computed average of percentage errors by which estimated forecasts differ from actual values of the quantity being forecast. Formula for mean percentage error calculation is: where at is the… …   Wikipedia

  • Mean absolute error — In statistics, the mean absolute error (MAE) is a quantity used to measure how close forecasts or predictions are to the eventual outcomes. The mean absolute error is given by As the name suggests, the mean absolute error is an average of the… …   Wikipedia

  • Mean squared prediction error — In statistics the mean squared prediction error of a smoothing procedure is the expected sum of squared deviations of the fitted values from the (unobservable) function g. If the smoothing procedure has operator matrix L, then The MSPE can be… …   Wikipedia

  • Mean integrated squared error — In statistics, the mean integrated squared error (MISE) is used in density estimation. The MISE of an estimate of an unknown probability density is given by where ƒ is the unknown density, ƒn is its estimate based on a sample of n iid random… …   Wikipedia

  • Minimum mean square error — In statistics and signal processing, a minimum mean square error (MMSE) estimator describes the approach which minimizes the mean square error (MSE), which is a common measure of estimator quality. The term MMSE specifically refers to estimation… …   Wikipedia

  • Mean absolute scaled error — In statistics, the mean absolute scaled error (MASE) is a measure of the accuracy of forecasts . It was proposed in 2006 by Australian statistician Rob Hyndman, who described it as a generally applicable measurement of forecast accuracy without… …   Wikipedia

  • Mean square quantization error — (MSQE) is a figure of merit for the process of analog to digital conversion. As the input is varied, the input s value is recorded when the digital output changes. For each digital output, the input s difference from ideal is normalized to the… …   Wikipedia

  • Mean — This article is about the statistical concept. For other uses, see Mean (disambiguation). In statistics, mean has two related meanings: the arithmetic mean (and is distinguished from the geometric mean or harmonic mean). the expected value of a… …   Wikipedia

  • Root mean square deviation — The root mean square deviation (RMSD) ( also root mean square error (RMSE) ) is a frequently used measure of the differences between values predicted by a model or an estimator and the values actually observed from the thing being modeled or… …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”