Stichprobenfehler

Stichprobenfehler

Der Standardfehler oder Stichprobenfehler (selten Schätzfehler) ist ein Streuungsmaß für eine Stichprobenverteilung. Der Standardfehler des Mittelwertes ist definiert als die Wurzel aus der Varianz der Verteilung der Stichproben-Mittelwerte von gleichgroßen Stichproben aus einer gegebenen Grundgesamtheit. Bezeichnen n die Größe der Stichprobe und σ2 die Varianz der Grundgesamtheit, so ist der Standardfehler durch folgende Formel gegeben:

\sigma_{\bar x}=\frac{\sigma}{\sqrt n}.

Herleitung der Formel

Der Mittelwert einer Stichprobe vom Umfang n ist definiert durch

\overline x = \frac1n\sum_{i=1}^nx_i.

Betrachtet man diesen als Zufallsvariable \overline{X}, so ist der Standardfehler definiert als die Wurzel aus deren Varianz, also aus

\sigma_{\overline{x}}^2 := \operatorname{Var}\left(\overline X\right) = E\left(\left(\overline{X}-\mu\right)^2\right),

wobei μ den (in der Regel unbekannten) Mittelwert der Grundgesamtheit bezeichnet. Der Standardfehler ist also

\sigma_{\overline{x}} = \sqrt{E\left(\overline{X}^2-2\mu\overline{X}+\mu^2\right)} = \sqrt{E\left(\overline{X}^2\right)-\mu^2}.

Mit einige Zeilen Rechnung

\begin{align} E\left(\overline X^2\right) &= E\left(\frac1{n^2}\left(\sum_{i=1}^nX_i\right)^2\right) = 
  E\left(\frac1{n^2}\sum_{i=1}^nX_i^2+\frac2{n^2}\sum_{1\le i<j\le n}X_iX_j\right) = \\
  &=\frac1{n^2}\sum_{i=1}^nE(X_i^2) + \frac2{n^2}\sum_{1\le i<j\le n}E(X_i)\,E(X_j) = \\
  &= \frac1n(\sigma^2+\mu^2) + \frac2{n^2}\cdot\frac{n(n-1)}{2}\,\mu^2 = \frac{\sigma^2}n+\mu^2
\end{align}

folgt dann die obige Formel für den Standardfehler.

Interpretation und Beispiele

Der Standardfehler liefert so eine Aussage über die Güte des ermittelten Mittelwertes. Je mehr Einzelwerte es gibt, desto robuster ist der Mittelwert und desto kleiner der Standardfehler. Der Standardfehler findet zum Beispiel Anwendung bei der Messung von Naturkonstanten (Lichtgeschwindigkeit, Bindungskonstanten von Enzymen, o. ä.). Wenn hier bei mehreren Messungen unterschiedliche Ergebnisse ermittelt werden, variiert nicht die Naturkonstante, sondern die Abweichungen werden durch Messfehler verursacht, das heißt Ungenauigkeiten des Messgerätes. Misst man häufiger, nähert man sich dem wahren Mittelwert an.

Im Gegensatz dazu bildet die Standardabweichung die in einer Population (= Grundgesamtheit) tatsächlich vorhandene Streuung ab, die auch bei höchster Messgenauigkeit und unendlich vielen Einzelmessungen vorhanden ist (z. B. bei Gewichtsverteilung, Größenverteilung, Monatseinkommen). Sie zeigt ob die Einzelwerte nahe beieinander liegen oder eine starke Spreizung der Daten vorliegt.

Beispiel: Angenommen, man untersucht die Population von Kindern, die Gymnasien besuchen, hinsichtlich ihrer Intelligenzleistung. Wenn nun zufällig aus dieser Population eine Stichprobe des Umfanges n (also mit n Kindern) gezogen wird, dann kann man aus allen n Messergebnissen den Mittelwert berechnen. Wenn nun nach dieser Stichprobe noch eine weitere, zufällig gezogene Stichprobe mit der gleichen Anzahl von n Kinder gezogen und deren Mittelwert ermittelt wird, so werden die beiden Mittelwerte nicht exakt übereinstimmen. Zieht man noch eine Vielzahl weiterer zufälliger Stichproben des Umfanges n, dann kann die Streuung aller empirisch ermittelten Mittelwerte um den Populationsmittelwert ermittelt werden. Diese Streuung ist der Standardfehler. Da der Mittelwert der Stichprobenmittelwerte der beste Schätzer für den Populationsmittelwert ist, entspricht der Standardfehler der Streuung der empirischen Mittelwerte um den Populationsmittelwert. Er bildet nicht die Intelligenzstreuung der Kinder, sondern die Genauigkeit des errechneten Mittelwerts ab.

Für den Standardfehler des Stichprobenmittelwertes benutzt man meist die Bezeichnungen

\sigma_n := \sigma_{\bar x} = \frac{\sigma}{\sqrt{n}},

um zu verdeutlichen, dass es sich um die Streuung der Mittelwerte von Stichproben handelt. Hierbei ist der Stichprobenumfang n in der Regel bekannt, während die Standardabweichung σ in der Regel unbekannt ist; als Schätzwert für σ benutzt man meist die Wurzel der Stichprobenvarianz.

Für  n \to \infty nähert sich die standardisierte Verteilung der Mittelwerte nach dem zentralen Grenzwertsatz einer Normalverteilung an. In der Praxis ist n > 30 meist ausreichend.

Der Standardfehler macht die gemessene Streuung (Standardabweichung) von zwei Datensätzen mit unterschiedlichen Stichprobenumfang vergleichbar, indem er die Standardabweichung auf den Stichprobenumfang normiert.

Bestimmung des Standardfehlers bei einigen bestimmten Verteilungen

Bei der Binomialverteilung zum Parameter p wird der Standardfehler wie folgt berechnet:

\sigma_{\bar x,\mathrm{binom}} = \frac{\sqrt{ p (1-p)n}}{\sqrt n} = \sqrt{p(1-p)}.

Exponentialverteilung zum Parameter λ (Erwartungswert = Standardabweichung = 1 / λ):

\sigma_{\bar x,\mathrm{exp}} = \frac{1}{\lambda\sqrt n}.

Poissonverteilung zum Parameter λ (Erwartungswert = Varianz = λ):

\sigma_{\bar x,\mathrm{pois}} = \sqrt{\frac{\lambda}{n}}

Dabei bezeichnen

  • \sigma_{\bar x,\mathrm{binom}},  \sigma_{\bar x,\mathrm{exp}},  \sigma_{\bar x,\mathrm{pois}} die Standardfehler der jeweiligen Verteilung, und
  • n den Stichprobenumfang.

Wikimedia Foundation.

Игры ⚽ Поможем решить контрольную работу

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Stichprobenfehler — atrankinė paklaida statusas T sritis Standartizacija ir metrologija apibrėžtis Paklaida, apskaičiuota iš tam tikro skaičiaus tyrimo rezultatų. atitikmenys: angl. sampling error vok. Stichprobenfehler, m rus. выборочная погрешность, f pranc.… …   Penkiakalbis aiškinamasis metrologijos terminų žodynas

  • Stichprobenfehler — atrankinė paklaida statusas T sritis fizika atitikmenys: angl. sampling error vok. Stichprobenfehler, m rus. выборочная погрешность, f pranc. erreur sélective, f …   Fizikos terminų žodynas

  • Stichprobenfehler — ⇡ Stichprobenzufallsfehler …   Lexikon der Economics

  • Stichprobenzufallsfehler — Stichprobenfehler, Schätzfehler, Zufallsfehler; in der ⇡ Inferenzstatistik der ⇡ Fehler eines ⇡ Schätzwertes, der dadurch zustande kommt, dass dessen Berechnung eine ⇡ Zufallsstichprobe zugrunde liegt. Gegensatz: ⇡ Nichtstichprobenfehler …   Lexikon der Economics

  • Datenqualität — Informationsqualität oder Datenqualität bezeichnet die Qualität, also Relevanz und Korrektheit von Informationen. Sie beschreibt, wie gut eine Information (bzw. ein Datensatz) geeignet ist, die Realität zu beschreiben, das heißt, inwieweit sie… …   Deutsch Wikipedia

  • Informationswert — Informationsqualität oder Datenqualität bezeichnet die Qualität, also Relevanz und Korrektheit von Informationen. Sie beschreibt, wie gut eine Information (bzw. ein Datensatz) geeignet ist, die Realität zu beschreiben, das heißt, inwieweit sie… …   Deutsch Wikipedia

  • Klumpenstichprobe — In einer Klumpenstichprobe wird die Grundgesamtheit in viele kleine (oft geografisch abgegrenzte) Teilgesamtheiten zerlegt, die sogenannten Klumpen (beispielsweise Schulen für eine Befragung von Schülern). Dabei geht man im Gegensatz zur… …   Deutsch Wikipedia

  • Evolution (Systemtheorie) — Evolution (vom lateinischen evolvere = abwickeln, entwickeln; PPP evolutum) ist in der Systemtheorie ein Prozess, bei dem durch Reproduktion oder Replikation von einem System Kopien hergestellt werden, die sich voneinander und von ihrem… …   Deutsch Wikipedia

  • Informationsqualität — oder Datenqualität bezeichnet die Qualität, also Relevanz und Korrektheit von Informationen. Sie beschreibt, wie gut eine Information (bzw. ein Datensatz) geeignet ist, die Realität zu beschreiben, das heißt, inwieweit sie ein Modell… …   Deutsch Wikipedia

  • Klumpen-Stichprobe — Eine Klumpen Stichprobe ist eine Form der Zufallsauswahl. In einer Klumpen Stichprobe wird die Grundgesamtheit in viele kleine (oft geografisch abgegrenzte) Teilgesamtheiten zerlegt, die sogenannten Klumpen (beispielsweise Schulen für eine… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”