Stichprobenvarianz

Stichprobenvarianz

Die Stichprobenvarianz oder empirische Varianz ist ein Maß für die Streuung von Daten in der (deskriptiven) Statistik. Die Stichprobenstandardabweichung oder empirische Standardabweichung ist die Wurzel aus der Stichprobenvarianz und hat die gleiche Maßeinheit wie die Beobachtungsdaten.

Inhaltsverzeichnis

Berechnung der Stichprobenvarianz

In der Literatur werden zur Berechnung der Stichprobenvarianz verschiedene Formeln verwendet, die korrigierte Stichprobenvarianz

s^2=\frac{1}{n-1} \sum_{i=1}^n (x_i - \bar{x})^2

oder die unkorrigierten Stichprobenvarianzen

{s'}^2=\frac{1}{n} \sum_{i=1}^n (x_i - \bar{x})^2 oder
{s^*}^2=\frac{1}{n} \sum_{i=1}^n (x_i - \mu)^2

mit x_1, \ldots, x_n die Beobachtungswerte und \bar{x} das arithmetisches Mittel der Beobachtungswerte bzw. μ der wahre Mittelwert in der Grundgesamtheit. Welche der Berechnungsformeln benutzt werden kann, hängt von den Eigenschaften der Stichprobe ab.

Stichprobe ist Mittelwert μ der
Grundgesamtheit ist
Formel für Stichprobenvarianz
eine (einfache) Zufallsstichprobe unbekannt s2
bekannt {s^*}^2
eine Vollerhebung s'2 oder {s^*}^2
keine (einfache) Zufallsstichprobe s'2 oder s2

Stichprobe ist eine Zufallsstichprobe

Ist eine Stichprobe eine (einfache) Zufallsstichprobe dann ist das Ziel der Datenanalyse meist ein Rückschluss von der Stichprobe auf die Grundgesamtheit. In den Verfahren der induktiven Statistik für den Rückschluss (Statistische Tests, Konfidenzintervalle etc.) fließt oft die Varianz σ2 der Grundgesamtheit ein.

In der Praxis ist die Varianz der Grundgesamtheit jedoch unbekannt, so dass sie aus den Beobachtungsdaten geschätzt werden muss. Für die Schätzfunktionen

S^2\, = \frac{1}{n-1} \sum_{i=1}^n (X_i - \bar{X})^2 (falls μ ebenfalls geschätzt werden muss)
{S^*}^2 =\frac{1}{n} \sum_{i=1}^n (X_i - \mu)^2 (falls μ nicht geschätzt werden muss)

kann man zeigen, dass diese Schätzfunktionen erwartungstreu sind für die unbekannte Varianz σ2 der Grundgesamtheit: E\left(S^2\right)=E\left({S^*}^2\right)=\sigma^2.

Unter anderem deswegen wird im Rahmen der induktiven Statistik immer s2, falls μ geschätzt werden muss, bzw. {s^*}^2, falls μ bekannt ist, genutzt.

Stichprobe ist eine Vollerhebung

In diesem Fall enthält die Stichprobe alle Elemente der Grundgesamtheit, und s'2 und {s^*}^2 fallen zusammen. Der wahre Mittelwert der Grundgesamtheit μ berechnet sich aus allen Elementen der Grundgesamtheit als

\mu = \tfrac1N \sum_{i=1}^N x_i = \tfrac1n \sum_{i=1}^n x_i = \bar{x}

mit N die Anzahl der Elemente der Grundgesamtheit und n die Anzahl der Elemente in der Stichprobe. Bei einer Vollerhebung gelten natürlich N = n und damit \mu=\bar{x}. Die Varianz der Grundgesamtheit lässt sich dann als mittlere quadratische Abweichung vom Mittelwert berechnen

\sigma^2 = \tfrac1N \sum_{i=1}^N (x_i - \bar{x})^2.

Stichprobe ist keine Zufallsstichprobe

Ist die Stichprobe keine Zufallsstichprobe, so ist es meist nicht möglich, auf einfache Weise die Varianz der Grundgesamtheit aus den Beobachtungsdaten zu schätzen. Daher dient die Stichprobenvarianz dann nur zur Beschreibung der Streuung der Daten im Sinne der mittleren quadratischen Abweichung vom Mittelwert. Daher sollte die Formel

{s'}^2=\frac{1}{n} \sum_{i=1}^n (x_i - \bar{x})^2

genutzt werden zwecks eindeutiger Interpretation. Auf der anderen Seite wird im Fall Stichprobe ist eine Zufallsstichprobe die korrigierte Stichprobenvarianz eingesetzt

s^2=\frac{1}{n-1} \sum_{i=1}^n (x_i - \bar{x})^2,

und bei der Nutzung dieser Formel wird die Stichprobenvarianz im Rahmen der deskriptiven und der induktiven Statistik auf gleiche Weise berechnet. Jedoch ist die Stichprobenvarianz hier nur noch approximativ die mittlere quadratische Abweichung vom Mittelwert.

Entschärft wird das Problem dadurch, dass der Unterschied zwischen s'2 und s2 bei großen Stichprobenumfängen nur klein ist. D.h. nur bei kleinen Stichprobenumfängen muss der Nutzer entscheiden, welche Formel er bevorzugt.

Beispiel

Varianzschätzungen mit verschiedenen Varianzschätzern (rot, blau, grün) und verschiedenen Stichprobenumfängen

Als Beispiel werden aus einer Standardnormalverteilung n = 5 Zufallszahlen berechnet und es ergeben sich z.B. folgende Beobachtungswerte:

i 1 2 3 4 5
xi -0,8223 -0,2789 -0,2537 1,1041 1,5785

mit dem Mittelwert \bar{x}=0,2655. Da die Daten aus einer Standardnormalverteilung stammen, kennt man den wahren Mittelwert von \mu=0\,. Und damit ergibt sich

s^2\, =\tfrac{1}{4} \left((-0,8223-0,2655)^2+\cdots+(1,5785-0,2655)^2\right) =1,0441\,
{s'}^2\, =\tfrac{1}{5} \left((-0,8223-0,2655)^2+\cdots+(1,5785-0,2655)^2\right) =0,8353\,
{s^*}^2\, =\tfrac{1}{5} \left((-0,8223-0)^2+\cdots+(1,5785-0)^2\right) =0,9058\,

Die Grafik rechts zeigt für verschiedene Stichprobenumfänge die geschätzten Varianzen für jeweils 1000 Stichproben mit standardnormalverteilten Daten. Die Farben stehen für verschiedene Schätzer: {s'}^2\, in Rot, s^2\, in Blau und {s^*}^2\, in Grün. Der schwarze Punkt im Boxplot ist der Mittelwert aus den 1000 Schätzungen. Man sieht deutlich, dass für weniger als 50–100 Beobachtungen in der Stichprobe s'2 (Rot) die wahre Varianz von σ2 = 1 unterschätzt wird.


Wikimedia Foundation.

Игры ⚽ Нужна курсовая?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Korrigierte Stichprobenvarianz — Die korrigierte Stichprobenvarianz (s2) ist eine Schätzfunktion für die Varianz einer Zufallsvariablen aus Beobachtungswerten, die einer Stichprobe der Grundgesamtheit entstammen. Diese Varianz wird auch in der deskriptiven Statistik als Maß für… …   Deutsch Wikipedia

  • Empirische Standardabweichung — Die korrigierte Stichprobenvarianz (s2) ist eine Schätzfunktion für die Varianz einer Zufallsvariablen aus Beobachtungswerten, die einer Stichprobe der Grundgesamtheit entstammen. Diese Varianz wird auch in der deskriptiven Statistik als Maß für… …   Deutsch Wikipedia

  • Empirische Varianz — Die korrigierte Stichprobenvarianz (s2) ist eine Schätzfunktion für die Varianz einer Zufallsvariablen aus Beobachtungswerten, die einer Stichprobe der Grundgesamtheit entstammen. Diese Varianz wird auch in der deskriptiven Statistik als Maß für… …   Deutsch Wikipedia

  • Stichprobenstandardabweichung — Die korrigierte Stichprobenvarianz (s2) ist eine Schätzfunktion für die Varianz einer Zufallsvariablen aus Beobachtungswerten, die einer Stichprobe der Grundgesamtheit entstammen. Diese Varianz wird auch in der deskriptiven Statistik als Maß für… …   Deutsch Wikipedia

  • — Die korrigierte Stichprobenvarianz (s2) ist eine Schätzfunktion für die Varianz einer Zufallsvariablen aus Beobachtungswerten, die einer Stichprobe der Grundgesamtheit entstammen. Diese Varianz wird auch in der deskriptiven Statistik als Maß für… …   Deutsch Wikipedia

  • Studentisieren — Unter Studentisierung oder Studentisieren versteht man in der mathematischen Statistik eine Transformation der Realisationen einer Zufallsvariablen, so dass die resultierende Werte das arithmetische Mittel Null und die Stichprobenvarianz Eins… …   Deutsch Wikipedia

  • Varianzschätzer — In diesem Artikel oder Abschnitt fehlen folgende wichtige Informationen: In diesem Artikel wird als einzige Varianzschätzung die korrigierte Stichprobenvarianz erwähnt. Es fehlen konkrete Verfahren zur Schätzung der Varianz, die auf den… …   Deutsch Wikipedia

  • Standardabweichung — Die Standardabweichung ist ein um 1860 von Francis Galton eingeführter Begriff der Statistik und der Wahrscheinlichkeitsrechnung und ein Maß für die Streuung der Werte einer Zufallsvariablen um ihren Mittelwert. Sie ist für eine Zufallsvariable X …   Deutsch Wikipedia

  • Studentisierung — Unter Studentisierung oder Studentisieren versteht man in der mathematischen Statistik eine Transformation der Realisationen einer Zufallsvariablen, so dass die resultierende Werte das arithmetische Mittel Null und die Stichprobenvarianz Eins… …   Deutsch Wikipedia

  • Chi-Quadrat-Verteilung — Die Chi Quadrat Verteilung ist eine stetige Wahrscheinlichkeitsverteilung über der Menge der positiven reellen Zahlen. Im Allgemeinen ist mit „Chi Quadrat Verteilung“ die zentrale Chi Quadrat Verteilung gemeint. Ihr einziger Parameter n muss eine …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”