Zentrales Schwankungsintervall

Das zentrale Schwankungsintervall ist ein Begriff aus der mathematischen Statistik. Er sagt etwas über die Präzision der Lageschätzung eines Parameters (zum Beispiel eines Mittelwertes) aus. Das Schwankungsintervall schließt einen Bereich um den wahren Wert des Parameters in der Grundgesamtheit ein, der – vereinfacht gesprochen – mit einer zuvor festgelegten Sicherheitswahrscheinlichkeit den aus der Stichprobe geschätzten Parameters enthält.

Inhaltsverzeichnis

1 Idee
2 Formale Definition
3 Spezielle zentrale Schwankungsintervalle
4 Beispiele
5 Zentrales Schwankungsintervall und Konfidenzintervall
- 5.1 Ableitung
- 5.2 Unterschiede

Idee

Eine Schätzfunktion $θ (X 1,..., X n)$ ist eine Zufallsvariable für einen unbekannten wahren Parameter einer Grundgesamtheit $\vartheta$ . Daher besitzt sie eine Verteilung und wir können mit der Wahrscheinlichkeit $1 - α$ Intervalle bezüglich Realisation angeben.

Das heißt, ziehen wir eine Stichprobe mit den Werten $x 1,..., x n$ , dann können wir einen Schätzwert $\hat{\vartheta}=\theta(x_1, ..., x_n)$ berechnen und mit einer vorgegebenen Wahrscheinlichkeit ein Intervall angeben in dem wir den Schätzwert $\hat{\vartheta}$ erwarten.

Die zentralen Schwankungsintervalle haben einen Nachteil: die Intervallgrenzen enthalten den unbekannten Parameter $θ$ (im Gegensatz zum Konfidenzintervall). Trotzdem liefert das zentrale Schwankungsintervall eine wertvolle Information, nämlich die Größe der Abweichung eines aus der Stichprobe geschätzten Parameter vom wahren Parameter.

Parameter	Bedingung	Zentrales Schwankungsintervall
$μ$	$X i \sim N (μ, σ)$ , $σ$ bekannt	$[\mu-z_{1-\alpha/2} \sigma/\sqrt{n}; \mu+z_{1-\alpha/2} \sigma/\sqrt{n}]$
$μ$	$X i \sim N (μ, σ)$ , $σ$ unbekannt	$[\mu-t_{n-1;1-\alpha/2} S/\sqrt{n}; \mu+t_{n-1;1-\alpha/2} S/\sqrt{n}]$
$μ$	$X i \sim (μ, σ)$ beliebig verteilt, $n > 30$	$[\mu-z_{1-\alpha/2} \sigma/\sqrt{n}; \mu+z_{1-\alpha/2} \sigma/\sqrt{n}]$ ( $σ$ bekannt) $[\mu-z_{1-\alpha/2} S/\sqrt{n}; \mu+z_{1-\alpha/2} S/\sqrt{n}]$ ( $σ$ unbekannt)
$σ 2$	$X i \sim N (μ, σ)$ , $μ$ bekannt	$[\chi^2_{n;\alpha/2} \frac{\sigma^2}{n}; \chi^2_{n;1-\alpha/2} \frac{\sigma^2}{n}]$
$σ 2$	$X i \sim N (μ, σ)$ , $μ$ unbekannt	$[\chi^2_{n-1;\alpha/2} \frac{\sigma^2}{n-1}; \chi^2_{n-1;1-\alpha/2} \frac{\sigma^2}{n-1}]$
$π$	$X i$ Bernoulli verteilt mit Parameter $π$	$[\pi-z_{1-\alpha/2}\sqrt{p(1-p)/n} ; \pi+z_{1-\alpha/2}\sqrt{p(1-p)/n}]$ bzw. $[\pi-\frac{z_{1-\alpha/2}}{\sqrt{4n}} ; \pi+\frac{z_{1-\alpha/2}}{\sqrt{4n}}]$

Dabei sind

$1 - α$ die Sicherheitswahrscheinlichkeit,
$z q$ , $t m; q$ und $\chi^2_{m;q}$ die $q$ -Quantile der Standardnormal-, t- und Chi-Quadrat-Verteilung mit $m$ Freiheitsgraden,
$S^2=\frac{1}{n-1}\sum_{i=1} (X_i-\bar{X})^2$ die korrigierte Stichprobenvarianz sowie
$p$ der geschätzte Anteilswert aus der Stichprobe.

Formale Definition

Das zentrale Schwankungsintervall für eine Schätzfunktion $θ$ ist das Intervall $[\vartheta-c_u ; \vartheta+c_o]$ für das gilt $P(\theta < \vartheta-c_u) = \alpha/2$ bzw. $P(\theta > \<span class=$ vartheta-c_o) = \alpha/2" border="0">, also

$P(\vartheta-c_u \leq \theta \leq \vartheta+c_o) = 1-\alpha$ .

Das zentrale Schwankungsintervall kann, muss aber nicht, symmetrisch um den unbekannten Parameter liegen. Die Werte $c u$ bzw. $c o$ hängen ab

von dem Verteilungstyp der Schätzfunktion (siehe $c_u^*$ , $c_o^*$ ) und
der Varianz der Schätzfunktion $V a r (θ)$ :

$P(\vartheta-c_u^* \sqrt{Var(\theta)} \leq \theta \leq \vartheta+c_o^* \sqrt{Var(\theta)}) = 1-\alpha$ .

Spezielle zentrale Schwankungsintervalle

Für den Mittelwert $μ$ der Grundgesamtheit

Für den unbekannten Mittelwert $μ$ der Grundgesamtheit wird die Schätzfunktion $\bar{X}=\frac{X_1+...+X_n}{n}$ genommen. Es ergeben sich für die Verteilung von $\bar{X}$ zwei Fälle:

$X_i\sim N(\mu, \sigma)\,$ , dann gilt $\bar{X}\sim N(\mu, \sigma/\sqrt{n})$ (Reproduktivitätseigenschaft der Normalverteilung) oder
$X_i\sim (\mu, \sigma)\,$ (beliebig verteilt) und die Voraussetzungen des zentralen Grenzwertsatzes erfüllt, dann gilt $\bar{X}\approx N(\mu, \sigma/\sqrt{n})$ .

Daraus ergeben sich drei Schwankungsintervalle:

1a.

σ

bekannt, dann gilt $\frac{\bar{X}-\mu}{\sigma/\sqrt{n}} \sim N(0,1)$ und

$P(\mu-z_{1-\alpha/2} \sigma/\sqrt{n} \leq \bar{X} \leq \mu+z_{1-\alpha/2} \sigma/\sqrt{n})=1-\alpha$

1b.

σ

unbekannt, dann gilt $\frac{\bar{X}-\mu}{S/\sqrt{n}} \sim t_{n-1}$ und

$P(\mu-t_{n-1;1-\alpha/2} S/\sqrt{n} \leq \bar{X} \leq \mu+t_{n-1;1-\alpha/2} S/\sqrt{n})=1-\alpha$

2. Es gilt $\frac{\bar{X}-\mu}{S/\sqrt{n}} \approx N(0,1)$ und

$P(\mu-z_{1-\alpha/2} S/\sqrt{n} \leq \bar{X} \leq \mu+z_{1-\alpha/2} S/\sqrt{n}) \approx 1-\alpha$ .

Die Werte $z q$ bzw. $t m; q$ sind die $q$ -Quantile der Standardnormalverteilung bzw. der Studentsche t-Verteilung mit $m$ Freiheitsgraden.

Für die Varianz $σ 2$ der Grundgesamtheit

Wenn die Stichprobenvariablen $X i ˜ N (μ, σ)$ verteilt sind, dann gibt es für die Varianz $σ 2$ zwei verschiedene mögliche Schätzfunktionen:

Wenn $μ$ bekannt ist, dann ergibt sich $S^{*^2}=\frac{1}{n}\sum_{i=1}^n (X_i -\mu)^2$ .
Wenn $μ$ unbekannt ist, dann ergibt sich $S^2=\frac{1}{n-1}\sum_{i=1}^n (X_i -\bar{X})^2$ .

Im ersten Fall ist $\frac{nS^{*^2}}{\sigma^2} \sim \chi^2_n$ verteilt und das zentrale Schwankungsintervall ist

$P\left(\chi^2_{n;\alpha/2} \frac{\sigma^2}{n} \leq S^{*^2} \leq \chi^2_{n;1-\alpha/2} \frac{\sigma^2}{n}\right) = 1-\alpha$

und im zweiten Fall ist $\frac{(n-1)S^2}{\sigma^2} \sim \chi^2_{n-1}$ verteilt und das zentrale Schwankungsintervall ergibt sich zu

$P\left(\chi^2_{n-1;\alpha/2} \frac{\sigma^2}{n-1} \leq S^{*^2} \leq \chi^2_{n-1;1-\alpha/2} \frac{\sigma^2}{n-1}\right) = 1-\alpha$ .

Die Werte $\chi^2_{m;q}$ sind die $q$ -Quantile der Chi-Quadrat-Verteilung mit $m$ Freiheitsgraden.

In beiden Fällen liegt das zentrale Schwankungsintervall nicht symmetrisch um $σ 2$ .

Für den Anteilswert $π$ der Grundgesamtheit

Eine dichotome Zufallsvariable $X$ Anzahl der Erfolge bei $n$ Ziehungen mit Zurücklegen ist binomial verteilt in Abhängigkeit der unbekannten Erfolgswahrscheinlichkeit $π$ . Bei der Erfüllung der Approximationsbedingungen ist $X$ normal verteilt und auch die Schätzfunktion $\Pi=X/n\approx N(\pi, \sqrt{\pi(1-\pi)/n})$ . Das zentrale Schwankungsintervall ergibt sich daher zu

$P(\pi-z_{1-\alpha/2}\sqrt{\pi(1-\pi)/n} \leq \Pi \leq \pi+z_{1-\alpha/2}\sqrt{\pi(1-\pi)/n}) \approx 1-\alpha$ .

Für die praktischen Berechnungen kann man $π (1 - π)$ entweder mit $1/4=\max_{0\leq\pi\leq 1} \pi(1-\pi)$ abschätzen. Alternativ kann man $π (1 - π)$ mit $p (1 - p)$ ersetzen und $p$ ist der Anteilswert aus der Stichprobe.

Beispiele

Beispiel 1: Wenn wir die mittlere Studiendauer in Semestern von Studenten auf $0, 1$ genau schätzen wollen mit einer Sicherheitswahrscheinlichkeit $1 - α = 95 %$ , dann bedeutet dies, dass das zentrale Schwankungsintervall vom wahren Wert $μ$ um nicht mehr als $\pm 0,05$ Semester abweichen darf. Die Länge des zentralen Schwankungsintervalls muss also $0, 1$ Semester sein.

Für die mittlere Studiendauer ist nicht bekannt, ob sie normal verteilt ist, d.h. es folgt

$0,1 = \left(\mu+z_{1-\alpha/2} \frac{s}{\sqrt{n}}\right)-\left(\mu-z_{1-\alpha/2} \frac{s}{\sqrt{n}}\right)$ ,

d.h. in Abhängigkeit von $s$ ( $z 0, 975 = 1, 96$ ) lässt sich ein Stichprobenumfang bestimmen um diese Genauigkeit zu erreichen:

n = 1536, 64 s 2

Mit $s = 1$ Semester müssen also 1537 Studenten befragt werden, ist $s = 2$ Semester, dann wären es bereits 6147 Studenten nötig. In diesem Beispiel ist nur die Lage, nicht aber die Breite des zentralen Schwankungsintervalls vom wahren Parameter abhängig.

Beispiel 2: In Wahlumfragen werden üblicherweise ca. 1000 Wahlberechtigte befragt. Mit welcher Genauigkeit bei einer Sicherheitswahrscheinlichkeit von $1 - α = 95 %$ kann ein Wahlforscher das Ergebnis einer Partei vorhersagen?

Die Länge des zentralen Schwankungsintervalls ist

$\left(\pi+z_{1-\alpha/2} \frac{1}{\sqrt{4n}}\right)-\left(\pi+z_{1-\alpha/2} \frac{1}{\sqrt{4n}}\right) = \frac{2z_{1-\alpha/2}}{\sqrt{4n}}=\frac{z_{1-\alpha/2}}{\sqrt{n}}$

und mit $z 0, 975 = 1, 96$ , $n = 1000$ ergibt sich eine Länge von $0, 062 = 6, 2 %$ . D.h. mit 95% Wahrscheinlichkeit wird der Anteilswert aus der Stichprobe um maximal $\pm 3,2%$ vom wahren Anteilswert $π$ abweichen. Bei einem wahren Anteilswert von $π = 50 %$ ergibt sich das zentrale Schwankungsintervall also zu $[46, 9 %; 53, 1 %]$ ; diese große Ungenauigkeit ist einer der Gründe warum in der Presse/Meinungsforschungsinstituten selten die Genauigkeit von Prognosen mit angegeben wird.

Zentrales Schwankungsintervall und Konfidenzintervall

Ableitung

Die Konfidenzintervalle werden direkt aus den zentralen Schwankungsintervallen abgeleitet:

$P\left(\vartheta-c_u^* \sqrt{Var(\theta)} \leq \theta \leq \vartheta+c_o^* \sqrt{Var(\theta)}\right) = 1-\alpha$

Subtraktion von $\vartheta$

$P\left(-c_u^* \sqrt{Var(\theta)} \leq \theta-\vartheta \leq +c_o^* \sqrt{Var(\theta)}\right) = 1-\alpha$

Subtraktion von $θ$

$P\left(-\theta-c_u^* \sqrt{Var(\theta)} \leq -\vartheta \leq -\theta+c_o^* \sqrt{Var(\theta)}\right) = 1-\alpha$

Multiplikation von $- 1$

$P\left(\theta-c_u^* \sqrt{Var(\theta)} \leq \vartheta \leq \theta+c_o^* \sqrt{Var(\theta)}\right) = 1-\alpha$

Und damit ergibt sich das Konfidenzintervall.

Unterschiede

Die folgende Tabelle summiert einige Unterschiede zwischen dem zentralen Schwankungsintervall und dem Konfidenzintervall.

	Zentrales Schwankungsintervall	Konfidenzintervall
Grenzen	Sind für jede Stichprobe gleich, also feste Werte	Ändern sich bei jeder Stichprobe, sind also Zufallsvariablen
Lage	Schließt den unbekannten Parameter der Grundgesamtheit ein	Schließt den geschätzten Parameter der Stichprobe ein
Interpretation	Gibt an, mit welcher Wahrscheinlichkeit der aus der Stichprobe geschätzte Parameter im Intervall enthalten ist	Gibt an, welcher Anteil der Schätzintervalle den wahren Parameter enthalten

Kategorien:

Wikimedia Foundation.

Игры ⚽ Поможем сделать НИР

Schlagen Sie auch in anderen Wörterbüchern nach:

Zufallsstichprobe — Dieser Artikel wurde auf der Qualitätssicherungsseite des Portals Mathematik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Mathematik auf ein akzeptables Niveau zu bringen. Bitte hilf mit, die Mängel dieses… … Deutsch Wikipedia
Konfidenzintervall — Das Konfidenzintervall (auch Vertrauensbereich, Vertrauensintervall oder Mutungsintervall genannt) ist ein Begriff aus der mathematischen Statistik. Er sagt etwas über die Präzision der Lageschätzung eines Parameters (zum Beispiel eines… … Deutsch Wikipedia
ZSI — Die Abkürzung ZSI bedeutet: (ehemaliger Begriff): Zentralstelle für Sicherheit in der Informationstechnik, engl. German Information Security Agency, GISA); heutige Bezeichnung Bundesamt für Sicherheit in der Informationstechnik Zeitzugeordnete… … Deutsch Wikipedia

Academic dictionaries and encyclopedias

Zentrales Schwankungsintervall

Inhaltsverzeichnis

Idee

Formale Definition

Spezielle zentrale Schwankungsintervalle

Für den Mittelwert $μ$ der Grundgesamtheit

Für die Varianz $σ 2$ der Grundgesamtheit

Für den Anteilswert $π$ der Grundgesamtheit

Beispiele

Zentrales Schwankungsintervall und Konfidenzintervall

Ableitung

Unterschiede

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Academic dictionaries and encyclopedias

Deutsch Wikipedia

Zentrales Schwankungsintervall

Inhaltsverzeichnis

Idee

Formale Definition

Spezielle zentrale Schwankungsintervalle

Für den Mittelwert μ der Grundgesamtheit

Für die Varianz σ2 der Grundgesamtheit

Für den Anteilswert π der Grundgesamtheit

Beispiele

Zentrales Schwankungsintervall und Konfidenzintervall

Ableitung

Unterschiede

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Direct link

Für den Mittelwert $μ$ der Grundgesamtheit

Für die Varianz $σ 2$ der Grundgesamtheit

Für den Anteilswert $π$ der Grundgesamtheit