Verzerrung (Statistik)

Verzerrung (Statistik)

Erwartungstreue (selten Unverzerrtheit, engl. unbiasedness) ist ein Begriff der mathematischen Statistik, mit dem ein Aspekt der Qualität einer Schätzfunktion (kurz: eines Schätzers) bemessen werden kann. Ist ein Schätzer nicht erwartungstreu, d.h. hat er eine Abweichung von seinem Erwartungswert, spricht man davon, dass der Schätzer verzerrt (engl. biased) ist. Die Abweichung von diesem Mittel nennt man entsprechend Verzerrung (engl. bias).

Erwartungstreue zählt neben Konsistenz, Suffizienz und (asymptotischer) Effizienz zu den vier gebräuchlichen Kriterien für die Qualität von Schätzern.

Inhaltsverzeichnis

Definition

Es sei X\; eine Zufallsvariable, deren Verteilungsfunktion aus einer parametrischen Familie P_{\vartheta}\; mit \vartheta \in \Theta\; stammt. Ein Schätzer g(X) \; heißt erwartungstreu für einen Parameter \vartheta bzw. allgemeiner für ein Funktional \gamma(\vartheta), falls E_{\vartheta} [g(X)] = \gamma(\vartheta) für alle \vartheta \in \Theta\; gilt.[1] Die anschauliche Interpretation ist, dass man mit der Wahl von g(X) \; als Schätzer im Mittel richtig liegt, da dessen Erwartungswert exakt dem gesuchten Parameter entspricht.

Hintergründe

Es ergibt sich aus der Definition, dass „gute“ Schätzer zumindest näherungsweise erwartungstreu sein, sich also dadurch auszeichnen sollen, dass sie im Mittel nah am zu schätzenden Wert liegen. Üblicherweise ist Erwartungstreue jedoch nicht das einzige wichtige Kriterium für die Qualität eines Schätzers; so sollte er beispielsweise auch eine kleine Varianz haben, also möglichst gering um den zu schätzenden Wert schwanken. Zusammengefasst ergibt sich das klassische Kriterium einer minimalen mittleren quadratischen Abweichung für optimale Schätzer.

In der Praxis kann eine Abweichung von Erwartungstreue zwei Ursachen haben:

Zufällige Fehler können tolerabel sein, wenn sie dazu beitragen, dass der Schätzer eine kleinere minimale quadratische Abweichung als ein unverzerrter besitzt.

Asymptotische Erwartungstreue

In der Regel ist es nicht von Bedeutung, dass ein Schätzer erwartungstreu ist. Die meisten Resultate der mathematischen Statistik gelten erst asymptotisch, also wenn der Stichprobenumfang ins Unendliche wächst. Daher ist es in der Regel ausreichend, wenn Erwartungstreue im Grenzwert gilt, d. h. für eine Folge von Schätzern g_n \; die Konvergenzaussage \lim_{n \rightarrow \infty} E_{\vartheta} [g_{n}(X)] = \gamma(\vartheta) gilt.

Beispiel

Ein typisches Beispiel sind Schätzer für die Parameter von Normalverteilungen. Man betrachtet in diesem Fall die parametrische Familie

P_{\vartheta}, \; \vartheta \in \Theta mit \vartheta = (\mu, \sigma^2)\; und \;\Theta = \mathbb R \times \mathbb R^{+},

wobei jedes _{\vartheta} \; einer Wahrscheinlichkeitsverteilung entspricht, die normalverteilt mit Erwartungswert \mu\; und Varianz \sigma^2\; ist. Üblicherweise sind Beobachtungen X_1, \ldots, X_n\; gegeben, die stochastisch unabhängig sind und jeweils die Verteilung P_{\vartheta}\; besitzen.

Schätzung des Mittelwerts einer Normalverteilung

Ein erwartungstreuer Schätzer für \mu = \gamma_1(\vartheta) = c_1^T \vartheta \; mit c_1 = (1,0)^T\; ist beispielsweise der empirische Mittelwert \bar{X_n} = \frac 1n \sum_{i=1}^{n} X_i\;, da E[\bar{X_n}] = \mu \; gilt.

Schätzung der Varianz einer Normalverteilung

Der Maximum-Likelihood-Schätzer s_n^2 = \frac 1n \sum_{i=1}^{n} (X_i - \bar{X_n})^2 ist dagegen nicht erwartungstreu für \sigma^2 = \gamma_2(\vartheta) = c_2^T \vartheta \; mit c_2 = (0,1)^T\;, da sich E[s_n^2] = \frac{n-1}{n} \sigma^2\; zeigen lässt. Der Bias beträgt also E[s_n^2] - \sigma^2 = -\frac{1}{n} \sigma^2.\; Da dieser asymptotisch, also für  n \rightarrow \infty\;, verschwindet, ist der Schätzer allerdings asymptotisch erwartungstreu.

UMVU-Schätzer

Eine wichtige Anwendung erwartungstreuer Schätzer besteht darin, dass mit ihrer Hilfe gleichmäßig beste Schätzer konstruiert werden können. Das Ziel dabei ist es, solche Schätzer zu finden, die das Risiko, häufig gesetzt als die mittlere quadratische Abweichung, über eine ganze Klasse von Schätzern minimieren. In den allermeisten Fällen gibt es keine Schätzer, die über die gesamte Klasse von Schätzern optimal sind, so dass man sich auf Teilklassen beschränken muss. Eine typische Teilklasse sind dabei erwartungstreue Schätzer, wobei man zeigen kann, dass genau diese Schätzer optimal sind, die als Funktion einer suffizienten und vollständigen Statistik dargestellt werden können.

Beste erwartungstreue Schätzer werden auch UMVU-Schätzer genannt, für uniformly minimum variance unbiased. Dies lässt sich darauf zurückzuführen, dass das Risiko eines Schätzers gleich der Summe aus Bias und Varianz ist. Ein erwartungstreuer Schätzer mit minimaler Varianz ist daher gerade ein bester erwartungstreuer Schätzer.

Literatur

  • H. Witting: Mathematische Statistik, Bd. 1. Parametrische Verfahren bei festem Stichprobenumfang. Vieweg+Teubner, Stuttgart 1985, ISBN 978-3-519-02026-4.

Einzelnachweise

  1. Witting, S. 25

Wikimedia Foundation.

Игры ⚽ Поможем написать реферат

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Verzerrung — steht für: Verzerrung (Akustik), in der Akustik und Tontechnik die gewollte oder ungewollte Veränderung der Schwingungsform Verzerrung (Optik), Verzerrung eines Bildes, auch Verzeichnung Verzerrung (Statistik), Abweichung einer Schätzfunktion vom …   Deutsch Wikipedia

  • Verzerrung — Verkrümmung; systematischer Fehler; systematische Abweichung; Bias; Tendenz; Deformation; Entstellung; Befangenheit; Distorsion * * * Ver|zẹr|rung 〈f. 20〉 1. das Verzerren …   Universal-Lexikon

  • Trend (Statistik) — Ein Trend (engl. auch Bias) ist ein bei Messungen in Naturwissenschaft, Technik und Wirtschaft auftretender, meist störender systematischer Effekt mit einer Grundtendenz (steigend/fallend). Die einfachste Art, in einer Messreihe einen Trend… …   Deutsch Wikipedia

  • Systematische Verzerrung — Als systematischer Fehler (auch systematische Abweichung oder Verzerrung; engl. systematic error oder bias) werden in der Technik, den Natur und anderen Wissenschaften Messfehler bezeichnet, die sich bei wiederholter Messung nicht im Mittel… …   Deutsch Wikipedia

  • Jackknife (Statistik) — Jackknife ist in der Statistik eine Methode des Resampling. Jackknife dient dazu, den zufälligen Fehler einer Schätzmethode und eine etwaige Verzerrung zu schätzen. Dabei wird aus den Daten der Stichprobe jeweils ein Datensatz weggelassen und der …   Deutsch Wikipedia

  • Verzerrungen — Verzerrung bezeichnet in der Physik die Deformation eines Kontinuums; siehe Kontinuumsmechanik in der Akustik und Tontechnik die gewollte oder ungewollte Veränderung der Schwingungsform; siehe Verzerrung (Akustik) Verzerrung (Elektronik) in der… …   Deutsch Wikipedia

  • Bias — [ˈbaɪəs] (englisch für ‚Verzerrung‘, oft ‚statistische Verzerrung‘, ‚Vorspannung‘ oder ‚Vorbeaufschlagung‘) bezeichnet: in der Statistik die Differenz zwischen dem Erwartungswert einer Statistik und dem zu schätzenden Objekt, siehe Verzerrung… …   Deutsch Wikipedia

  • Mean squared error — Zwei Schätzfunktionen: Die Wahl einer verzerrten Statistik kann hinsichtlich ihrer erwarteten Abweichung vom echten Wert gegenüber einer unverzerrten vorteilhaft sein. Die mittlere quadratische Abweichung oder mittlerer quadratischer Fehler (engl …   Deutsch Wikipedia

  • Mittlerer quadratischer Fehler — Zwei Schätzfunktionen: Die Wahl einer verzerrten Statistik kann hinsichtlich ihrer erwarteten Abweichung vom echten Wert gegenüber einer unverzerrten vorteilhaft sein. Die mittlere quadratische Abweichung oder mittlerer quadratischer Fehler (engl …   Deutsch Wikipedia

  • Schwankung — Eine Abweichung ist: bei Messungen eine Differenz zum Erwartungswert oder einem Vergleichswert, die auf unvermeidliche zufällige oder systematische Ursachen zurückgeht, die Messabweichung eine statistische Kenngröße, siehe Standardabweichung… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”