- Schiefe (Statistik)
-
Die Schiefe (Englischer Fachausdruck: Skew bzw. Skewness) beschreibt die „Neigungsstärke“ einer statistischen Verteilung X. Sie zeigt an, ob und wie stark die Verteilung nach rechts (positive Schiefe) oder nach links (negative Schiefe) geneigt ist. Jede nicht symmetrische Verteilung heißt schief.[1][2][3]
Inhaltsverzeichnis
Definition
In der Statistik ist die Schiefe einer Zufallsvariablen X das auf die dritte Potenz der Standardabweichung bezogene zentrale Moment 3. Ordnung μ3(X):
- .
mit dem Erwartungswert und der Varianz .
Die Schiefe ist invariant unter linearer Transformation mit a > 0:
Empirische Schiefe
Zur Berechnung der Schiefe einer empirischen Häufigkeitsverteilung müssen der Erwartungswert und die Varianz geschätzt werden, d.h. die theoretischen durch die empirischen Momente ersetzt werden:
mit n der Stichprobenumfang (Anzahl der Beobachtungen), xi die i-te Beobachtung, der Stichprobenmittelwert und s die Stichprobenstandardabweichung. Dieser Schätzer ist jedoch nicht erwartungstreu im Gegensatz zu
- .
Deutung
Ist , so ist die Verteilung rechtsschief, ist , ist die Verteilung linksschief (auch genannt rechtssteil). Bei rechtsschiefen (oder linkssteilen) Verteilungen sind Werte, die kleiner sind als der Mittelwert, häufiger zu beobachten, so dass sich der Gipfel (Modus) links vom Mittelwert befindet; der rechte Teil des Graphs ist flacher als der linke. Gilt , so ist die Verteilung auf beiden Seiten ausgeglichen. Bei symmetrischen Verteilungen ist immer . Umgekehrt müssen Verteilungen mit nicht streng symmetrisch sein.
Die Schiefe ist ein Maß für die Asymmetrie einer Wahrscheinlichkeitsverteilung zum Mittelwert. Da die Gaußsche Normalverteilung symmetrisch ist, d.h. eine Schiefe von Null besitzt, ist die Schiefe eine mögliche Maßzahl, um eine Verteilung mit der Normalverteilung zu vergleichen. (Für einen Test dieser Eigenschaft siehe z. B. den Kolmogorow-Smirnow-Test.)
Nicht nur die Normalverteilung weist eine Schiefe von Null auf. Auch beliebige andere in Bezug auf den Mittelwert gänzlich symmetrische Verteilungen weisen eine Schiefe von Null auf. Ein Beispiel stellt eine bimodale und symmetrische Verteilung dar.
Interpretation der Schiefe
Rechtsschiefe Verteilungen findet man z. B. häufig beim Pro-Kopf-Einkommen. Hier gibt es einige wenige Personen mit extrem hohem Einkommen und sehr viele Personen mit eher niedrigem Einkommen. Durch die 3. Potenz erhalten die wenigen sehr extremen Werte ein hohes Gewicht und es entsteht ein Schiefemaß mit positivem Vorzeichen. Es gibt verschiedene Formeln, um die Schiefe zu berechnen. Die gängigen Statistikpakete wie SPSS, SYSTAT, Stata etc. nutzen besonders im Falle einer kleinen Fallzahl von obiger, momentbasierter Berechnungsvorschrift abweichende Formeln.
Siehe auch
Literatur
- W. H. Press et al.: Numerical Recipes in C. 2. Auflage. Cambridge University Press, 1992, Kapitel 14.1.
Einzelnachweise
Wikimedia Foundation.