- Beschreibende Statistik
-
Die deskriptive oder beschreibende Statistik ist der Zweig der Statistik, in dem alle Techniken zusammengefasst werden, die eine Menge von beobachteten Daten summarisch darstellen.
Von der induktiven oder inferentiellen Statistik (Inferenzstatistik) unterscheidet sich die deskriptive Statistik dadurch, dass sie keine Aussagen zu einer über die untersuchten Fälle hinausgehenden Grundgesamtheit macht. Beim Konklusionsschluss (indirekter Schluss) der inferentiellen Statistik ist es also umgekehrt: Dort werden ausgehend von der Stichprobe unbekannte Parameter der Grundgesamtheit geschätzt.
Inhaltsverzeichnis
Deskriptive Zusammenfassung von Daten
Im Einzelnen gibt es folgende Möglichkeiten der Zusammenfassung:
- Tabellarische Auflistung
- Grafische Darstellung
- Berechnung von statistischen Kennwerten
Kenngrößen (statistische Kennwerte)
Zwei Arten von Kenngrößen sind hauptsächlich von Interesse: Lagemaße und Streuungsmaße. Die Wahl der geeigneten Kenngrößen hängt vom Skalen- oder Messniveau der Daten und von der Robustheit der Kenngröße ab.
Lagemaße – zentrale Tendenz einer Häufigkeitsverteilung
- Mittelwert
- Median
- Modus oder Modalwert
- Quantile (Quartile, Dezile)
- Erwartungswert
Aus der Lage der verschiedenen Schätzwerte für die zentrale Tendenz zueinander lassen sich Schiefe und Exzess einer Verteilung bestimmen.
Streuungsmaße – Streuung oder Dispersion der Verteilung
- Varianz
- Standardabweichung (radizierte Varianz)
- Variationsbreite, auch Spannweite (Range) genannt
- Interquartilbereiche
- Mittlere absolute Abweichung
Zusammenhangsmaße geben an, wie stark zwei betrachtete Merkmale miteinander korrelieren.
Beispiele
- Darstellung der Durchschnittstemperatur und der Temperaturschwankungen in einer Region durch Mittelwert und Streuung; Angabe, wie oft bestimmte Temperaturen überschritten werden (Quantil); Vergleich nach Regionen und/oder Zeiträumen mithilfe von Grafiken oder Tabellen.
- In einer Urne sind fünf rote und vier blaue Kugeln. Es werden drei Kugeln ohne Zurücklegen aus dieser Urne gezogen. Definiert man die Zufallsvariable X: Zahl der roten Kugeln unter den drei gezogenen, ist X hypergeometrisch verteilt mit M=5 als Zahl der roten Kugeln in der Urne, N=9 als Gesamtzahl der Kugeln in der Urne und n=3 als Zahl der Versuche. Hier können alle Informationen über die Verteilung von X gewonnen werden.
Siehe auch
- Datenschürfung (data mining)
- Häufigkeitsverteilung
- Kontingenztafel
- Lorenzkurve
- Schätzen und Testen
- Signifikante Stellen in der Messtechnik
- Versuchsplanung
Literatur
- Bol, Georg: Deskriptive Statistik. Oldenbourg Verlag 2004, ISBN 3-486-57612-7.
- Burkschat, M.; Cramer, E.; Kamps, U.: Beschreibende Statistik. Grundlegende Methoden. Springer, Berlin 2004, ISBN 3-540-03239-8.
Weblinks
- Rößler, Irene / Ungerer, Albrecht: Formelsammlung zur deskriptiven Statistik
Wikimedia Foundation.