Interquartilsabstand

Interquartilsabstand
Quantile als Umkehrfunktion der Verteilungsfunktion: Zwei Beispiele: Einmal die Standardnormalverteilung und einmal eine Chi-Quadrat-Verteilung mit drei Freiheitsgraden (schiefe Verteilung). Den jeweiligen Wahrscheinlichkeiten werden ihre Quantile zugeordnet; die Fläche unter der abgebildeten Dichte von minus Unendlich bis zum Quantil ist der jeweilige Wert.

Quantile sind ein Streuungsmaß in der Statistik. Quantile sind Punkte einer nach Rang oder Größe der Einzelwerte sortierten statistischen Verteilung.

Wird die gesamte Verteilung in n gleich große Teile unterteilt, so gibt es n − 1 Quantile, also umgangssprachlich die Schnittstellen. Je nachdem, wie groß n gewählt wird, spricht man z. B. von Quartilen (n = 4), Quintilen (n = 5), Dezilen (n = 10) und Perzentilen (n = 100). Dabei ist der Wert eines bestimmten Quantils (z. B. des zweiten Quintils) nicht größer als jeder Wert unterhalb dieses Quantils (siehe auch „Beispiele“).

Inhaltsverzeichnis

Definition

Als Quantil der Ordnung p oder p-Quantil (Qp; veraltet auch „Fraktil“) wird in der Statistik ein Merkmalswert bezeichnet, unterhalb dessen ein vorgegebener Anteil p aller Fälle der Verteilung liegt. Jeder Wert unterhalb von Qp unterschreitet diesen vorgegebenen Anteil. Deshalb wird p auch als Unterschreitungsanteil bezeichnet. Dabei ist p eine reelle Zahl zwischen 0 (gar kein Fall der Verteilung) und 1 (alle Fälle oder 100 % der Verteilung).

Allgemeiner wird in der Mathematik das p-Quantil wie folgt definiert. Sei X eine Zufallsvariable und F ihre Verteilungsfunktion, so heißt für p\in(0,1) die durch

F^{-1}(p):=\inf\{x\in\R:F(x)\ge p\}

definierte Funktion F − 1 Quantilfunktion. F − 1(p) wird als p-Quantil von F (oder X) bezeichnet.

Beispiel

Das Quantil Q.3 (oder 0,3-Quantil) ist der Wert des Punktes einer Verteilung, unterhalb dessen sich 30 % aller Fälle der Verteilung befinden.

Ein p-Quantil mit Unterschreitungsanteil

Besondere Quantile

Für einige bestimmte p haben die p-Quantile zusätzliche Bezeichnungen.

Median

Der Median oder Zentralwert entspricht dem Quantil Q.5 (0,5-Quantil). Es erfolgt also eine Einteilung der gesamten Verteilung in zwei gleich große Teile. Bei jeder Einteilung in eine ungerade Anzahl von p-Quantilen mit äquidistant-verteilten p (was eine gerade Anzahl gleich großer Teile impliziert) entspricht der Median jeweils dem mittleren Quantil (beispielsweise dem 2. Quartil Q2 oder dem 50. Perzentil P50).

Quartil

Darstellung des Interquartilabstands einer Normalverteilung.

Quartile (lat. „Viertelwerte“) sind die Quantile Q.25 (0,25-Quantil), Q.5 (0,5-Quantil=Median) und Q.75 (0,75-Quantil), die auch als Q1 („unteres Quartil“), Q2 („mittleres Quartil“) und Q3 („oberes Quartil“) bezeichnet werden. Sie sind die in der Statistik mit am häufigsten verwendete Form der Quantile.

Der (Inter-)Quartilabstand oder auch (Inter-)Quartilsabstand (engl. interquartile range) bezeichnet die Differenz zwischen dem oberen und dem unteren Quartil, also Q.75Q.25 und umfasst daher 50 % der Verteilung. Der Quartilabstand wird als Streuungsmaß verwendet.

Siehe auch: Streuung (Statistik)

Quintil

Durch Quintile (lat. „Fünftelwerte“) wird die Verteilung in 5 gleich große Teile zerlegt. Unterhalb des ersten Quintils, d. h. des Quantils Q.2, liegen 20 % der Verteilung, unterhalb des zweiten Quintils (Quantil Q.4) 40 % usw.

Dezil

Durch Dezile (lat. „Zehntelwerte“) wird die Verteilung in 10 gleich große Teile zerlegt. Entsprechend liegen dann z. B. unterhalb des dritten Dezils (Quantil Q.3) 30 % der Verteilung. Dezile teilen ein der Größe nach geordnetes Datenbündel in 10 gleich große Teile. Das 10-%-Dezil (oder 1. Dezil) gibt an, welcher Wert die unteren 10 % von den oberen 90 % der Datenwerte trennt, das 2. Dezil, welcher Wert die unteren 20 % von den oberen 80 % der Werte trennt, usw. Der Abstand zwischen dem 10-%-Dezil und dem 90-%-Dezil heißt Interdezilbereich.

Perzentil

Durch Perzentile (lat. „Hundertstelwerte“), auch Prozentränge genannt, wird die Verteilung in 100 gleich große Teile zerlegt. Perzentile teilen die Verteilung also in 1-%-Segmente auf. Daher können Perzentile als Quantile betrachtet werden, bei denen 100 \cdot p eine ganze Zahl ist. So entspricht das Quantil Q.97 dem Perzentil P97: unterhalb dieses Punktes liegen 97 % aller Fälle der Verteilung.

a-Fraktil

Für a aus (0,1) wird das (1 − a)-Quantil auch als a-Fraktil bezeichnet.

Beispiele

  • Wenn eine Schule 141 Schüler hat, so hat derjenige Schüler den Alters-Prozentrang von 50, der älter ist als die 70 jüngeren Schüler, aber jünger als die 70 älteren Schüler. Ein Prozentrang von 50 oder das 50. Perzentil entspricht dem 0,5-Quantil, also dem Median.
    Für den Prozentrang ist unerheblich, welche Altersunterschiede zwischen den Schülern bestehen; der Prozentrang gibt nur Auskunft über die Position des Einzelnen innerhalb der Gruppe (Stichprobe). Das Alter der Person mit Prozentrang 50 ist deshalb nicht identisch mit dem Durchschnittsalter der betrachteten Gruppe. Deshalb würde sich am Median auch nichts ändern, wenn man die älteren 70 Schüler durch 70 Rentner ersetzen würde.
  • In einer Schulklasse sind 13 Aufsätze geschrieben worden, mit der folgenden (sortierten) Notenverteilung:
   Aufsatz A B C D E F G H I J K L M
   Note    1 2 2 2 3 3 3 4 4 4 4 5 6
Die Noten der Aufsätze D („2“), G („3“) und J („4“) entsprechen jeweils Q1, Q2 (d. h. dem Median) und Q3.
  • Wird die Körpergröße eines Kindes als Perzentil ausgedrückt, bedeutet dies, dass die Körpergröße in Bezug auf die Körpergrößen der Altersgenossen angegeben wird. Eine Körpergröße auf dem 20. Perzentil bedeutet beispielsweise, dass 20 % der Kinder gleichen Alters und gleichen Geschlechts nicht größer als das betreffende Kind sind (80 % sind größer).

Siehe auch

Literatur

  • Hans-Otto Georgii: Stochastik. 2 Auflage. de Gruyter, Berlin 2004, ISBN 3110182823, S. 225 (Definition Quantil, Quartil, a-Fraktil.). 

Wikimedia Foundation.

Игры ⚽ Нужна курсовая?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Box-Plot — Ein vertikaler Boxplot über einem Zahlenstrahl dargestellt Der Boxplot (auch Box Whisker Plot oder deutsch Kastengrafik) ist ein Diagramm, das zur graphischen Darstellung der Verteilung statistischer Daten verwendet wird. Er fasst dabei… …   Deutsch Wikipedia

  • Box-Whisker-Plot — Ein vertikaler Boxplot über einem Zahlenstrahl dargestellt Der Boxplot (auch Box Whisker Plot oder deutsch Kastengrafik) ist ein Diagramm, das zur graphischen Darstellung der Verteilung statistischer Daten verwendet wird. Er fasst dabei… …   Deutsch Wikipedia

  • Boxplot — Ein vertikaler Boxplot über einem Zahlenstrahl dargestellt Der Boxplot (auch Box Whisker Plot oder deutsch Kastengrafik) ist ein Diagramm, das zur grafischen Darstellung der Verteilung kardinalskalierter Daten verwendet wird. Es fasst dabei… …   Deutsch Wikipedia

  • Kastengrafik — Ein vertikaler Boxplot über einem Zahlenstrahl dargestellt Der Boxplot (auch Box Whisker Plot oder deutsch Kastengrafik) ist ein Diagramm, das zur graphischen Darstellung der Verteilung statistischer Daten verwendet wird. Er fasst dabei… …   Deutsch Wikipedia

  • Schachteldiagramm — Ein vertikaler Boxplot über einem Zahlenstrahl dargestellt Der Boxplot (auch Box Whisker Plot oder deutsch Kastengrafik) ist ein Diagramm, das zur graphischen Darstellung der Verteilung statistischer Daten verwendet wird. Er fasst dabei… …   Deutsch Wikipedia

  • Streuung (Statistik) — Unter Streuung (auch Dispersion) fasst man in der deskriptiven Statistik verschiedene Maßzahlen zur Beschreibung der Streubreite von Werten einer Häufigkeitsverteilung oder Wahrscheinlichkeitsverteilung zusammen, um einen geeigneten Lageparameter …   Deutsch Wikipedia

  • Histogramm — Beispiel für ein Histogramm Ein Histogramm ist eine graphische Darstellung der Häufigkeitsverteilung metrisch skalierter Merkmale. Ein Histogramm erfordert die Einteilung der Daten in Klassen, die eine konstante oder variable Breite haben können …   Deutsch Wikipedia

  • Häufigkeitsverteilung — Beispiel einer (absoluten) Häufigkeitsverteilung: prognostizierte Altersverteilung für Deutschland im Jahr 2050 Eine Häufigkeitsverteilung ist eine Methode zur statistischen Beschreibung von Daten (Messwerten, Merkmalswerten). Mathematisch… …   Deutsch Wikipedia

  • Variationskoeffizient — Der Variationskoeffizient ist eine statistische Kenngröße in der deskriptiven Statistik und der mathematischen Statistik. Im Gegensatz zur Varianz ist er ein relatives Streuungsmaß, d.h er hängt nicht von der Maßeinheit der statistische Variablen …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”