Quantile-Quantile-Plot

Ein Quantile-Quantile-Plot (Q-Q-Plot, Quantil-Quantil-Diagramm) ist ein exploratives, grafisches Werkzeug, in dem die Quantile zweier statistischer Variablen gegeneinander abgetragen werden, um ihre Verteilungen zu vergleichen.

Ein Probability-Probability-Plot (P-P-Plot) ist ein exploratives, grafisches Werkzeug, in dem die Verteilungsfunktionen zweier statistischer Variablen gegeneinander abgetragen werden, um ihre Verteilungen zu vergleichen.

Inhaltsverzeichnis

1 Q-Q-Plot
- 1.1 Vergleich der Verteilung zweier statistischer Merkmale
- 1.2 Überprüfung der Verteilung eines Merkmals
  - 1.2.1 Formale Definition
  - 1.2.2 Trendbereinigter Q-Q-Plot
2 P-P-Plot
- 2.1 Überprüfung der Verteilung eines Merkmals
- 2.2 Trendbereinigter P-P-Plot
3 Anwendungsbeispiele
4 Literatur
5 Weblinks

Q-Q-Plot

Vergleich der Verteilung zweier statistischer Merkmale

Die Beobachtungswerte zweier Merkmale, deren Verteilung man vergleichen will, werden jeweils der Größe nach geordnet. Diese geordneten Daten werden zu Wertepaaren zusammengefasst und in einem Koordinatensystem abgetragen. Ergeben die Punkte (annähernd) eine Gerade, kann man vermuten, dass den beiden Merkmalen die gleiche Verteilung zu Grunde liegt. Problematisch ist das Verfahren, wenn von den beiden Merkmalen unterschiedlich viele Beobachtungen vorliegen. Hier kann mit Interpolationsverfahren abgeholfen werden.

Angegeben ist hier ein Beispiel für ca. 110 Kriegsschiffe bei Ausbruch des zweiten Weltkriegs. Erhoben wurden die Variablen Länge und Breite. Das Streudiagramm zeigt, dass es offensichtlich zwei unterschiedliche Gruppen gibt, die sich deutlich als Cluster abheben. Für den Quantile-Quantile-Plot wurden die Daten standardisiert, um die Vergleichbarkeit zu erleichtern. Man sieht an der Lücke in der Punktkurve das Zerfallen der Daten in zwei Cluster. Für den Cluster unten links scheint der Typ der Verteilung für beide Variablen gleich zu sein. Für den zweiten Cluster oben rechts ist die Breite im Vergleich zum ersten Cluster tendenziell größer. Die „Ausbeulung" des Plots zeigt, dass hier die Verteilungen von Länge und Breite ungleich sind.

Streudiagramm der Variablen Länge und Breite

Q-Q-Plot der Variablen Länge und Breite

Überprüfung der Verteilung eines Merkmals

Q-Q-Plot mit großen Abweichungen zwischen den Verteilungen

Q-Q-Plot der Breite von Kriegsschiffen verglichen mit der Normalverteilung

Trendbereinigter Q-Q-Plot der Breite von Kriegsschiffen verglichen mit der Normalverteilung

Die Beobachtungswerte eines Merkmals werden der Größe nach geordnet. Als Vergleich dienen die Quantile der theoretischen Verteilung, die dem entsprechenden Verteilungswert zugehören. Wenn die Merkmalswerte aus der Vergleichsverteilung stammen, stimmen die empirischen und die theoretischen Quantile annähernd überein, d. h. die Werte liegen auf einer Diagonalen.

Der Quantile-Quantile-Plot kann jedoch nicht einen Verteilungstest ersetzen.

Formale Definition

Zu jeder der $n$ Beobachtungen $x i$ wird ein empirischer Unterschreitungsanteil $p i = F e m p i r i s c h (x i)$ bestimmt. Mit Hilfe der inversen Verteilungsfunktion (oder Quantilsfunktion) der theoretischen Verteilung wird das Quantil

$y_i = F^{-1}_{theoretisch}(p_i)$

berechnet. Geplottet wird nun $x i$ versus $y i$ .

Die Berechnung des Unterschreitungsanteils $p i$ erfolgt mit Hilfe des Rangs $R (x i)$ der Beobachtung $x i$ :

Methode	Formel für $p i$	$p i$ für
		$R (x i) = 1$	$R (x i) = n$
Blom	$\frac{R(x_i)-3/8}{n+1/4}$	$\frac{5}{8n+2}$	$\frac{8n-3}{8n+2}$
Rankit	$\frac{R(x_i)-1/2}{n}$	$\frac{1}{2n}$	$\frac{2n-1}{2n}$
Tukey	$\frac{R(x_i)-1/3}{n+1/3}$	$\frac{2}{3n+1}$	$\frac{3n-1}{3n+1}$
Van der Waerden	$\frac{R(x_i)}{n+1}$	$\frac{1}{n+1}$	$\frac{n}{n+1}$

Trendbereinigter Q-Q-Plot

Im trendbereinigten Quantile-Quantile-Plot werden statt $(x i, y i)$ die Punkte $(x i, x i - y i)$ geplottet. Stimmen die empirische und die theoretische Verteilung überein, so liegen alle Punkte auf $(x i, 0)$ . Die Abweichungen von der Nulllinie parallel zur Y-Achse kommen nur von den Differenzen zwischen der empirischen und theoretischen Verteilung. Im Quantil-Quantil-Plot gehen die Punkte im Diagramm immer von links unten nach rechts oben, d.h. Abweichungen parallel zur Y-Achse (oder auch zur X-Achse) kommen nicht nur von den Differenzen zwischen der empirischen und theoretischen Verteilung. Der Trendbereinigte Q-Q-Plot bietet also eine bessere Ansicht der Abweichungen als der Q-Q-Plot.

P-P-Plot

P-P-Plot der Breite von Kriegsschiffen verglichen mit der Normalverteilung

Trendbereinigter P-P-Plot der Breite von Kriegsschiffen verglichen mit der Normalverteilung

Überprüfung der Verteilung eines Merkmals

Für die Beobachtungswerte werden die Unterschreitungsanteile $p i$ nach Blom etc. berechnet. Für die zu vergleichende Verteilung werden die Beobachtungswerte in die kumulierte theoretische Verteilungsfunktion eingesetzt. So erhält man den theoretischen Unterschreitungsanteil $t i = F t h e o r e t i s c h (x i)$ . Wenn die Merkmalswerte aus der Vergleichsverteilung stammen, stimmen die Werte von $p i$ und $t i$ annähernd überein, d. h. die Werte liegen auf einer Diagonalen.

Im Gegensatz zum Q-Q-Plot haben die Ränder der Verteilung beim P-P-Plot einen geringeren visuellen Einfluss. Der Probability-Probability-Plot kann jedoch nicht einen Verteilungstest ersetzen.

Trendbereinigter P-P-Plot

Im trendbereinigten Probability-Probability-Plot werden statt $(p i, t i)$ die Punkte $(p i, p i - t i)$ geplottet. Stimmen die empirische und die theoretische Verteilung überein, so liegen alle Punkte auf $(p i, 0)$ . Wie beim trendbereinigten Q-Q-Plot bietet diese Grafik eine bessere Übersicht über die Abweichungen.

Anwendungsbeispiele

Vergleich einer empirischen Häufigkeitsverteilung mit einer theoretischen bzw. hypothetischen Verteilung:
- Grafische Inspektion von Regressionsresiduen auf Normalverteilung
- Optische Prüfung von Verteilungsvoraussetzungen vor der Durchführung eines parametrischen Testverfahrens

Literatur

Hartung, Joachim, Elpelt, Bärbel, Klösener, Karl-Heinz: Statistik, München 2002
J. M. Chambers, W. S. Cleveland, Beat Kleiner, Paul A. Tukey: Graphical Methods for Data Analysis, Wadsworth, 1983.

Weblinks

Kurzer Artikel über QQ-Plots auf bb-sbl.de

Kategorie:

Diagramm (Statistik)

Wikimedia Foundation.

Игры ⚽ Поможем написать курсовую

Schlagen Sie auch in anderen Wörterbüchern nach:

Quantile — Quantiles are points taken at regular intervals from the cumulative distribution function of a random variable. Dividing ordered data into q essentially equal sized data subsets is the motivation for q quantiles; the quantiles are the data values … Wikipedia
Plot (graphics) — Scatterplot of the eruption interval for Old Faithful (a geyser). A plot is a graphical technique for representing a data set, usually as a graph showing the relationship between two or more variables. The plot can be drawn by hand or by a… … Wikipedia
Normal-Quantil-Plot — Ein Quantile Quantile Plot, kurz auch Q Q Plot genannt, ist eine grafische Darstellung, in der die Quantile zweier statistischer Variablen gegeneinander abgetragen werden. Der Quantile Quantile Plot wurde als Verfahren der explorativen… … Deutsch Wikipedia
Q-Q-Plot — Ein Quantile Quantile Plot, kurz auch Q Q Plot genannt, ist eine grafische Darstellung, in der die Quantile zweier statistischer Variablen gegeneinander abgetragen werden. Der Quantile Quantile Plot wurde als Verfahren der explorativen… … Deutsch Wikipedia
QQ-Plot — Ein Quantile Quantile Plot, kurz auch Q Q Plot genannt, ist eine grafische Darstellung, in der die Quantile zweier statistischer Variablen gegeneinander abgetragen werden. Der Quantile Quantile Plot wurde als Verfahren der explorativen… … Deutsch Wikipedia
Qq-plot — Ein Quantile Quantile Plot, kurz auch Q Q Plot genannt, ist eine grafische Darstellung, in der die Quantile zweier statistischer Variablen gegeneinander abgetragen werden. Der Quantile Quantile Plot wurde als Verfahren der explorativen… … Deutsch Wikipedia
Quantil-Quantil-Plot — Ein Quantile Quantile Plot, kurz auch Q Q Plot genannt, ist eine grafische Darstellung, in der die Quantile zweier statistischer Variablen gegeneinander abgetragen werden. Der Quantile Quantile Plot wurde als Verfahren der explorativen… … Deutsch Wikipedia
Q-Q plot — Not to be confused with P P plot. A normal Q Q plot of randomly generated, independent standard exponential data, (X Exp(1)). This Q Q plot compares a sample of data on the vertical axis to a statistical population on the horizontal… … Wikipedia
Probability plot — The probability plot is a graphical technique for assessing whether or not a data set follows a given distribution such as the normal or Weibull, and for visually estimating the location and scale parameters of the chosen distribution. The data… … Wikipedia
Normal probability plot — The normal probability plot is a graphical technique for normality testing: assessing whether or not a data set is approximately normally distributed. Example of a normal probability plot. The data are plotted against a theoretical normal… … Wikipedia

Academic dictionaries and encyclopedias

Quantile-Quantile-Plot

Inhaltsverzeichnis

Q-Q-Plot

Vergleich der Verteilung zweier statistischer Merkmale