Grand Tour (Statistik)

Grand Tour (Statistik)

Die Grand Tour ist ein Verfahren zur explorativen Analyse hochdimensionaler multivariater Daten, das zuerst von Daniel Asimov und Andreas Buja beschrieben wurde[1][2].

Dargestellt ist eine Projektion einer Grand Tour durch Daten mit sechs Dimensionen. Drei Cluster sind erkennbar. Die Abbildung wurde mit GGobi erstellt, zwei Punkte als Ausreißer gelb markiert.

In der Grand Tour stellt man die Datenpunkte als Streudiagramm reduziert auf jeweils zwei oder drei Dimensionen dar und dreht die Darstellung nacheinander um jeweils eine der Achsen. Nach dem Durchgang durch die drei Drehungen wird eine der noch nicht untersuchten Dimensionen hinzugenommen, dafür eine bereits betrachtete weggelassen und dieser um die Achsen gedreht und so fort, bis alle Dimensionskombinationen unter allen Betrachtungswinkeln durchlaufen sind. Auf diese Weise bekommt der Betrachter die Punktwolke unter jedem möglichen Winkel und von allen Seiten zu sehen.

Der Vorteil dieser Methode ist, dass es schnell möglich ist, sich über die Struktur der Daten ein intuitives Bild zu machen und auch nichtlineare Zusammenhänge zu erkennen, die mit klassischen, schematischen multivariaten Methoden wie Varianzanalyse oder Clusteranalyse übersehen worden wären.

Mathematisch gesehen werden die Datenpunkte auf Hyperebenen mit jeweils zwei oder drei Dimensionen projiziert und nacheinander jede mögliche solche Projektion durchlaufen. Die Grand Tour ist deshalb mit dem Verfahren Projection Pursuit verwandt. Dass es ausreicht, viele niedrigdimensionale Projektionen der Daten anzuschauen um die multivariate Verteilung zu verstehen, wird durch den Satz von Cramér-Wold gesichert.

Weblinks

GGobi: freie Software zur statistischen Analyse; bietet Grand Tour.

Literatur

  • Dianne Cook, Andreas Buja, Javier Cabrera and Catherine Hurley: Grand Tour and Projection Pursuit in Journal of Computational and Graphical Statistics. IV, 3 (1995), S. 155ff
  • J. D. Salch, D. W. Scott: Data Exploration with the Density Grand Tour in Statistical Graphics and Computing Newsletter, ASA Nr. 8 (1997) S.7ff.

Einzelnachweise

  1. Daniel Asimov:The Grand Tour. SIAM Journal on Science and Statistical Computing IV, 1 (1985), S. 185ff
  2. Andreas Buja, Daniel Asimov: Grand Tour Methods. in D. Allen (Hsgb.): Computer Science and Statistics. Proceedings of the 17th Symposium on the Interface, Elsevier (North Holland) 1986.

Wikimedia Foundation.

Игры ⚽ Поможем сделать НИР

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Tour de France — Das Logo der Tour de France Siegerpodest der Tour de France …   Deutsch Wikipedia

  • Tour de france — Die Tour de France [ˌtuʀdəˈfʀɑ̃ːs], auch Grande Boucle [gʀɑ̃dˈbukl] („Große Schleife“) oder einfach Le Tour [ləˈtuːʀ] genannt, ist das berühmteste und für die Fahrer bedeutendste Radrennen der Welt. Seit 1903 wird die Tour alljährlich – mit… …   Deutsch Wikipedia

  • Tour der Leiden — Die Tour de France [ˌtuʀdəˈfʀɑ̃ːs], auch Grande Boucle [gʀɑ̃dˈbukl] („Große Schleife“) oder einfach Le Tour [ləˈtuːʀ] genannt, ist das berühmteste und für die Fahrer bedeutendste Radrennen der Welt. Seit 1903 wird die Tour alljährlich – mit… …   Deutsch Wikipedia

  • ATP Tour 2000 — In den folgenden Tabellen wird der Verlauf der professionellen Herrentennis Saison 2000 (ATP Tour) dargestellt. Zunächst werden alle Turniere ihrem Beginn nach mit den jeweiligen Einzel und Doppelsiegern aufgelistet, danach wird die Weltrangliste …   Deutsch Wikipedia

  • Karhunen-Loève-Transformation — Hauptkomponentenanalyse als Faktorenanalyse: Zwei Hauptkomponenten einer zweidimensionalen Punktwolke (orthogonal rotiert) Die Hauptkomponentenanalyse (englisch: Principal Component Analysis, PCA) ist ein Verfahren der multivariaten Statistik.… …   Deutsch Wikipedia

  • Karhunen-Loéve-Transformation — Hauptkomponentenanalyse als Faktorenanalyse: Zwei Hauptkomponenten einer zweidimensionalen Punktwolke (orthogonal rotiert) Die Hauptkomponentenanalyse (englisch: Principal Component Analysis, PCA) ist ein Verfahren der multivariaten Statistik.… …   Deutsch Wikipedia

  • Principal Component Analysis — Hauptkomponentenanalyse als Faktorenanalyse: Zwei Hauptkomponenten einer zweidimensionalen Punktwolke (orthogonal rotiert) Die Hauptkomponentenanalyse (englisch: Principal Component Analysis, PCA) ist ein Verfahren der multivariaten Statistik.… …   Deutsch Wikipedia

  • Projection Pursuit — Inhaltsverzeichnis 1 Exploratory Projection Pursuit 1.1 Indizes 1.2 Verwandte Methoden 2 Projection Pursuit Regression …   Deutsch Wikipedia

  • Explorative Datenanalyse — Die explorative Datenanalyse (EDA) oder explorative Statistik ist ein Teilgebiet der Statistik. Sie untersucht und begutachtet Daten, von denen nur ein geringes Wissen über deren Zusammenhänge vorliegt. Viele EDA Techniken werden im Data Mining… …   Deutsch Wikipedia

  • Hauptkomponentenanalyse — als Faktorenanalyse: Zwei Hauptkomponenten einer zweidimensionalen Punktwolke (orthogonal rotiert) Die Hauptkomponentenanalyse (siehe auch Hauptachsentransformation oder Singulärwertzerlegung) oder englisch Principal Component Analysis (PCA) …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”