GGobi

GGobi

GGobi ist eine Statistik-Software um hochdimensionale multivariate Daten mit dynamischer Grafik zu visualisieren und zu analysieren. GGobi kann in R voll integriert werden. Innerhalb der GGobi-Grafiken wird das Brushing und Linking der Datenpunkte unterstützt.

Inhaltsverzeichnis

Überblick

GGobi wurde entwickelt, um hochdimensionale Datenmatrizen zu visualisieren. Die Entwickler waren an der Erforschung hochdimensionaler Datenstrukturen interessiert. Der Name der Software änderte sich mehrfach im Laufe der Zeit, insbesondere weil sich die zugrundeliegende Technologie änderte:

  • Mitte der 1980er Jahre: Dataviewer,
  • 1989: XGobi und
  • ab 1999: GGobi.

GGobi ist unter einer Lizenz veröffentlicht, die eine Kombination dreier Freier Lizenzen ist, somit ist GGobi Freie Software.[1]

2D-Projektion (Grand Tour) eines sechsdimensionalen Datensatzes. Es sind drei Cluster sichtbar und zwei Datenpunkte sind gelb hervorgehoben.
Paralleler Koordinaten Plot der mit dem Grand Tour Plot gelinkt ist. Die beiden gelb markierten Datenpunkte sind hier ebenfalls gelb markiert.

Grafiken

Grafiken können mehr Informationen über eine Verteilung enthüllen als Kennzahlen. Verschiedene Werkzeuge in GGobi unterstützen die Entdeckung von Clustern, nichtlinearen Strukturen, Ausreissern und anderen Strukturen in hochdimensionalen Daten.

Variable(n) Grafik(en)
1 Average Shifted Histogramm, Dotplot, Balkendiagramm, Spineplot
2 Streudiagramm
>2 Streudiagramm-Matrix, Paralleler Koordinatenplot, Grand Tour, Projection Pursuit (geführt und manuell)

Interaktivität

Mit Hilfe der interaktiven Werkzeuge können Datenpunkte oder Cluster markiert werden:

  • Brushing
Wenn das Brush-Rechteck über einen Datenpunkt geht, wird er mit einem vorher gewählten Symbol und/oder Farbe angezeigt. Ist die persistent-Option für die Brush ausgewählt, behält der Datenpunkt die Farbe und das Symbol auch dann, wenn er nicht mehr Brush-Rechteck liegt. Ansonsten wird sein Symbol und die Farbe wieder wie ursprünglich angezeigt.
  • Identifizieren
Wenn der Cursor auf einen Datenpunkt kommt, wird ein Text oder Variablenwert angezeigt.
  • Linking
Werden die Datenpunkte eines Datensatzes in verschiedenen Grafiken gleichzeitig dargestellt, dann führt die Änderung eines Symbols oder einer Farbe eines Datenpunktes in einer Grafik zu entsprechenden Änderungen in allen Grafiken.

Literatur

  • Buja, A., D. Cook, and D.F. Swayne (March 1998). "XGobi: Interactive Dynamic Data Visualization in the X Window System". in: Journal of Computational and Graphical Statistics 7 (1): 113–130.
  • Buja, A., D.T. Lang, and D.F. Swayne (August 28, 2003). "GGobi: Evolving From XGobi into an Extensible Framework for Interactive Data Visualization". In: Journal of Computational Statistics and Data Analysis 43 (4): 423–444.
  • Cook, D. and D.F. Swayne (2007). Interactive and Dynamic Graphics for Data Analysis. Springer.

Weblinks

Einzelnachweise

  1. GGobi licences page. Abgerufen am 31. Dezember 2010.

Wikimedia Foundation.

Игры ⚽ Нужна курсовая?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • GGobi — Infobox programming language name = GGobi paradigm = year = designer = developer = Deborah Swayne, Michael Lawrence, Hadley Wickham, Duncan Temple Lang, Di Cook, Heike Hofmann and Andreas Buja latest release version = 2.1.7 latest release date =… …   Wikipedia

  • Projection Pursuit — Inhaltsverzeichnis 1 Exploratory Projection Pursuit 1.1 Indizes 1.2 Verwandte Methoden 2 Projection Pursuit Regression …   Deutsch Wikipedia

  • Exploratory data analysis — (EDA) is an approach to analyzing data for the purpose of formulating hypotheses worth testing, complementing the tools of conventional statistics for testing hypotheses And roughly the only mechanism for suggesting questions is exploratory. And… …   Wikipedia

  • Parallel coordinates — is a common way of visualizing high dimensional geometry and analyzing multivariate data. To show a set of points in an n dimensional space, a backdrop is drawn consisting of n parallel lines, typically vertical and equally spaced. A point in n… …   Wikipedia

  • Explorative Statistik — Die explorative Datenanalyse (EDA) oder explorative Statistik ist ein Teilgebiet der Statistik. Sie untersucht und begutachtet Daten, von denen nur ein geringes Wissen über deren Zusammenhänge vorliegt. Viele EDA Techniken werden im Data Mining… …   Deutsch Wikipedia

  • Grand Tour (Statistik) — Die Grand Tour ist ein Verfahren zur explorativen Analyse hochdimensionaler multivariater Daten, das zuerst von Daniel Asimov und Andreas Buja beschrieben wurde[1][2]. Dargestellt ist eine Projektion einer Grand Tour durch Daten mit sechs Dime …   Deutsch Wikipedia

  • Coordonnées parallèles — Les coordonnées parallèles sont une technique permettant de visualiser un nombre important d informations de façon non ambiguë. Exemple de tracé en coordonnées parallèles Sommaire 1 Principe …   Wikipédia en Français

  • Parallele Koordinaten — Paralleler Koordinatenplot von Flohkäfer Daten mit GGobi. Parallele Koordinaten (auch || Koordinaten; englisch parallel coordinate plot, PCP) sind eine Methode zur Visualisierung von hochdimensionalen Strukturen und multivariater Daten. In… …   Deutsch Wikipedia

  • Data visualization — A data visualization of Wikipedia as part of the World Wide Web, demonstrating hyperlinks Data visualization is the study of the visual representation of data, meaning information that has been abstracted in some schematic form, including… …   Wikipedia

  • Michael Friendly — Michael Lewis Friendly (born 1945) is a Professor of Psychology at York University in Ontario, Canada, and an Associate Coordinator with the Statistical Consulting Service. Contents 1 Biography 2 Work 3 See also 4 …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”