Explorative Statistik

Explorative Statistik

Die explorative Datenanalyse (EDA) oder explorative Statistik ist ein Teilgebiet der Statistik. Sie untersucht und begutachtet Daten, von denen nur ein geringes Wissen über deren Zusammenhänge vorliegt. Viele EDA Techniken werden im Data-Mining eingesetzt. Außerdem werden sie häufig in Statistik-Veranstaltungen als Einführung in das statistische Denken gelehrt.

Diese Benennung wurde von John W. Tukey in den 1970er Jahren eingeführt. Tukey legte dar, dass ein zu großer Schwerpunkt in der Statistik auf das Auswerten und Testen von gegebenen Hypothesen gelegt wird. Ferner schlug er vor, Daten dazu zu verwenden, um mögliche Hypothesen zu erhalten, welche anschließend getestet werden. Tatsächlich kann die Begriffsverwirrung zwischen den zwei Typen der Analyse und der Anwendung dessen auf die gleiche Datenmenge zu einem Bias führen.

Ziele der explorativen Statistik sind:

  • Annahmen (Hypothesen) über die Ursache und den Grund der beobachteten Daten zu bilden
  • Annahmen einzuschätzen worauf statistische Inferenz basieren kann
  • Die Auswahl von passenden statistischen Werkzeugen und Techniken zu unterstützen
  • Eine Basis für die weitere Daten-Sammlung durch Umfragen oder Design von Experimenten bereitzustellen

Grundlegende graphische Methoden, welche in der explorativen Statistik verwendet werden, sind:

Grundlegende quantitative Methoden sind:

  • Median polish
  • Letter values
  • Resistant line
  • Resistant smooth
  • Rootogram

Software

  • GeoDa - Kostenlose, userfreundliche graphische Oberfläche zur Anwendung verschiedener Methoden der explorativen Datenanalyse
  • GGobi - Kostenlose interaktive multivariate Visualisierungs Software mit Verknüpfung zu R.
  • LiveGraph - Open Source Framework für Daten-Visualisierung und Explorative Datenanalyse (beinhaltet einen Echtzeit Graph-Plotter).
  • MANET - Kostenlose Mac interaktive EDA Software.
  • Mondrian - Kostenlose interaktive Software für EDA.
  • Orange - Kostenlose Komponenten-Basierte Software für eine interaktive EDA.
  • Visalix - Kostenlose interaktive Web-Anwendung für Daten-Visualisierung und Explorative Datenanalyse.

Literatur

  • Hoaglin, D C; Mosteller, F & Tukey, J W (Eds) (1985) Exploring Data Tables, Trends and Shapes ISBN 0471097764
  • Hoaglin, D C; Mosteller, F & Tukey, J W (Eds) (1983) Understanding Robust and Exploratory Data Analysis ISBN 0471097772
  • Tukey, J W (1977) Exploratory Data Analysis ISBN 0201076160
  • Velleman, P F & Hoaglin, D C (1981) Applications, Basics and Computing of Exploratory Data Analysis ISBN 087150409X
  • Wolfgang Polasek: EDA Explorative Datenanalyse. Einführung in die deskriptive Statistik (2. Auflage). Springer-Verlag, Berlin 1994, ISBN 9783540583943
  • Siegfried Heiler, Paul Michels: Deskriptive und explorative Datenanalyse. Oldenbourg, München 1994, ISBN 3-486-22786-6

Wikimedia Foundation.

Игры ⚽ Поможем написать реферат

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Statistik — ist die Lehre von Methoden zum Umgang mit quantitativen Informationen (Daten). Sie ist eine Möglichkeit, eine systematische Verbindung zwischen Erfahrung (Empirie) und Theorie herzustellen.[1] Sie ist damit unter anderem die Zusammenfassung… …   Deutsch Wikipedia

  • Explorative Datenanalyse — Die explorative Datenanalyse (EDA) oder explorative Statistik ist ein Teilgebiet der Statistik. Sie untersucht und begutachtet Daten, von denen nur ein geringes Wissen über deren Zusammenhänge vorliegt. Viele EDA Techniken werden im Data Mining… …   Deutsch Wikipedia

  • Statistik — von Professor Dr. Eberhard Schaich I. Begriff Umfassendes methodisch quantitatives Instrumentarium zur Charakterisierung und Auswertung empirischer Befunde bei gleichartigen Einheiten („Massenphänomenen“) mit breiten Einsatzmöglichkeiten in… …   Lexikon der Economics

  • Statistik — Daten; Datenmaterial * * * Sta|tis|tik [ʃta tɪstɪk], die; , en: a) Wissenschaft von der zahlenmäßigen Erfassung, Untersuchung und Auswertung von Massenerscheinungen: vielen BWL Studierenden fällt Statistik schwer. b) schriftliche Zusammenstellung …   Universal-Lexikon

  • explorative Datenanalyse — zusammenfassende Bezeichnung für deskriptive statistische Verfahren zur Aufdeckung von Datenstrukturen und von Abweichungen der Einzelbefunde von einer vorhandenen Grundstruktur. Die e.D., v.a. durch J. Tukey (1970; 1977) konzipiert, entwickelte… …   Lexikon der Economics

  • Deskriptive Statistik — Die deskriptive (auch: beschreibende) Statistik hat zum Ziel, empirische Daten durch Tabellen, Kennzahlen (auch: Maßzahlen oder Parameter) und Grafiken übersichtlich darzustellen und zu ordnen. Dies ist vor allem bei umfangreichem Datenmaterial… …   Deutsch Wikipedia

  • Statistiker — Die Statistik ist die Zusammenfassung bestimmter Methoden, um empirische Daten zu analysieren. Inhaltsverzeichnis 1 Wortherkunft 2 Übersicht und Einteilung 3 Schritte der praktischen Umsetzung der Statistik 4 Sch …   Deutsch Wikipedia

  • Statistisch — Die Statistik ist die Zusammenfassung bestimmter Methoden, um empirische Daten zu analysieren. Inhaltsverzeichnis 1 Wortherkunft 2 Übersicht und Einteilung 3 Schritte der praktischen Umsetzung der Statistik 4 Sch …   Deutsch Wikipedia

  • Statistische Methoden — Die Statistik ist die Zusammenfassung bestimmter Methoden, um empirische Daten zu analysieren. Inhaltsverzeichnis 1 Wortherkunft 2 Übersicht und Einteilung 3 Schritte der praktischen Umsetzung der Statistik 4 Sch …   Deutsch Wikipedia

  • Zahlenwerk — Die Statistik ist die Zusammenfassung bestimmter Methoden, um empirische Daten zu analysieren. Inhaltsverzeichnis 1 Wortherkunft 2 Übersicht und Einteilung 3 Schritte der praktischen Umsetzung der Statistik 4 Sch …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”