Clustan

Clustan

Clustan ist eines der ältesten integrierten Statistik-Programme zur Clusteranalyse und zum Data-Mining. Die Anfänge gehen auf Fortran-Programme aus dem Jahr 1968 zurück. David Wishart ist gleichzeitig der Entwickler und Chef der Firma Clustan Ltd aus Edinburgh. In den 1990er Jahren wurde die Software von ihm an den (Windows-)PC angepasst und mit einer interaktiven Grafikausgabe versehen.

Inhaltsverzeichnis

Themengebiete der Clustan-Software

Hierarchische Cluster Methoden

  • Cluster: hierarchische Clusteranalyse auf Datenmatrizen
  • Hierarchy: hierarchische Clusteranalysen auf Ähnlichkeitsmatrizen
  • Centroid: Schwerpunktbildung in Ähnlichkeitsmatrizen
  • Density: hierarchische Dichteschätzer-Methode
  • Divide: hierarchische Verteilungsclusterbildung auf binäre Variablen

Nicht-hierarchische Cluster Methoden

  • Classify: Identifizierung von neuen Fällen durch Traversierung von Clusterbäumen
  • Normix: Maximum-Likelihood Abschätzung der Maßgrößen von multivariaten Normalverteilungen mit Signifikanztests
  • Invariant: iterative Optimierung von Wilks' Lambda or Hotelling's Trace
  • Mode: Finden „natürlicher“ Cluster durch Schätzung disjunkter Dichteflächen
  • Relocate: iterative Zuordnung zu Clusters (k-means-Algorithmus)
  • Kdend: Suche von Bk-overlapping-clusters (Jardine-Sibson Clustermethode, siehe Voronoi-Interpolation)
  • Dndrite: Teilung von minimal reichenden Bäumen, um die Summe der Fehlerquadrate zu minimieren (Regressionsanalyse)
  • Euclid: fuzzy Clusterung, um Quadratsummen zu minimieren

Sonstige statistische und grafische Hilfsroutinen

  • Read similarity matrix: Lesen von Ähnlichkeitsmatrizen
  • Calculate similarity matrix: Berechnen einer Ähnlichkeitsmatrix mit einer Vielzahl von verschiedenen Koeffizienten
  • Print results: Druck der Clusteranalyse-Ergebnisse
  • Scatter: Zeichnen von Scatter- und Cluster-Diagrammen (Plots)
  • Plink: Zeichnen hierarchischer Cluster-Bäume
  • Rules: Signifikanztests für die beste Aufteilung
  • Compare: Vergleich hierarchischer Klassifikationen

Grafische Darstellungssoftware

  • ClustanGraphics: interaktive Software um die Ergebnisse grafisch anzusehen

Siehe auch

Weblinks


Wikimedia Foundation.

Игры ⚽ Нужно сделать НИР?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Data Mining — Unter Data Mining (englisch für „Datenschürfen“) versteht man die systematische Anwendung von Methoden, die meist statistisch mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung. Hierbei geht es vor allem um das… …   Deutsch Wikipedia

  • Data mining — Unter Data Mining (englisch für „Datenschürfen“) versteht man die systematische Anwendung von Methoden, die meist statistisch mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung. Hierbei geht es vor allem um das… …   Deutsch Wikipedia

  • Dataminer — Unter Data Mining (englisch für „Datenschürfen“) versteht man die systematische Anwendung von Methoden, die meist statistisch mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung. Hierbei geht es vor allem um das… …   Deutsch Wikipedia

  • Datamining — Unter Data Mining (englisch für „Datenschürfen“) versteht man die systematische Anwendung von Methoden, die meist statistisch mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung. Hierbei geht es vor allem um das… …   Deutsch Wikipedia

  • Datenschürfung — Unter Data Mining (englisch für „Datenschürfen“) versteht man die systematische Anwendung von Methoden, die meist statistisch mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung. Hierbei geht es vor allem um das… …   Deutsch Wikipedia

  • Matchplus — Unter Data Mining (englisch für „Datenschürfen“) versteht man die systematische Anwendung von Methoden, die meist statistisch mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung. Hierbei geht es vor allem um das… …   Deutsch Wikipedia

  • Missing values — In statistics, missing values are a common occurrence. Several statistical methods have been developed to deal with this problem. Missing values mean that no data value is stored for the variable in the current observation. Modern statistical… …   Wikipedia

  • Data-Mining — Unter Data Mining (der englische Begriff bedeutet etwa „aus einem Datenberg etwas Wertvolles extrahieren“, eine adäquate deutsche Übersetzung existiert nicht.[1] Der Duden empfiehlt die Schreibweise „Data Mining“[2]) versteht man die… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”