- RapidMiner
-
RapidMiner
Ein Bildschirmfoto von RapidMiner (YALE).Basisdaten Entwickler rapid-i.com Aktuelle Version 5.0
(22. Februar 2010)Betriebssystem Plattformunabhängig Kategorie Künstliche Intelligenz Lizenz AGPL, proprietär Deutschsprachig ja SourceForge-Projektseite RapidMiner, zuvor YALE (Yet Another Learning Environment) genannt, ist eine Umgebung für maschinelles Lernen und Data-Mining. Experimente können aus einer großen Zahl von nahezu beliebig schachtelbaren Operatoren erzeugt werden. Der Experimentaufbau wird durch XML beschrieben und mittels einer graphischen Benutzeroberfläche entwickelt. RapidMiner deckt sowohl Forschungs- als auch industrielle und wirtschaftliche Anwendungen ab.
YALE wurde seit 2001 vom Lehrstuhl für künstliche Intelligenz der Technischen Universität Dortmund entwickelt. Seit 2004 wird YALE bei SourceForge gehostet. Im Mai 2007 wurde YALE in RapidMiner umbenannt; im Juli 2007 erschien die Version 4.0 und im November 2008 die Version 4.3. RapidMiner ist als Open-Source-Software unter der AGPL erhältlich, oder als proprietäre Version.
RapidMiner beinhaltet mehr als 500 Operatoren für alle Aufgaben der Wissensentdeckung in Datenbanken, d.h. Operatoren für Ein- und Ausgabe, Datenvorverarbeitung, maschinelles Lernen, Data-Mining, Text Mining, Web Mining, automatische Stimmungsanalyse aus Internet-Diskussionsforen (Sentiment Analysis, Opinion Mining), Zeitreihenanalyse und Prognose. Zusätzlich stehen mehr als 20 Verfahren bereit, auch hoch-dimensionale Daten und Modelle zu visualisieren. RapidMiner wurde in Java geschrieben und kann daher auf allen gängigen Betriebssystemen verwendet werden. Alle Lernverfahren und Attributeevaluatoren der WEKA Lernumgebung wurden ebenfalls integriert.
Eigenschaften
Einige Eigenschaften von RapidMiner sind:
- Prozesse der Wissensentdeckung werden als Operatorbäume modelliert
- Interne XML-Repräsentation sichert einen Standard für den Austausch von Data-Mining-Experimenten
- Skriptsprache erlaubt automatisiertes large-scale Data Mining
- Multi-layered data view concept sichert effiziente und transparent Datenhaltung
- Graphische Benutzeroberfläche sowie Kommandozeilentool. Eine Java-API erlaubt die Benutzung von RapidMiner aus eigenen Javaprogrammen
- Plugin und Erweiterungsmechanismus, es existieren bereits einige Plugins, z.B. zur Clusteranalyse
- Große Anzahl hochdimensionaler Visualisierungen für Daten und Modelle
- Anwendungen umfassen Text Mining, Multimedia Mining, Feature Engineering, Data Stream Mining und Lernen veränderlicher Konzepte, Entwicklung von Ensemble-Methoden und verteiltes Data Mining.
Siehe auch
- Waikato Environment for Knowledge Analysis
- KNIME
- Environment for DeveLoping KDD-Applications Supported by Index-Structures
Weblinks
- RapidMiner-Produkt-Homepage
- RapidMiner-SourceForge-Projektseite
- Rapid-I, das Unternehmen hinter dem Open Source Data Mining Projekt RapidMiner
Kategorien:- Data-Mining
- Freie Software
- Java-Programm
- Maschinelles Lernen
Wikimedia Foundation.