KNIME

KNIME: KNIME

Aktuelle Version 2.4.2
(29. August 2011)

Betriebssystem Linux, Macintosh, Windows

Kategorie Mathematik, Statistik, Bioinformatik, Chemoinformatik

Lizenz GPL (Freie Software)

knime.org

KNIME, der Konstanz Information Miner, ist eine Freie Software für die interaktive Datenanalyse. KNIME ermöglicht durch das modulare Pipelining-Konzept die Integration von zahlreichen Verfahren des maschinellen Lernens und des Data-Mining. Die graphische Benutzeroberfläche ermöglicht das einfache und schnelle Aneinandersetzen von Modulen für die Datenvorverarbeitung (ETL: Extraction, Transformation, Loading), der Modellierung und Analyse und der Visualisierung. KNIME ist seit etwa 2006 im Bereich der pharmazeutischen Forschung im Einsatz^[1]. KNIME wird aber auch in anderen Bereichen wie Kundenpflege (CRM), Business Intelligence und Finanzdatenanalyse eingesetzt.

Ein Bildschirmfoto von KNIME.

Inhaltsverzeichnis

1 Geschichte

2 Lizenz

3 Interna

4 Weblinks

5 Referenzen

Geschichte

Die Entwicklung von KNIME begann im Frühjahr 2004 – eine Gruppe von Software-Entwicklern aus dem Silicon Valley begann unter der Leitung von Michael Berthold an der Universität Konstanz mit der Konzeption der Platform. Der Schwerpunkt der Entwicklung lag von vorneherein auf einer professionellen Software-Architektur, die skalierbar und hochgradig modular sein musste. Mitte 2006 erschien die erste öffentliche Version, die insbesondere im Pharmabereich schnell dazu führte, dass zahlreiche kommerzielle Softwareanbieter ihre Werkzeuge ebenfalls in KNIME einbinden.^[2]^[3]^[4]^[5]^[6] Nach dem Erscheinen eines Artikels in der c't im Jahr 2006^[7] wird KNIME auch in anderen Bereichen^[8] zunehmend eingesetzt. Seit Juni 2008 ermöglicht eine in Zürich ansässige Firma (KNIME.com GmbH) auch die Bereitstellung von professioneller technischer Unterstützung und Beratungsdiensten für die KNIME-Plattform. KNIME schneidet in Vergleichen von quelloffenen Data-Mining-Systemen überdurchschnittlich gut ab und hebt sich insbesondere durch seine Benutzerfreundlichkeit heraus.^[9]

Lizenz

KNIME ist seit Version 2.1 unter GPL erhältlich.

Interna

KNIME wird in Java entwickelt und als Eclipse-Plugin bereitgestellt. Module anderer können leicht als zusätzliche Plugins integriert werden. KNIMEs Core-Version enthält einige hundert Module für die Datenintegration (File I/O, Datenbankoperatoren mit Unterstützung aller gängigen Datenbanken), Datentransformationen (Filter, Konverter, Combiner) sowie die gebräuchlichsten Methoden der Datenanalyse und -visualisierung. Weitere Eigenschaften von KNIME:

KNIMEs Core-Architektur erlaubt die Verarbeitung von großen Datenmengen, die nur durch den vorhandenen Festplattenplatz eingeschränkt sind (die meisten anderen quelloffenen Datenanalyse-Projekte arbeiten arbeitsspeicherbasiert und limitieren dadurch die erarbeitbaren Datenmengen erheblich). Beispiele sind die Analyse von 300 Millionen Adressdaten, 20 Millionen Zellbildern und 10 Millionen molekularen Strukturen.

Zusätzliche Plugins ermöglichen die Einbindung von Methoden für Text Mining und Image Mining sowie die Zeitserienanalyse.

Einbindungen für zahlreiche andere Open-Source-Verfahren existieren, u.a. die Verfahren von WEKA, das statistische R-Projekt sowie LibSVM, JFreeChart und ImageJ.

Weblinks

offizielle Webpräsenz

Referenzen

↑ Abhishek Tiwaria and Arvind K.T. Sekhar: Workflow based framework for life science informatics, Computational Biology and Chemistry, Volume 31, Issues 5–6, Pages 305–319, Elsevier, October 2007.

↑ Tripos, Inc.

↑ Schrödinger

↑ ChemAxon

↑ CambridgeSoft

↑ Treweren Consultants

↑ Datenbank-Mosaik Data Mining oder die Kunst, sich aus Millionen Datensätzen ein Bild zu machen, c't 20/2006, S. 164ff, Heise Verlag.

↑ Forum auf der KNIME Webseite

↑ Xiaojun Chen, Yunming Ye, Graham Williams and Xiaofei Xu: A Survey of Open Source Data Mining Systems, Lecture Notes in Computer Science, vol. 4819, pp. 3–14, Springer-Verlag, 2009.

Kategorien:
Data-Mining
Maschinelles Lernen
Business Intelligence
Freie Software

Игры ⚽ Нужно решить контрольную?

Schlagen Sie auch in anderen Wörterbüchern nach:

KNIME — Desarrollador KNIME.com GmbH knime.org Información general Última versión en pruebas 2.3.3 16 de marzo de 2011 … Wikipedia Español
Logiciels de fouille de données — Exploration de données Articles principaux Exploration de données Fouille de données spatiales Fouille du web Fouille de flots de données Fouille de textes … Wikipédia en Français
PMML — Predictive Model Markup Language (PMML) ist ein seit 1997 fortlaufend entwickelter, auf XML basierter Standard, zum Austausch von Ergebnissen zwischen verschiedenen Programmen für die Data Mining. Meist bietet das jeweilige Programm (prudsys… … Deutsch Wikipedia
Datenstromorientierte Programmierung — geht von einem kontinuierlichen Datenstrom, meist Signaldaten, der in Echtzeit verändert und ausgegeben wird. Bekannte Beispiele sind Simulink, Pure Data oder LabVIEW. Inhaltsverzeichnis 1 Geschichte 2 Objekte 2.1 Quelle … Deutsch Wikipedia
List of free and open source software packages — This article is about software free to be modified and distributed. For examples of software free in the monetary sense, see List of freeware. This is a list of free and open source software packages: computer software licensed under free… … Wikipedia
Язык разметки прогнозного моделирования — Язык разметки для прогнозного моделирования (Predictive Model Markup Language PMML) является языком разметки на основе XML, разработанным Data Mining Group (DMG), и обеспечивающим приложениям способ определения моделей, относящихся к… … Википедия
Data mining — Not to be confused with analytics, information extraction, or data analysis. Data mining (the analysis step of the knowledge discovery in databases process,[1] or KDD), a relatively young and interdisciplinary field of computer science[2][3] is… … Wikipedia
Decision tree learning — This article is about decision trees in machine learning. For the use of the term in decision analysis, see Decision tree. Decision tree learning, used in statistics, data mining and machine learning, uses a decision tree as a predictive model… … Wikipedia
Association rule learning — In data mining, association rule learning is a popular and well researched method for discovering interesting relations between variables in large databases. Piatetsky Shapiro[1] describes analyzing and presenting strong rules discovered in… … Wikipedia
Data analysis — Analysis of data is a process of inspecting, cleaning, transforming, and modeling data with the goal of highlighting useful information, suggesting conclusions, and supporting decision making. Data analysis has multiple facets and approaches,… … Wikipedia

Academic dictionaries and encyclopedias

KNIME

Inhaltsverzeichnis

Geschichte

Lizenz

Interna

Weblinks

Referenzen

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

KNIME

Aktuelle Version	2.4.2 (29. August 2011)
Betriebssystem	Linux, Macintosh, Windows
Kategorie	Mathematik, Statistik, Bioinformatik, Chemoinformatik
Lizenz	GPL (Freie Software)
knime.org

Academic dictionaries and encyclopedias

Deutsch Wikipedia

KNIME

Inhaltsverzeichnis

Geschichte

Lizenz

Interna

Weblinks

Referenzen

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Direct link