Knowledge Discovery in Databases

Knowledge Discovery in Databases

Knowledge Discovery in Databases (KDD), auf Deutsch Wissensentdeckung in Datenbanken, ergänzt das oft synonym gebrauchte Data-Mining um vorbereitende Untersuchungen und Transformationen der auszuwertenden Daten. Ziel des KDD ist die Erkennung bislang unbekannter fachlicher Zusammenhänge aus vorhandenen, meist großen Datenbeständen. In Abgrenzung zum Data-Mining umfasst KDD als Gesamtprozess auch die Vorbereitung der Daten sowie die Bewertung der Resultate. Der Begriff KDD wurde in wissenschaftlichen Kreisen von Gregory Piatetsky-Shapiro geprägt, während in der Praxis der Begriff Data-Mining geläufiger ist, der in der Statistik jedoch traditionell negativ besetzt ist.

Die Teilschritte des KDD-Prozesses sind

  1. Bereitstellung von Hintergrundwissen für den jeweiligen Fachbereich
  2. Definition der Ziele der Wissensfindung
  3. Datenauswahl
  4. Datenbereinigung
  5. Datenreduktion (z. B. durch Transformationen)
  6. Auswahl eines Modells, in dem das gefundene Wissen repräsentiert werden soll
  7. Data-Mining, die eigentliche Datenanalyse
  8. Interpretation der gewonnenen Erkenntnisse

Üblicherweise werden diese Schritte mehrfach durchlaufen. Ein verbreitetes Vorgehensmodell ist CRISP-DM.

Software

Literatur

  • Martin Ester, Jörg Sander: Knowledge Discovery in Databases: Techniken und Anwendungen. Springer, Berlin 2000, ISBN 3540673288.
  • Fayyad, Usama; Piatetsky-Shapiro, Gregory und Smyth Padhraic (1996), From Data Mining to Knowledge Discovery in Databases, AI Magazine, American Association for Artificial Intelligence, California, USA, Seite 37-54.
  • Alpar, Paul und Niederreichholz, Joachim (2000), Data Mining im praktischen Einsatz: Verfahren und Anwendungsfälle für Marketing, Vertrieb, Controlling und Kundenunterstützung, Vieweg Verlag, Wiesbaden, Deutschland.

Wikimedia Foundation.

Игры ⚽ Нужно сделать НИР?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • knowledge discovery in databases — žinių radimas statusas T sritis dirbtinis intelektas apibrėžtis Procesas, kai duomenų rinkinyje aptinkamos pasikartojančios duomenų priklausomybės, šablonai, struktūros, pasižyminčios pagrįstumu, naujumu, potencialiu naudingumu ir suprantamumu.… …   Lithuanian dictionary (lietuvių žodynas)

  • European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases — ECML PKDD, l European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases, est une des conférences académiques leader[1],[2] dans le domaine de l Apprentissage automatique et de la Gestion des… …   Wikipédia en Français

  • Knowledge Discovery in Databases — KDD Prozess; umfassender Datenanalyseprozess, in dessen Kern Verfahren des ⇡ Data Mining zur Anwendung kommen. Der KDD Prozess umfasst folgende Phasen: (1) Problemabgrenzung: Zunächst muss sich der Analytiker mit dem Anwendungsbereich vertraut… …   Lexikon der Economics

  • Knowledge discovery — is a concept of the field of computer science that describes the process of automatically searching large volumes of data for patterns that can be considered knowledge about the data. It is often described as deriving knowledge from the input… …   Wikipedia

  • knowledge discovery — žinių radimas statusas T sritis dirbtinis intelektas apibrėžtis Procesas, kai duomenų rinkinyje aptinkamos pasikartojančios duomenų priklausomybės, šablonai, struktūros, pasižyminčios pagrįstumu, naujumu, potencialiu naudingumu ir suprantamumu.… …   Lithuanian dictionary (lietuvių žodynas)

  • Knowledge Discovery Metamodel — (KDM) is publicly available specification from the Object Management Group (OMG). KDM is a common intermediate representation for existing software systems and their operating environments, that defines common metadata required for deep semantic… …   Wikipedia

  • Discovery Net — is one of the earliest examples of a scientific workflow system allowing users to coordinate the execution of remote services based on Web service and Grid Services (OGSA and Open Grid Services Architecture) standards. The system was designed and …   Wikipedia

  • Knowledge representation — is an area in artificial intelligence that is concerned with how to formally think , that is, how to use a symbol system to represent a domain of discourse that which can be talked about, along with functions that may or may not be within the… …   Wikipedia

  • Knowledge base — A knowledge base (abbreviated KB, kb or Δ[1][2]) is a special kind of database for knowledge management, providing the means for the computerized collection, organization, and retrieval of knowledge. Also a collection of data representing related …   Wikipedia

  • Computational Resource for Drug Discovery (CRDD) — Computational Resources for Drug Discovery (CRDD) is one of the important silico modules of Open Source for Drug Discovery (OSDD). The CRDD web portal provides computer resources related to drug discovery on a single platform. Following are major …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”