Klassifikationsverfahren

Klassifikationsverfahren: Klassifikationsverfahren sind Methoden und Kriterien zur Einteilung von Objekten oder Situationen in Klassen, das heißt zur Klassifizierung. Ein solches Verfahren wird auch als Klassifikator bezeichnet. Viele Verfahren lassen sich als Algorithmus implementieren; man spricht dabei auch von maschineller oder automatischer Klassifikation. Klassifikationsverfahren sind immer anwendungsbezogen, so dass viele verschiedene Methoden existieren.

Klassifikationsverfahren spielen unter anderem bei der Mustererkennung, in der Künstlichen Intelligenz und der Dokumentationswissenschaft beziehungsweise dem Information Retrieval eine Rolle. Zur Beurteilung eines Klassifikators können verschiedene Kenngrößen ermittelt werden.

Inhaltsverzeichnis

1 Arten von Klassifikationsverfahren

1.1 Manuelle und automatische Verfahren

1.2 Statistische und verteilungsfreie Verfahren

1.3 Überwachte und nicht überwachte Verfahren

1.4 Parametrische und nicht-parametrische Verfahren

2 Beispiele

3 Siehe auch

4 Literatur

Arten von Klassifikationsverfahren

Da eine streng hierarchische Einteilung von Klassifikationsverfahren kaum möglich ist, lassen sie sich am besten anhand verschiedener Eigenschaften einteilen:

Manuelle und automatische Verfahren

Numerische und nicht-numerische Verfahren

Statistische und verteilungsfreie Verfahren

Überwachte und nicht-überwachte Verfahren

Fest dimensionierte und lernende Verfahren

Parametrische und nicht-parametrische Verfahren

Manuelle und automatische Verfahren

Siehe zum Beispiel manuelle Indexierung und automatische Indexierung.

Bei automatischen Verfahren findet die Klassizifierung mittels eines automatischen Prozesses durch Software statt. Der Prozess der maschinellen Klassifikation kann als formale Methode des Entscheidens in neuen Situationen aufgrund erlernter Strukturen bezeichnet werden. Die maschinelle Klassifikation ist ein Teilgebiet des Maschinellen Lernens.

Genauer ist dies die Erzeugung eines Algorithmus (der lernende Algorithmus), der - angewandt auf bekannte und schon klassifizierte Fälle (die Datenbasis) - Strukturen berechnet. Diese neu erlernten Strukturen ermöglichen es einem weiteren Algorithmus (der auswertende Algorithmus), einen neuen und bisher unbekannten Fall aufgrund der beobachteten Attribute und deren Ausprägungen einer der bekannten Ziel-Klassen zuzuordnen.

Statistische und verteilungsfreie Verfahren

Statistische Verfahren basieren auf Dichteberechnungen und Wahrscheinlichkeiten, während sich bei verteilungsfreien Verfahren klare Trennflächen angeben lassen.

Überwachte und nicht überwachte Verfahren

Das Erzeugen von Strukturen aus vorhandenen Daten wird auch als Mustererkennung, Diskriminierung oder überwachtes Lernen bezeichnet. Dabei werden Klasseneinteilungen vorgegeben (dies kann auch durch Stichproben geschehen). Im Gegensatz dazu existiert nichtüberwachtes Lernen, bei dem die Klassen der Daten nicht vorgegeben sind, sondern auch diese erlernt werden müssen. Dabei können allerdings beim Bestärkenden Lernen (engl.: reinforcement learning) Informationen hinzukommen, ob eine Klasseneinteilung richtig oder falsch war. Ein Beispiel für unüberwachte Verfahren ist die Clusteranalyse.

Parametrische und nicht-parametrische Verfahren

Parametrische Verfahren beruhen auf parametrischen Wahrscheinlichkeitsdichten, während bei nicht-parametrischen Verfahren (z.B. Nächste-Nachbarn-Klassifikation) die Dichten meist aus einer Stichprobe geschätzt werden.

Beispiele

Logistische Regression

Quader-Klassifikator

Abstandsklassifikator

Bayes-Klassifikator

Nächste-Nachbarn-Klassifikation

Fuzzy-Klassifikator

Polynomklassifikator

Clusterverfahren

Künstliches neuronales Netz

Latente Klassenanalyse

Support-Vector-Maschinen

Falls die Grenzen zwischen den einzelnen Klassen im Merkmalsraum bekannt sind, lassen sie sich durch eine Diskriminanzfunktion angeben.

Siehe auch

Maschinelles Lernen

Kostenmatrix

Karhunen-Loève-Transformation

Mahalanobis-Abstand

Sacherschließung

Merkmalsvektor

Merkmalsraum

Musteranalyse

Literatur

O. Oberhauser: Automatisches Klassifizieren: Entwicklungsstand – Methodik – Anwendungsbereiche. Frankfurt/Main [u.a.]: Peter Lang, 2005. ISBN 3-631-53684-4.

Andrew R. Webb: Statistical Pattern Recognition. John Wiley & Sons, 2 ed., Jul. 2002

Richard O. Duda, P. E. Hart, and D. G. Stork: Pattern Classification (2nd Edition). John Wiley & Sons, 2. ed., 2000

C. M. Bishop: Neural Networks for Pattern Recognition. Oxford University Press, 1996

D. Michie, D. J. Spiegelhalter, C. C. Taylor (Ed.): Machine Learning, neural and statistical Classification. Elis Horwood 1994

Kategorie:
Klassifikationsverfahren

Игры ⚽ Поможем написать реферат

Schlagen Sie auch in anderen Wörterbüchern nach:

Klassifizierung — (von lat. classis, „Klasse“, und facere, „machen“) nennt man das Zusammenfassen von Objekten zu Klassen (Gruppen, Mengen). Klassifizierung kommt in allen Bereichen des Denkens vor, in der Philosophie ist jedoch der Ausdruck Kategorisierung… … Deutsch Wikipedia
Musterklassifikation — Mustererkennung ist die Fähigkeit, in einer Menge von Daten Regelmäßigkeiten, Wiederholungen, Ähnlichkeiten oder Gesetzmäßigkeiten zu erkennen. Dieses Leistungsmerkmal höherer kognitiver Systeme wird für die menschliche Wahrnehmung von… … Deutsch Wikipedia
Data Mining — Unter Data Mining (englisch für „Datenschürfen“) versteht man die systematische Anwendung von Methoden, die meist statistisch mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung. Hierbei geht es vor allem um das… … Deutsch Wikipedia
Data mining — Unter Data Mining (englisch für „Datenschürfen“) versteht man die systematische Anwendung von Methoden, die meist statistisch mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung. Hierbei geht es vor allem um das… … Deutsch Wikipedia
Dataminer — Unter Data Mining (englisch für „Datenschürfen“) versteht man die systematische Anwendung von Methoden, die meist statistisch mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung. Hierbei geht es vor allem um das… … Deutsch Wikipedia
Datamining — Unter Data Mining (englisch für „Datenschürfen“) versteht man die systematische Anwendung von Methoden, die meist statistisch mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung. Hierbei geht es vor allem um das… … Deutsch Wikipedia
Datenschürfung — Unter Data Mining (englisch für „Datenschürfen“) versteht man die systematische Anwendung von Methoden, die meist statistisch mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung. Hierbei geht es vor allem um das… … Deutsch Wikipedia
K-Nearest-Neighbor — K Nächste Nachbarn in einer zweidimensionalen Punktmenge mit k=1 (dunkelblau) und k=5 (hellblau). Der Radius der Kreise ist nicht fest. Die Nächste Nachbarn Klassifikation ist eine parameterfreie Methode zur Schätzung von… … Deutsch Wikipedia
Matchplus — Unter Data Mining (englisch für „Datenschürfen“) versteht man die systematische Anwendung von Methoden, die meist statistisch mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung. Hierbei geht es vor allem um das… … Deutsch Wikipedia
Nicht-parametrische Statistik — Der Zweig der Statistik, der als parameterfreie Statistik bekannt ist, beschäftigt sich mit parameterfreien statistischen Modellen und parameterfreien statistischen Tests. Andere gebräuchliche Bezeichnungen sind nicht parametrische Statistik oder … Deutsch Wikipedia

Academic dictionaries and encyclopedias

Klassifikationsverfahren

Inhaltsverzeichnis

Arten von Klassifikationsverfahren

Manuelle und automatische Verfahren

Statistische und verteilungsfreie Verfahren

Überwachte und nicht überwachte Verfahren

Parametrische und nicht-parametrische Verfahren

Beispiele

Siehe auch

Literatur

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Academic dictionaries and encyclopedias

Deutsch Wikipedia

Klassifikationsverfahren

Inhaltsverzeichnis

Arten von Klassifikationsverfahren

Manuelle und automatische Verfahren

Statistische und verteilungsfreie Verfahren

Überwachte und nicht überwachte Verfahren

Parametrische und nicht-parametrische Verfahren

Beispiele

Siehe auch

Literatur

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Direct link