- Automatische Klassifizierung
-
Die automatische Klassifikation steht im Gegensatz zur manuellen Klassifizierung, bei der die zu klassifizierenden Objekte aufgrund ihrer Merkmale von Menschen manuell kategorisiert oder in Klassen eingeteilt werden. In technischen Prozessen soll durch eine maschinelle, automatische Klassifikation eine Kategorisierung von Objekten ohne menschliche Hilfe erreicht werden. Prinzipiell kann die automatische Klassifizierung genauer und schneller als die manuelle Klassifizierung erfolgen. Somit ist die automatische Klassifikation ein fundamentales Verfahren für eine Reihe von technischen Systemen und Anwendungen. Beispiele für die automatische Klassifikation sind das Sortieren von Ausschuss durch Maschinen, das computergestützte Kartografieren und die Zuordnung von Dokumenten im Dokumentenmanagement zu Dokumentenklassen.
Oft wird Clusteranalyse als gleichwertig zur automatischen Klassifikation angesehen. Es gibt hier aber ein paar subtile Unterschiede: in der Clusteranalyse liegt der Augenmerk darauf, zuvor unbekannte Strukturen möglichst akkurat zu erfassen, während bei der automatischen Klassifikation der Augenmerk darauf liegt, die gefundene Struktur gut auf weitere Instanzen verallgemeinern zu können. Ein Clusteranalyse-Verfahren wie der k-Means-Algorithmus ist dafür beispielsweise gut geeignet, aber viele fortgeschrittene Clusteranalyse-Verfahren können nicht einfach in einen Klassifikator umgewandelt werden. Dies führt oft zu Missverständnissen zwischen diesen Teildisziplinen.
Siehe auch: Mustererkennung, Klassifikator (Informatik), Klassifikationsverfahren (Starke Überschneidung mit diesem Artikel)
Zur Klassifikation gibt es verschiedene Mittel:- Parametrische Methoden
- Halbparametrische Methoden und
- Nicht-Parametrische Methoden:
Inhaltsverzeichnis
Arten der Klassifizierung
Siehe auch: Clusteranalyse
Hinweis: Wenn im Folgenden von Pixeln und Reflexion gesprochen wird, handelt es sich dabei um die Analyse von Satellitenbildern. Das ist nur eine mögliche Anwendung von Clusteringverfahren!
automatische Klassifizierung
Bei der automatischen Klassifikation werden Bildpunkte als so genannte Cluster von einem Computersystem anhand der automatischen statistischen Auswertung aus Primärdaten ohne weitere Informationen in verschiedenen Reflexionsgraden gebündelt. Der Vorteil liegt darin, dass in relativ kurzer Zeit alle möglichen Klassifizierungen (Klassen) erkannt werden. Daher wird die automatische Klassifizierung oft der überwachten automatischen Klassifikation vorgeschaltet.
überwachte automatische Klassifikation
Die überwachte automatische Klassifikation arbeitet ebenfalls mit Clustern, die aber durch den Bildauswerter anhand weiterer Informationen über das zu klassifizierende Gebiet gebildet werden und die Grundlage für die automatische Erkennung bilden.
Der Vorteil liegt bei der späteren automatischen Erkennung von Clustern z.B. gleicher Vegetation mit uneinheitlichen Reflexionsgraden, die sich aus inhomogenen Gesundheits- oder Wachstumszuständen ergeben können.
Verfahren der geringsten Distanz
Diese Methode (engl. Minimum Euclidean Distance) geht davon aus, das diejenigen Reflexionsgrade eines Clusters, die im Erkennungsgebiet dicht nebeneinander liegen, auch zusammen gehören. Für jeden Cluster werden dazu Mittelwerte der Reflexionsgrade gebildet, anhand deren noch unklassifizierte Pixel jeweils zum am Nächsten liegenden Cluster zugeordnet werden.
Verfahren der größten Wahrscheinlichkeit
Die Maximum-Likelihood-Methode definiert Clusterzugehörigkeit über Wahrscheinlichkeitsverteilungen. Meist werden parametrische Verteilungen angenommen. Die Verteilungsparameter und die Clusterzugehörigkeit werden jeweils abwechselnd geschätzt (EM-Verfahren).
Vor- und Nachteile
Der erfolgreiche Einsatz der automatischen Klassifikation hängt wesentlich von der Homogenität des Gebietes ab.
- Großflächige, reliefarme Landwirtschafts- oder Waldgebiete sind hervorragend geeignet.
- Inhomogene, komplexe, stark variierende Gebiete wie Städte bereiten größere Probleme.
Der größte Nachteil ist, dass es sich in jedem Fall um eine Zusammenfassung und Vereinfachung von komplexen Sachverhalten der Natur handelt. Daher gibt es keine 100%ig richtige Klassifizierung.
Beispiele
Clusterbestimmung
Automatische Klassifizierung durch den Computer. Bildung von 28 verschiedenen Clustern.
Überwachte automatische Klassifikation. Bildung von Trainingsgebieten durch den Bildauswerter.
Klassifikation
Klassifikation nach dem Verfahren der geringsten Distanz.
Klassifikation nach dem Verfahren der größten Wahrscheinlichkeit.
Wikimedia Foundation.