- Ugly-Duckling-Theorem
-
Das Ugly-Duckling-Theorem (zu deutsch Hässliches-Entlein-Theorem) ist ein Satz über Ähnlichkeiten verschiedener Merkmale und damit verbundene Aussagen für die Mustererkennung. Es wurde von Watanabe Satosi bewiesen und trägt seinen Namen nach dem Kunstmärchen Das hässliche Entlein.
Inhaltsverzeichnis
Aussage des Theorems
Auf einer Menge von Merkmalen weisen alle Paare von verschiedenen Mustern dieselbe Ähnlichkeit auf. Betrachtet man die Menge aller möglichen Aussagen auf den Mustern, stimmen beide Muster bei immer gleicher Anzahl Aussagen überein, die Anzahl gleicher Aussagen ist sogar konstant und unabhängig von dem gewählten Musterpaar. Wird zudem die Ähnlichkeit über die Anzahl aller möglichen Aussagen gewählt, so ist jedes Musterpaar gleich ähnlich.
Damit ähnelt ein hässliches Entlein genauso einem Schwan wie zwei Schwäne untereinander. Diese Aussage ist der Namensgeber für dieses Theorem.
Eine Aussage über Ähnlichkeiten oder Unterschiede von Mustern ist damit subjektiv und hängt von vorher erfolgten Annahmen ab.
Eine andere Betrachtungsweise ist das systematische Aufstellen aller erdenklichen Ähnlichkeiten der Muster in dem gegebenen Merkmalsraum, und die Aufnahme von Relationen, scheinen diese noch so sinnlos und ohne Bezug auf einen möglichen Anwendungsfall; und so zeigt sich, dass die Anzahl der Ähnlichkeiten stets gleich ist. Diese scheinbar sinnlos aufgenommenen Ähnlichkeiten erscheinen eben durch vorherige Annahmen und der Definition einer Äquivalenzrelation im speziellen Anwendungsfall nicht.
Beweisidee
Die auf einer Menge von Mustern möglichen Aussagen können bei einer diskreten Darstellung über Prädikate dargestellt werden. Diese lassen sich dann wie zum Beispiel durch „f1 AND f2“ angeben, wenn fi ein Prädikat bezeichnet. Diese Prädikate sollen nun jeweils eine Möglichkeit aus allen möglichen Ähnlichkeiten darstellen.
Beispielhafte Darstellung von Prädikaten und Mustern
Für Elemente x1,x2,x3,x4 lassen sich nun solche Prädikate in einem Venn-Diagramm darstellen. Durch verschiedene Kombinationen der Prädikate können Aussagen formal dargestellt werden. Das Prädikat f2 kann nun beispielsweise die Aussage „Farbe Blau“ der Fahrzeuge x2 und x3 markieren.
Mögliche Kombinationen
Diese Elemente können nun in verschiedenster Weise kombiniert werden. Die Anzahl der Kombinationen wird durch berechnet, für n die Anzahl der möglichen Muster.
Für das oben gewählt Beispiel sind dies 16 mögliche Aussagen. Neben True (Wahr), False (Falsch) sind dies:
1 Element ( ) Muster Prädikatendarst. x1 x2 x3 x4 2 Elemente () Muster Prädikatendarst. f1 f2 3 Elemente ( ) Muster Prädikatendarst. Geteilte Aussagen
Für die vier Muster im obigen Fall gibt es nun Prädikate, die für ein Paar (xi,xj) beide Muster beinhalten: Für Prädikate mit nur einem Element gibt es keines, für Prädikate mit zwei Elementen gibt es genau ein Prädikat für (xi,xj) und für Prädikate mit drei Elementen gibt es zwei solcher Prädikate. So sind dies z. B. für (x1,x3): und True (also ).
Allgemein gibt es für ein Paar (xi,xj) mit n möglichen Mustern geteilte Aussagen.
Diese Formel ist vor allem unabhängig von den gewählten Mustern, also konstant und jedes Paar hat die gleiche Anzahl gemeinsamer Aussagen.
Anwendung
Ähnlich den No-Free-Lunch-Theoremen, bei denen gezeigt wird, dass es keinen generell besten Klassifikator gibt, zeigt das Ugly-Duckling-Theorem, dass es ebenso ohne vorherige Annahmen keine beste Repräsentation von Merkmalen geben kann. Diese bedeutet in der Mustererkennung, dass eine optimale Klassifikation nur unter Annahmen erfolgen kann und stets spezifisch dem Problem angepasst ist.
Literatur
Richard O. Duda, Peter E. Hart, David G. Stork: Pattern classification. Wiley, New York 2001, ISBN 0471056693.
Wikimedia Foundation.