Hamming-Ähnlichkeit

Hamming-Ähnlichkeit

Die Hamming-Ähnlichkeit (nach Richard Hamming) ist ein rudimentäres Ähnlichkeitsmaß, das beim maschinellen fallbasierten Schließen eingesetzt wird. Es wird verwendet, um den Grad der Ähnlichkeit zweier sogenannter Fälle (z. B. Krankheitsbilder, Rechtsfälle, Geschäftsmanagement und vieles mehr) zu ermitteln. Ist die Ähnlichkeit zwischen zwei Fällen groß, so kann man unter Umständen die Lösung des einen Falles auch im anderen Fall anwenden. Man kann daher zu einem gegebenen Fall mittels der Hamming-Ähnlichkeit in einer Fallbasis nach einem möglichst ähnlichen Fall suchen.

Die Hamming-Ähnlichkeit basiert auf der Hamming-Distanz. Man kann sich dabei vorstellen, dass die einzelnen Bits, die bei der Ermittlung der Hamming-Distanz verglichen werden, Merkmale eines Falles darstellen, die jeweils die Ausprägung 0 oder 1 oder eine andere zweiwertige Ausprägung annehmen können. Setzt man die Hamming-Distanz ins Verhältnis zu der Anzahl der Merkmale, so erhält man die Hamming-Ähnlichkeit, die ein grobes Maß für die Ähnlichkeit der beiden betrachteten Fälle (in den betrachteten Merkmalen) darstellt. Formal schreibt man für zwei Fälle x und y mit n Merkmalen:

\mathrm{Hamming{-}Aehnlichkeit}(x,y) = 1 - \frac{\mathrm{Hamming{-}Distanz}(x,y)}{n}

Eine Variante der Hamming-Ähnlichkeit arbeitet mit Gewichten für die einzelnen Merkmale. Dies berücksichtigt die Tatsache, dass einige Merkmale wichtiger als andere sein können. Statt wie oben die Hamming-Distanz einfach ins Verhältnis zur Anzahl der Merkmale zu setzen, summiert man dabei einzelne Gewichte für jedes Merkmal. Man spricht von gewichteter Hamming-Ähnlichkeit:

\mathrm{Hamming{-}Aehnlichkeit}^\mathrm{gewichtet}(x,y) = 1 - \frac{\mathrm{Hamming{-}Distanz}(x,y)}{\sum_{i=1}^n Merkmalsgewichte}

Wie man leicht sehen kann, ist die Hamming-Ähnlichkeit nur dann als Ähnlichkeitsmaß verwendbar, wenn die Merkmale jeweils nur zwei verschiedene Werte annehmen können. Das Verfahren lässt sich jedoch verallgemeinern und dann auch für beliebige Merkmalswerte anwenden.


Wikimedia Foundation.

Игры ⚽ Нужно сделать НИР?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Ähnlichkeit — bezeichnet: in der Geometrie eine Beziehung zwischen Formen, siehe Ähnlichkeit (Geometrie) in der Geodäsie und Astrometrie die Ähnlichkeitstransformation in der linearen Algebra eine Äquivalenzrelation auf der Klasse der quadratischen Matrizen,… …   Deutsch Wikipedia

  • Hamming-Distanz — Der Hamming Abstand, die Hamming Distanz und das Hamming Gewicht, benannt nach dem US amerikanischen Mathematiker Richard Wesley Hamming (1915–1998), sind Maße für die Unterschiedlichkeit von Zeichenketten. Häufig handelt es sich um binär… …   Deutsch Wikipedia

  • Hamming-Gewicht — Der Hamming Abstand, die Hamming Distanz und das Hamming Gewicht, benannt nach dem US amerikanischen Mathematiker Richard Wesley Hamming (1915–1998), sind Maße für die Unterschiedlichkeit von Zeichenketten. Häufig handelt es sich um binär… …   Deutsch Wikipedia

  • Hamming Abstand — Der Hamming Abstand, die Hamming Distanz und das Hamming Gewicht, benannt nach dem US amerikanischen Mathematiker Richard Wesley Hamming (1915–1998), sind Maße für die Unterschiedlichkeit von Zeichenketten. Häufig handelt es sich um binär… …   Deutsch Wikipedia

  • Hamming — Richard Wesley Hamming ( * 11. Februar 1915 in Chicago, Illinois, USA; † 7. Januar 1998 in Monterey, Kalifornien) war ein US amerikanischer Mathematiker, dessen Arbeit großen Einfluss auf die Informatik und Telekommunikation hatte.… …   Deutsch Wikipedia

  • Hamming-Abstand — Der Hamming Abstand, die Hamming Distanz und das Hamming Gewicht, benannt nach dem US amerikanischen Mathematiker Richard Wesley Hamming (1915–1998), sind Maße für die Unterschiedlichkeit von Zeichenketten. Der Hamming Abstand zweier Blöcke mit… …   Deutsch Wikipedia

  • Richard W. Hamming — Richard Wesley Hamming ( * 11. Februar 1915 in Chicago, Illinois, USA; † 7. Januar 1998 in Monterey, Kalifornien) war ein US amerikanischer Mathematiker, dessen Arbeit großen Einfluss auf die Informatik und Telekommunikation hatte.… …   Deutsch Wikipedia

  • Richard Wesley Hamming — ( * 11. Februar 1915 in Chicago, Illinois, USA; † 7. Januar 1998 in Monterey, Kalifornien) war ein US amerikanischer Mathematiker, dessen Arbeit großen Einfluss auf die Informatik und Telekommunikation hatte. Inhaltsverzeichnis 1 Leben …   Deutsch Wikipedia

  • Richard Hamming — Richard Wesley Hamming (* 11. Februar 1915 in Chicago, Illinois; † 7. Januar 1998 in Monterey, Kalifornien) war ein amerikanischer Mathematiker, dessen Arbeit großen Einfluss auf die Informatik und Telekommunikation hatte. Inhaltsverzeichnis 1… …   Deutsch Wikipedia

  • Hammingabstand — Der Hamming Abstand, die Hamming Distanz und das Hamming Gewicht, benannt nach dem US amerikanischen Mathematiker Richard Wesley Hamming (1915–1998), sind Maße für die Unterschiedlichkeit von Zeichenketten. Häufig handelt es sich um binär… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”