Typewriterdistanz

Typewriterdistanz
Verdeutlichung der Schreibmaschinendistanz anhand einer amerikanischen Tastatur:
Die Buchstaben ‚u‘ und ‚i‘ sind direkt nebeneinander. Sie haben den Abstand 1. Um vom ‚h‘ zum ‚k‘ zu gelangen, muss man über das ‚j‘ gehen. Der Abstand ist 2.

Die Schreibmaschinendistanz, auch Tastaturdistanz, (engl. typewriter distance) ist ein Ähnlichkeitsmaß für Zeichenketten. Der Abstand zwischen zwei Zeichen errechnet sich aus der Entfernung dieser Zeichen auf einer QWERTZ- bzw. QWERTY-Tastatur.

Die Schreibmaschinendistanz wird neben der Editierdistanz und der phonetischen Distanz zur Erkennung von Duplikaten in Datenbanken eingesetzt, beispielsweise wenn Daten aus unterschiedlichen Quellen in einer Datenbank zusammengeführt werden sollen (Data Warehousing).

Die genannten Distanzen können auch eingesetzt werden, um Korrekturvorschläge für die Rechtschreibprüfung von Textverarbeitungssoftware zu ermitteln.

Beispiel

Man nehme die Zeichenketten: „Hund“ und „Kind“. Der Abstand zwischen ‚h‘ und ‚k‘ auf einer Tastatur ist 2, der zwischen ‚u‘ und ‚i‘ ist 1. Die Schreibmaschinendistanz zwischen „Hund“ und „Kind“ ist also 3.


Wikimedia Foundation.

Игры ⚽ Поможем сделать НИР

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Dublettenbereinigung — Unter Duplikaterkennung oder Objektidentifizierung versteht man verschiedene automatische Verfahren, mit denen sich Datensätze identifizieren lassen, die dasselbe Objekt in der realen Welt repräsentieren. Dies ist beispielsweise beim… …   Deutsch Wikipedia

  • Objektidentifikation — Unter Duplikaterkennung oder Objektidentifizierung versteht man verschiedene automatische Verfahren, mit denen sich Datensätze identifizieren lassen, die dasselbe Objekt in der realen Welt repräsentieren. Dies ist beispielsweise beim… …   Deutsch Wikipedia

  • Objektidentifizierung — Unter Duplikaterkennung oder Objektidentifizierung versteht man verschiedene automatische Verfahren, mit denen sich Datensätze identifizieren lassen, die dasselbe Objekt in der realen Welt repräsentieren. Dies ist beispielsweise beim… …   Deutsch Wikipedia

  • Duplikaterkennung — Unter Duplikaterkennung oder Objektidentifizierung (auch englisch Record Linkage) versteht man verschiedene automatische Verfahren, mit denen sich in Datensätzen Fälle identifizieren lassen, die dasselbe Objekt in der realen Welt repräsentieren.… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”