Kölner Verfahren

Kölner Verfahren

Die Kölner Phonetik (auch Kölner Verfahren) ist ein phonetischer Algorithmus, der Wörtern nach ihrem Sprachklang eine Zeichenfolge zuordnet, den phonetischen Code. Ziel dieses Verfahrens ist es, gleich klingenden Wörtern denselben Code zuzuordnen, um bei Suchfunktionen eine Ähnlichkeitssuche zu implementieren. Damit ist es beispielsweise möglich, in einer Namensliste Einträge wie "Meier" auch unter anderen Schreibweisen, wie "Maier", "Mayer" oder "Mayr", zu finden. Die Kölner Phonetik ist, im Vergleich zum bekannteren Russell-Soundex-Verfahren, besser auf die deutsche Sprache abgestimmt. Sie wurde 1969 von Postel veröffentlicht.

Inhaltsverzeichnis

Grundregeln

Die Kölner Phonetik bildet jeden Buchstaben eines Wortes auf eine Ziffer zwischen "0" und "8" ab, wobei für die Auswahl der jeweiligen Ziffer maximal ein benachbarter Buchstabe als Kontext benutzt wird. Einige Regeln gelten speziell für den Wortanfang (Anlaut). Auf diese Weise wird ähnlichen Lauten derselbe Code zugeordnet. Die beiden Buchstaben "W" und "V" beispielsweise werden mit der Ziffer "3" codiert. Der phonetische Code für "Wikipedia" lautet "3412". Im Gegensatz zum Soundex-Code ist die Länge des phonetischen Codes nach der Kölner Phonetik nicht beschränkt.

Buchstabencodes

Buchstabe Kontext Code
A, E, I, J, O, U, Y 0
H -
B 1
P nicht vor H
D, T nicht vor C, S, Z 2
F, V, W 3
P vor H
G, K, Q 4
C im Anlaut vor A, H, K, L, O, Q, R, U, X
vor A, H, K, O, Q, U, X außer nach S, Z
X nicht nach C, K, Q 4
L 5
M, N 6
R 7
S, Z 8
C nach S, Z
im Anlaut außer vor A, H, K, L, O, Q, R, U, X
nicht vor A, H, K, O, Q, U, X
D, T vor C, S, Z
X nach C, K, Q

Dass für den Buchstaben "C" die Regel "SC" Vorrang vor der Regel "CH" hat, wurde durch den Zusatz "außer nach S, Z" in Zeile 10 der Tabelle berücksichtigt. Dies wird in der Originalveröffentlichung zwar nicht explizit erwähnt, kann aber aus den dort angeführten Beispielen geschlossen werden (z. B. für "Breschnew" wird als Code "17863" angegeben).

Kleinbuchstaben werden analog kodiert, alle sonstigen Zeichen (z. B. Bindestriche) ignoriert. Für die in der Umwandlungstabelle nicht berücksichtigten Umlaute Ä, Ö, Ü sowie das ß bietet es sich an, diese bei den Vokalen (Code "0") bzw. der Gruppe S, Z (Code "8") einzuordnen.

Die Umwandlung eines Wortes erfolgt in drei Schritten:

  1. Buchstabenweise Kodierung von links nach rechts entsprechend der Umwandlungstabelle.
  2. Entfernen aller mehrfachen Codes.
  3. Entfernen aller Codes "0" außer am Anfang.

Beispiel

Der Name Müller-Lüdenscheidt wird folgendermaßen kodiert:

  1. Buchstabenweise Kodierung: 60550750206880022
  2. Entfernen aller mehrfachen Codes: 6050750206802
  3. Entfernen aller Codes "0": 65752682

Literatur

Hans Joachim Postel: Die Kölner Phonetik. Ein Verfahren zur Identifizierung von Personennamen auf der Grundlage der Gestaltanalyse. in: IBM-Nachrichten, 19. Jahrgang, 1969, S. 925-931.

Weblinks

Martin Wilz: Aspekte der Kodierung phonetischer Ähnlichkeiten in deutschen Eigennamen. Magisterarbeit an der Philosophischen Fakultät der Universität zu Köln, 2005; enthält eine Implementierung in der Programmiersprache Perl.


Wikimedia Foundation.

Игры ⚽ Нужно сделать НИР?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Kölner Phonetik — Die Kölner Phonetik (auch Kölner Verfahren) ist ein phonetischer Algorithmus, der Wörtern nach ihrem Sprachklang eine Zeichenfolge zuordnet, den phonetischen Code. Ziel dieses Verfahrens ist es, gleich klingenden Wörtern denselben Code zuzuordnen …   Deutsch Wikipedia

  • Kölner Gerichtswesen vom Mittelalter zur Neuzeit — Kölner Ratsherr im 16. Jahrhundert, zur typischen Amtstracht gehörten schwarzer Hut und Mantel …   Deutsch Wikipedia

  • Kölner Judenviertel — Das Kölner Judenviertel war der älteste Wohnplatz einer jüdischen Gemeinde nördlich der Alpen. Wahrscheinlich siedelten schon seit Ende des 1. Jahrhunderts Juden in der Provinzhauptstadt Niedergermaniens und bildeten dort bis zum 4. Jahrhundert… …   Deutsch Wikipedia

  • Kölner Stadtansicht von 1570 — Detailzeichnungen der Umrandung der Stadtansicht, von Mercator als „antiquitates Coloniae“ bezeichnet Die Kölner Stadtansicht von 1570 war ein von dem Kartografen Arnold Mercator im Auftrag des Kölner Rates erstellter neuartiger Stadtplan, der im …   Deutsch Wikipedia

  • Kölner Stollen — Der Kölner Stollen (in „Kölner Bauweise“) ist ein Stollen Vortrieb bei welchem stählerne Verbaubögen als Stützelemente dienen, die auf stählerne oder hölzerne Schwellen aufgestellt werden. Diese Bögen dienen als Leere beim Vortrieb („Pfändung“)… …   Deutsch Wikipedia

  • Kölner Autorenwerkstatt — Die Kölner Autorenwerkstatt ist eine offene Autorengruppe. Inhaltsverzeichnis 1 Verfahren 2 Geschichte 3 Bekannte Autoren 4 Veröffentlichungen …   Deutsch Wikipedia

  • Kölner Rat bis 1796 — Ratsversammlung im Senatssaal 1655 Die in Urkunden dokumentierte Geschichte des Kölner Stadtrates geht auf den Anfang des 13. Jahrhunderts zurück. So wurde die Bezeichnung Rat erstmals 1216[1] verwandt und ist für das Jahr 1229 erneut urkundlich… …   Deutsch Wikipedia

  • Kölner Klüngel — Als Kölner Klüngel, Kölscher Klüngel oder einfach Klüngel wird in Köln, und mittlerweile auch im allgemeinen Sprachgebrauch, ein System auf Gegenseitigkeit beruhender Hilfeleistungen und Gefälligkeiten bezeichnet. Es kann zur Vermischung von… …   Deutsch Wikipedia

  • Kölner Kommunistenprozess — Der Kölner Kommunistenprozess von 1852 richtete sich gegen die Mitglieder der Kölner Sektion des Bundes der Kommunisten. Er war Bestandteil der Bekämpfung der politischen Opposition mit den Mitteln der Justiz auf dem Höhepunkt der Reaktionszeit.… …   Deutsch Wikipedia

  • Kölner Wirren — Als Kölner Wirren oder als Kölner Ereignis bezeichnet man einen Höhepunkt des Konflikts zwischen der katholischen Kirche und dem preußischen Staat in den Westprovinzen Preußens während des Vormärz. Die Integration der 1815 preußisch gewordenen… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”