- Rechtschreibkorrektur
-
Rechtschreibprüfung bezeichnet softwaregestützte Verfahren zur Fehlerkorrektur in elektronisch vorliegenden Texten. Einsatzzwecke sind die klassischen Officeprogramme, die bereits zuvor verwendeten Textverarbeitungsprogramme und Schreibmaschinen mit elektronischer Anzeige, die einen Druck nach Fertigstellung des gesamten Textes erlauben. Inzwischen werden auch Datenbanken, Webeditoren, E-Mail-Clients und zahlreiche weitere Programme mit integrierten Rechtschreibprüfungen ausgestattet.
Die Anfänge der elektronischen Rechtschreibprüfung
Bis in die neunziger Jahre wurde das oft mithilfe einfacher Wortlisten realisiert, mit deren Hilfe der geschriebene Text verglichen wurde. Dies erfordert keine komplexen Algorithmen, die in der Anfangszeit des Computers zu viel Rechenzeit erfordert hätten. Die Nachteile sind zahlreich. Zum einen werden zusammengesetzte Wörter generell als Fehler erkannt, sofern sie nicht ebenfalls in der Wortliste stehen. Auch Wörter mit Prä- und Suffixen, Partikeln usw. müssen in der Wortliste stehen, um nicht als Fehler markiert zu werden. Der begrenzte Speicher erforderte Kompromisse; gängige Zusammensetzungen wurden berücksichtigt, seltene nicht. Andere Wörter wie Komposita ohne Bindestrich hingegen werden fälschlicherweise als richtig eingestuft.
Rechtschreibprüfung heute
Mit zunehmender Rechenleistung heutiger Computer werden bessere Rechtschreibprüfungen möglich, oft sogar mit Prüfung der Grammatik und der Worttrennung. Folgende Rechtschreibfehler oder Tippfehler werden in fortschrittlichen Programmen erkannt:
- Buchstabenfolgen (auch Zeichenketten, engl. Strings), die nicht zum Wortbestand der aktuellen Sprache gehören. Beispiele für das Wort Fehler: Feler (Auslassung), Fehlet (Ersetzung), Fehlwer (Einfügung), Fehelr (Vertauschung)
- Wörter, die zwar existieren, aber in dieser Verwendung zu einem grammatikalischen Fehler führen. Beispiel: Mach deinen Buch zu.
- Wörter, die zwar existieren, aber im falschen Kontext stehen. Beispiel: Der Hammer frisst Gras.
Der erste Fall lässt sich mit relativ einfachen Mitteln korrigieren. Das Korrekturprogramm vergleicht Zeichenketten, die nicht im Wörterbuch gefunden werden können, mit den Wörterbucheinträgen und wählt diejenigen als Korrekturvorschläge, die der fehlerhaften Zeichenkette (dem Wort) am ähnlichsten sind. Die Editierdistanz (auch Levenshtein-Distanz) zwischen der fehlerhaften Sequenz und dem Korrekturvorschlag ist minimal, das heißt, dass das fehlerhafte Wort mit möglichst wenigen Änderungen in den Korrekturvorschlag überführt werden kann.
Vereinfachtes Beispiel:
- Fehlerhaftes Wort: Libe; im Lexikon: Liebe, Leib
- Levenshtein-Distanzen: für Liebe: 1 (eine Auslassung), für Leib: 2 (zwei Vertauschungen) --> Erster Korrekturvorschlag: Liebe
Der zweite Fall kann durch eine reine, wortbezogene Rechtschreibprüfung nicht gefunden werden, wohl aber durch eine grammatikalische Prüfung des Satzes, da hier ein Possessivartikel im Maskulinum („deine“) auf ein Neutrum („Buch“) angewendet wird.
Der dritte Fall wird auch dadurch nicht gefunden. Hier wäre eine semantische Prüfung des Textes notwendig; eine Funktionalität, die in herkömmlichen Textverarbeitungsprogrammen nicht enthalten ist.
Schwierigkeiten ergeben sich ferner insbesondere bei deutschen Texten durch zusammengesetzte Wörter. Um die Quote der zu Unrecht als fehlerhaft deklarierten Ausdrücke nicht zu hoch werden zu lassen, akzeptieren moderne Rechtschreibprogramme auch Zusammensetzungen, die nicht in Standardwörterbüchern stehen (z. B. „Bildungsmisere“). Ein Nachteil dieses Verfahrens ist, dass teilweise auch semantisch unsinnige Zusammensetzungen (z. B. „Fordergrund“, „Hautnachrichten“) nicht mehr als Fehler ausgewiesen werden.
Wenn die automatische Rechtschreibprüfung ein falsches Wort vorschlägt und dieses dann auch übernommen wird, spricht man auch vom Cupertino-Effekt.
Weblinks
Wikimedia Foundation.