Intelligent Word Recognition

Intelligent Word Recognition

Intelligent Word Recognition (IWR) bezeichnet einen Seitenzweig der OCR-Technik (Texterkennung über Mustererkennungsverfahren). Sie soll Schriften erkennen, die mit herkömmlichen OCR-Verfahren nicht übersetzbar sind, wie Fließhandschriften, Unterschriften, arabische Schrift etc.

Herkömmliche OCR übersetzt Einzelzeichen, die der OCR-Engine über Bildvorverarbeitungsschritte geliefert werden. Zusammenhängende Schriften lassen sich jedoch nicht zuverlässig in Einzelteile als mögliche Buchstabenkandidaten zerlegen. IWR kombiniert mehrere Methoden und gleicht die Ergebnisse mit einem Wörterbuch ab.

Analyse des gesamten Wortes: Die Buchstaben, aus denen sich ein Wort zusammensetzt, geben einem Wort einen charakteristischen Umriss. In Klassifikatoren abgelegte Wörterbücher liefern mögliche Wortkandidaten.

Zerlegung von möglichen Buchstaben oder Silben: Wörter lassen sich an charaktistischen Stellen zerlegen. Auch hierfür liefern Klassifikatoren mögliche Silbenkandidaten.

Wörterbuchabgleich: Die Kombination der Ergebnisse durch charakteristische Umrisse und Wortteile minimieren die Anzahl der Kandidaten im Hauptwörterbuch.

Nutzbarkeit und Grenzen der Technik

Die Nutzbarkeit dieser Technik beschränkt sich auf eindeutig definierte Feldbereiche. Sie wurde zum Beispiel von einem französischen Hersteller für Texterkennungssysteme für Scheck-Lesesysteme entwickelt, deren Layout ein Feld für den ausgeschriebenen Zahlungsbetrag enthält, das einen Fließtext ermöglicht.

Für dieses Feld steht eine eingeschränkte Wortliste zu Verfügung, so dass umfassend trainierte Klassifikatoren zuverlässige Ergebnisse liefern können.

Die Grenzen von IWR sind durch den Umstand gegeben, dass Handschriften stark variieren. Und je größer das zugrunde liegende Wörterbuch ist, desto größer wird die Wahrscheinlichkeit, dass keine eindeutigen Ergebnisse mehr lieferbar sind.

Siehe auch


Wikimedia Foundation.

Игры ⚽ Нужно решить контрольную?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Intelligent Character Recognition — wird im angelsächsischen Sprachraum die elektronische Texterkennung genannt, wohingegen im deutschsprachigen Umfeld „OCR“ als Synonym Verwendung findet. Tatsächlich handelt es sich jedoch um unterschiedliche Teilbereiche der Texterkennung.… …   Deutsch Wikipedia

  • Optical Character Recognition — Texterkennung oder auch Optische Zeichenerkennung (Abkürzung OCR von englisch Optical Character Recognition, selten auch: OZE) ist ein Begriff aus dem IT Bereich und beschreibt die automatische Texterkennung von einer gedruckten Vorlage.… …   Deutsch Wikipedia

  • Optical character recognition — Texterkennung oder auch Optische Zeichenerkennung (Abkürzung OCR von englisch Optical Character Recognition, selten auch: OZE) ist ein Begriff aus dem IT Bereich und beschreibt die automatische Texterkennung von einer gedruckten Vorlage.… …   Deutsch Wikipedia

  • Handwriting recognition — is the ability of a computer to receive and interpret intelligible handwritten input from sources such as paper documents, photographs, touch screens and other devices. The image of the written text may be sensed off line from a piece of paper by …   Wikipedia

  • Intelligent Machines Research Corporation — (IMR) was founded by David H. Shepard and William Lawless, Jr. in 1952 for the purpose of commercializing the work Shepard had done with the help of Harvey Cook in building Gismo , a machine later called the Analyzing Reader .IBM obtained a… …   Wikipedia

  • Intelligent design movement — Part of a series of articles on Intelligent design …   Wikipedia

  • Optical character recognition — Optical character recognition, usually abbreviated to OCR, is the mechanical or electronic translation of scanned images of handwritten, typewritten or printed text into machine encoded text. It is widely used to convert books and documents into… …   Wikipedia

  • Timeline of intelligent design — This timeline of intelligent design outlines the major events in the development of intelligent design as presented and promoted by the intelligent design movement.Creationism and Creation science*1920s: Fundamentalist Modernist Controversy – in… …   Wikipedia

  • Handschrifterkennung — Texterkennung oder auch Optische Zeichenerkennung (Abkürzung OCR von englisch Optical Character Recognition, selten auch: OZE) ist ein Begriff aus dem IT Bereich und beschreibt die automatische Texterkennung von einer gedruckten Vorlage.… …   Deutsch Wikipedia

  • OCR-Schriften — Texterkennung oder auch Optische Zeichenerkennung (Abkürzung OCR von englisch Optical Character Recognition, selten auch: OZE) ist ein Begriff aus dem IT Bereich und beschreibt die automatische Texterkennung von einer gedruckten Vorlage.… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”