Maschinelles Sehen

Maschinelles Sehen

Der Begriff Maschinelles Sehen oder Bildverstehen beschreibt im Allgemeinen die computergestützte Lösung von Aufgabenstellungen, die sich an den Fähigkeiten des menschlichen visuellen Systems orientieren.

Vor allem werden maschinell sehende Systeme derzeit in industriellen Herstellungsprozessen in den Bereichen Automatisierungstechnik und Qualitätssicherung eingesetzt. Weitere Einsatzgebiete finden sich z. B. in der Verkehrstechnik – von der einfachen Radarfalle bis hin zum „sehenden Fahrzeug“ – und in der Sicherheitstechnik (Zutrittskontrolle, automatische Erkennung von Gefahrensituationen).

Folgende Aufgabenstellungen können derzeit wirtschaftlich sinnvoll gelöst werden.

Nur ein vergleichsweise kleiner Teil der aktuellen Forschungsprojekte beschäftigt sich damit, tatsächlich den Sinn oder den Inhalt von Bildern zu verstehen; meistens geht es eher darum, in Bildern Objekte zu detektieren, sie zu beschreiben, ihre Eigenschaften zu vermessen, sie zu klassifizieren, und auf Grund dieser Ergebnisse Entscheidungen zu treffen oder Prozesse zu steuern. Da es beim Bildverstehen meistens um den Entwurf oder die Anwendung von Rechenverfahren geht, handelt es sich um ein Teilgebiet der Informatik, das starke Querbeziehungen zu Photogrammetrie, Signalverarbeitung und künstlicher Intelligenz aufweist. Die Werkzeuge des Maschinensehens stammen meistens aus der Mathematik, insbesondere aus Geometrie, linearer Algebra, Statistik, Operations Research (Optimierung) und Funktionalanalysis. Typische Aufgaben des Maschinensehens sind die Objekterkennung und die Vermessung der geometrischen Struktur von Objekten sowie von Bewegungen (Fremdbewegung, Eigenbewegung). Dabei wird auf Algorithmen aus der Bildverarbeitung zurückgegriffen, zum Beispiel die Segmentierung und auf Verfahren der Mustererkennung, beispielsweise zur Klassifizierung von Objekten.

Inhaltsverzeichnis

Methoden

Werkzeuge der Bildverarbeitung zur automatischen Interpretation sind:

In komplexeren Erkennungsaufgaben werden oft Modelle eingesetzt. Diese beinhalten Vorwissen, das zur Erkennung eines Gegenstandes benutzt werden kann. Beispielsweise beschreibt ein Gesichtsmodell, dass sich die Nase immer zwischen dem Mund und den Augen befinden muss. Somit weiß ein Suchalgorithmus ungefähr, wo er den Mund suchen muss, wenn er Augen und Nase schon gefunden hat. Hier einige Modelltechniken:

Anwendungen

In industriellen Umgebungen werden die Techniken des Bildverstehens heutzutage erfolgreich eingesetzt. Computer unterstützen beispielsweise die Qualitätskontrolle und vermessen einfache Gegenstände. Weitgehend bestimmt der Programmierer hier die Umgebungsbedingungen, die wichtig für ein fehlerfreies Ablaufen seiner Algorithmen sind (Kameraposition, Beleuchtung, Geschwindigkeit des Fließbandes, Lage der Objekte usw.).

Beispiele für den Einsatz in industriellen Umgebungen sind:

  • Auf einem Förderband werden Beilegscheiben kontrolliert, um die Maßhaltigkeit zu überprüfen und die Fehlerquote des Endprodukts um mehrere Zehnerpotenzen zu verkleinern.
  • Schweißroboter werden an die richtige Schweißposition gesteuert.

In natürlichen Umgebungen werden weit schwierigere Anforderungen an die Techniken des Bildverstehens gestellt. Hier hat der Programmierer keinen Einfluss auf die Umgebungsbedingungen, was die Erstellung eines robusten, fehlerfrei ablaufenden Programms erheblich erschwert. Man kann sich dieses Problem anhand eines Beispiels zur Erkennung von Automobilen verdeutlichen: Ein schwarzes Auto hebt sich vor einer weißen Wand gut ab, der Kontrast zwischen einem grünen Auto und einer Wiese ist allerdings sehr gering und eine Unterscheidung nicht einfach.

Beispiele für den Einsatz in natürlichen Umgebungen sind:

  • automatische Erkennung der Fahrbahn und von Fußgängern am Straßenrand
  • Erkennung von menschlichen Gesichtern und deren Mimik
  • Erkennung von Personen und deren Tätigkeit

Weitere Anwendungen finden sich in einer Vielzahl unterschiedlicher Bereiche:

Siehe auch

Weblinks


Wikimedia Foundation.

Игры ⚽ Поможем сделать НИР

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Kernstrahlgeometrie — Zwei Kameras nehmen eine Szene auf. Die Epipolargeometrie beschreibt die Beziehung zwischen den beiden Bildern. Die Epipolargeometrie (selten auch Kernstrahlgeometrie) ist ein mathematisches Modell aus der Geometrie, das die geometrischen… …   Deutsch Wikipedia

  • Stereoanalyse — Zwei Kameras nehmen eine Szene auf. Die Epipolargeometrie beschreibt die Beziehung zwischen den beiden Bildern. Die Epipolargeometrie (selten auch Kernstrahlgeometrie) ist ein mathematisches Modell aus der Geometrie, das die geometrischen… …   Deutsch Wikipedia

  • Dickmanns — Ernst Dieter Dickmanns war Professor an der Universität der Bundeswehr München (1975 2001) und ein Pionier des dynamischen maschinellen Sehens und der autonomen Fahrzeuge. Dickmanns war Gastprofessor am CalTech in Pasadena und am Massachusetts… …   Deutsch Wikipedia

  • Epipolargeometrie — Zwei Kameras nehmen von unterschiedlichen Standpunkten eine Szene auf. Die Epipolargeometrie beschreibt die Beziehung zwischen den beiden Bildern. Die Epipolargeometrie (selten auch Kernstrahlgeometrie) ist ein mathematisches Modell aus der… …   Deutsch Wikipedia

  • Bildverstehen — Der Begriff Maschinelles Sehen oder Bildverstehen beschreibt im Allgemeinen die computergestützte Lösung von Aufgabenstellungen, die sich an den Fähigkeiten des menschlichen visuellen Systems orientieren. Vor allem werden maschinell sehende… …   Deutsch Wikipedia

  • Computersehen — Der Begriff Maschinelles Sehen oder Bildverstehen beschreibt im Allgemeinen die computergestützte Lösung von Aufgabenstellungen, die sich an den Fähigkeiten des menschlichen visuellen Systems orientieren. Vor allem werden maschinell sehende… …   Deutsch Wikipedia

  • Franz W. Leberl — (* 1945 in Deutschland) ist ein österreichischer Photogrammeter und Professor für maschinelles Sehen und Darstellen (Computer Graphics and Vision) an der Technische Universität Graz. Inhaltsverzeichnis 1 Leben 2 Wirken 3 Auszeichnungen …   Deutsch Wikipedia

  • LO-RANSAC — RANSAC (Random Sample Consensus, deutsch etwa „Übereinstimmung mit einer zufälligen Stichprobe“) ist ein Algorithmus zur Detektion von Ausreißern und groben Fehlern innerhalb einer Reihe von Messwerten. Aufgrund seiner Robustheit wird er vor… …   Deutsch Wikipedia

  • Machine Vision — Der Begriff Maschinelles Sehen oder Bildverstehen beschreibt im Allgemeinen die computergestützte Lösung von Aufgabenstellungen, die sich an den Fähigkeiten des menschlichen visuellen Systems orientieren. Vor allem werden maschinell sehende… …   Deutsch Wikipedia

  • Musteranalyse — ist ein Teilgebiet der Mustererkennung. Unter Musteranalyse wird die automatische Generierung einer Beschreibung aus dem Signal, dem Muster, verstanden. Beispiele für Muster sind Bilder, oder Bildfolgen und Sprachsignale. In der Musteranalyse… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”