- Sehvorgang
-
In der Physiologie ist visuelle Wahrnehmung die Aufnahme und Verarbeitung von visuellen Reizen, bei der eine Extraktion relevanter Informationen, Erkennung von Elementen und deren Interpretation durch Abgleich mit Erinnerungen stattfindet. Somit geht die visuelle Wahrnehmung weit über das reine Aufnehmen von Information hinaus.
Physiologische Einzelheiten zum Wahrnehmungsapparat finden sich unter visuelles System.
Inhaltsverzeichnis
Geschichte
Im Altertum existierten unterschiedliche Theorien über die visuelle Wahrnehmung:
Die Wahrnehmungstheorie von Euklid (365–300 v.Chr.) setzte sich mit Problemen der Raumwahrnehmung (z. B. Perspektive und Größenkonstanz) auseinander. Die Sehlinien gehen nach dieser Theorie vom Auge aus und bestimmen die Wahrnehmung. Diese Theorie des „Sehstrahls“ scheint im Lichte physikalischer Betrachtungen ziemlich absurd zu sein, erhält aber durch die modernen Erkenntnisse der Blickbewegungsanalysen eine Art späte Rehabilitation (siehe foveale Wahrnehmung).
Die Wahrnehmungstheorie von Empedokles (492–432 v.Chr.) besagte scheinbar das Gegenteil. Die von den Poren (heute würde man sagen Pigmente) der Dinge ausgehenden Einflüsse, eine Art von Strahlungen, die durch das Licht beeinflusst (heute würde man sagen reflektiert) werden, dringen in die Sinnesorgane ein, und werden wahrgenommen, wenn sie dort eine Entsprechung finden (Gleiches wird durch Gleiches erkannt). Auch diese Theorie, die sich mit dem Erkennen von Dingen der Außenwelt befasst, ist in ihrem Ansatz moderner als es scheint. Sie bezieht sich aus heutiger Sicht auf die periphere Wahrnehmung, die ja auch auf den Betrachter einwirkt, selbst wenn dieser gar nicht hinschaut.
Alhazen oder Ibn al-Haytham, der „Vater der Optik“, (965–1040) bewies als erster, dass die visuelle Wahrnehmung mit dem Licht zusammenhängt, das ins Auge fällt. Er stellte als erster die Hypothese auf, dass die Sehwahrnehmung im Gehirn und nicht im Auge stattfindet.
Durch Versuche wies er nach, dass die Wahrnehmung durch die persönliche Erfahrung eines Menschen beeinflusst wird. [1] Al-Haytham führte Experimente über menschliche Wahrnehmung durch und ergänzte die Arbeiten des Ptolemäus über stereoskopisches Sehen. [2][3]
Leonardo Da Vinci, (1452–1519) erkannte als Erster die optische Besonderheit des menschlichen Auges. Er schrieb: „Das Auge hat eine einzige Zentrallinie und alle Dinge, welche durch diese Linie zum Auge gelangen, werden gut gesehen. Das Auge, von welchem uns die Erfahrung so deutlich die Funktion offenbart, wurde von einer unendlich großen Anzahl von Autoren in einer bestimmten Weise beschrieben; ich aber finde, dass es ganz anders ist.“
Zu dieser Ansicht gelangte er durch Beobachtungen und mit Hilfe von optischen Experimenten. Damit ist er der Entdecker des Unterschieds zwischen fovealem und peripherem Sehen. [4]
Hermann von Helmholtz [5] wird oft als Vater der modernen visuellen Wahrnehmungstheorie betrachtet. Er verglich das Auge mit optischen Geräten und fand seine Konstruktionsmerkmale sehr primitiv. Theoretisch konnte das Auge gar keine brauchbaren Sehresultate liefern. Er schloss daraus, dass die Wahrnehmung nur durch „unbewusste Schlüsse“ zustande kommen könne, die durch bereits vorhandene Wahrnehmungserfahrungen ermöglicht werden.
Solche Wahrnehmungserfahrungen sind z. B.:
- Licht kommt gewöhnlich von oben
- Gegenstände werden nicht von unten gesehen
- Gesichter werden in aufrechter Position erkannt [6]
Das Studium der optischen Täuschungen hat gezeigt, welche unbewussten Schlüsse im Wahrnehmungsvorgang enthalten sein können.
Eine andere Art unbewusster Schlüsse basiert auf der Wahrscheinlichkeitsempfindung, welche durch die Häufigkeit bereits gemachter ähnlicher Wahrnehmung bestimmt wird. [7]
Wahrnehmungsprozess
Reizaufnahme
Durch den optischen Apparat des Auges wird auf der Netzhaut ein seitenverkehrtes und auf dem Kopf stehendes Bild erzeugt. Die Lichtreize werden von den Sinneszellen der Retina, den Stäbchen (Helligkeit) und Zapfen (Farbsehen), registriert. Sie bilden ein Membranpotenzial, das über bipolare Zellen an Ganglienzellen weitergeleitet wird, von denen jede Informationen auf einem Teilbereich der Netzhaut encodiert
Weiterleitung und Encodierung
Jede Ganglienzelle verarbeitet Informationen aus einem rezeptives Feld, also einen bestimmten Bereich auf der Retina. Die rezeptiven Felder der Ganglienzellen überlappen sich stark. Die Ganglienzellen werden in On- und Off-Center-Zellen unterteilt, welche vor allem bei der Kantendetektion eine wichtige Rolle spielen. On-Center-Zellen sprechen an, wenn Licht in das Zentrum des Rezeptiven Feldes fällt und senken ihre Feuerrate wenn periphere Bereiche des Feldes stärker aktiviert werden. Off-Center-Zellen verhalten sich genau andersherum und feuern verstärkt, wenn Lichtreize in Randbereichen er Rezeptiven Feldes aufgenommen werden. Die On- und Off-Center-Zellen sind in bestimmten Mustern kombiniert, sodass Kanten (also Bereiche, in denen ein Helligkeitswechsel stattfindet) oder Balken (Helligkeitswechsel und Rückkehr zur Ausgangsintensität) erkannt werden können. Auch Größe, Länge und Lage von Linien werden extrahiert. Informationen wie Farbe und Bewegung werden auch von spezialisierten Ganglionzellen ausgewertet.
Raumwahrnehmung
Die Raumwahnehmung stützt sich auf mehrere Verfahren um aus dem zweidimensionalen Bild auf der Netzhaut eine Repräsentation der dreidimensionalen Welt zu erstellen. Durch das stereopskope Sehen können Rauminformationen aus den leichten Unterschieden zwischen den vom Augenpaar aufgenommenen Bildern konstruiert werden. Bewegt sich der Betrachter relativ zu Gegenständen im Raum, so bewegen sich die Abbilder Auf der Netzhaut umso langsamer, je weiter der Gegenstand vom Betrachter entfernt ist. Daneben kann räumliche Wahrnehmung über den Texturgradienten stattfinden, d.h. über die Veränderungen der Textur je nach räumlichen Abstand.
Objektextraktion
Bevor Objekte erkannt und interpretiert werden können, muss erst aus den Informationen extrahiert werden, wo sich Objekte befinden und welche der erkannten Linien zu einem Objekt gehören. Diese Gestaltgesetze funktionieren alle nach dem Prinzip eine möglichst prägnante Lösung zu finden:
- Prägnanz: Eine Figur wird so wahrgenommen, dass sie einer möglichst einfachen Struktur entspricht
- Nähe: Bildelemente werden als zusammengehörig empfunden, wenn diese nahe beieinanderliegen
- Ähnlichkeit: Bildteile gleicher Form oder Farbe werden als Ganzes gesehen
- Symmetrie: symmetrische Strukturen werden dem gleichen Objekt zugeordnet
- Gemeinsame Bewegung (Common fate): Gleiche Bewegungen und gleichzeitiges Erscheinen oder Verschwinden von Bildelementen erzeugt eine Zusammengehörigkeit
- Kontinuität: Bildelemente, die eine Fortsetzung vorangehender oder unterbrochener Elemente zu sein scheinen, werden als zusammengehörig angesehen
- Geschlossenheit: Linien, die eine Fläche umschließen, werden unter sonst gleichen Umständen leichter als eine Einheit aufgefasst als diejenigen, die sich nicht zusammenschließen
- Gemeinsame Region: Elemente in abgegrenzten Gebieten werden als zusammengehörig empfunden
- Verbundene Elemente: Verbundene Elemente werden als ein Objekt wahrgenommen
Objekterkennung
In der Objekterkennung werden die extrahierten Objekte interpretiert und können mit Erinnerungen abgeglichen werden.
Abgleich an Merkmalen
Ein Objekt kann mit einer bestehenden Erinnerung durch eine Merkmalanalyse abgeglichen werden. In diesem Modell wird vorausgesetzt, dass eine Form oder ein Objekt in einen Satz abstrakter Merkmale repräsentiert wird. Der Buchstabe K hat z.B. die Merkmale „langer senkrechter Stich“ „kürzerer Strich mit ca 30° Neigung“ und „kürzerer Strich mit ca 75° Neigung“ Diese Modell ist dem eines Schablonen-Abgleichs dadurch überlegen, dass auch abgeänderte Muster erkannt werden. Beim „K“ können Größe, Lage, Rotation oder Schriftart geändert werden, sodass eine „Schablone“ nicht mehr passen würde. Unter all diesen Transformationen bleiben die Merkmale jedoch gleich. Zudem entspricht der Merkmalsabgleich der Encodierung durch die Ganglionzellen (Extraktion von Linien)[8].
Erkennung komplexer Objekte
Zur Erkennung komplexer Objekte existiert die „Theorie der komponentialen Erkennung“ [9]
- Das komplexe Objekt wird in einfachere Unterobjekte gegliedert
- Die Teilobjekte werden Kategorien zugeordnet („Geons“ – geometrical icons)
- Sind die Unterobjekte erkannt und deren Anordnung zueinander bestimmt, kann das Objekt zugeordnet werden.
Bei der Zuordnung findet das eigentliche Erkennen statt. Das Objekt wird eingeordnet und repräsentiert dann ein Objekt einer Kategorie (wie z.B. „Hund“ oder „Telefon“)
Beispiele für Untersuchung der visuellen Wahrnehmung
In den Jahren nach 1960 wurden vermehrt Blickbewegungen aufgezeichnet und analysiert, z. B. beim Lesen von Texten [10] bei der Bildbetrachtung [11] und später auch beim Lösen visueller Probleme [12] und beim Autofahren. [13] Das Bild links zeigt, was in den ersten 2 Sekunden der Betrachtung eines Bildes geschehen kann. Der Hintergrund ist durch peripheres Sehen unscharf. Trotzdem kann man erkennen, dass es sich um eine Szene in einem Zimmer mit Personen handelt. Die erste Augenfixation zeigt ein paar Männerschuhe, vielleicht weil diese einen starken Kontrast aufweisen und außerdem sehr nahe bei der Grundposition der Augenfixationen liegen. Alle folgenden Fixationen springen von Gesicht zu Gesicht.
Man kann daraus schließen, dass das menschliche Gesicht im Normalfall die meiste Beachtung erhält, weil es eine Identifikation oder eine Beurteilung einer Person auf Grund biometrischer Ähnlichkeiten ermöglicht und so bereits eine erste Beurteilung einer zwischenmenschlichen Situation gestattet.
Eine wesentliche Tatsache: Die menschliche Wahrnehmung ist heuristisch und nicht linear d. h. es werden diejenigen Teile eines Bildes betrachtet, die zusätzliche Informationen enthalten, während subjektiv unwichtige oder bereits gut bekannte Bildelemente nicht fixiert werden (zusätzliche Beispiele siehe Blickbewegungsregistrierung).
Auf rechnerischer Ebene wurde von David Marr in der 1980er Jahren eine Theorie der Verarbeitung der Seheindrücke zur visuellen Wahrnehmung im Gehirn erstellt, die im Bereich der künstlichen Intelligenz ihre Anwendung findet.
Neurophysiologische Theorie
Eine neurophysiologisch orientierte Theorie der visuellen Wahrnehmung ist exemplarisch unter im Artikel Wahrnehmung dargestellt.
Verwandte Gebiete
Exterozeption (Wahrnehmung der Außenwelt): Geruchs- | Gesichts- | Hör- | Geschmacks- | Tastsinn: Berührung - Schmerz - Temperatur
Interozeption (Wahrnehmung des eigenen Körpers): Propriozeption (einschl. Tiefensensibilität) | Viszerozeption
Weitere: Gleichgewichtssinn | Zeitsinn | MagnetsinnQuellen
- ↑ Bradley Steffens (2006). Ibn al-Haytham: First Scientist, Chapter 5. Morgan Reynolds Publishing. ISBN 1-59935-024-6.
- ↑ Howard, I: Alhazen's neglected discoveries of visual phenomena. In: Perception. 25, 1996, S. 1203-1217. doi:10.1068/p251203
- ↑ Omar Khaleefa: Who Is the Founder of Psychophysics and Experimental Psychology?. In: American Journal of Islamic Social Sciences. 16, Nr. 2, 1999
- ↑ Hans-Werner Hunziker, (2006) Im Auge des Lesers: foveale und periphere Wahrnehmung – vom Buchstabieren zur Lesefreude, Transmedia Stäubli Verlag Zürich 2006 ISBN 978-3-7266-0068-6
- ↑ Handbuch der physiologischen Optik / Bd. 1. Die Dioptrik des Auges 1909, 3. Aufl. / erg. u. hrsg. in Gemeinsch. mit A. Gullstrand; J. von Kries v. W. Nagel
- ↑ Hans-Werner Hunziker, (2006) Im Auge des Lesers: foveale und periphere Wahrnehmung – vom Buchstabieren zur Lesefreude, Transmedia Stäubli Verlag Zürich 2006 ISBN 978-3-7266-0068-6
- ↑ Mamassian, Landy & Maloney (2002) http://www.purveslab.net/research/ A Primer on Probabilistic Approaches to Visual Perception]
- ↑ John R. Anderson:Kognitive Psychologie, ISBN 978-3827410245
- ↑ Biederman: Recognition-by-Components:A Theory of Human Image http://geon.usc.edu/~biederman/publications/Biederman_RBC_1987.pdf
- ↑ TAYLOR, ST.: Eye Movements in Reading: Facts and Fallacies. American Educational Research Association, 2 (4), 1965, 187–202.
- ↑ Yarbus, A. L. (1967). Eye movements and vision, Plenum Press, New York
- ↑ Hunziker, H. W. (1970). Visuelle Informationsaufnahme und Intelligenz: Eine Untersuchung über die Augenfixationen beim Problemlösen. Schweizerische Zeitschrift für Psychologie und ihre Anwendungen, 1970, 29, Nr 1/2
- ↑ Cohen, A. S. (1983). Informationsaufnahme beim Befahren von Kurven, Psychologie für die Praxis 2/83, Bulletin der Schweizerischen Stiftung für Angewandte Psychologie
Wikimedia Foundation.