Gestenerkennung

Gestenerkennung

Gestenerkennung ist die automatische Erkennung von durch Menschen ausgeführten Gesten mittels eines Computers. Ein Teilgebiet der Informatik beschäftigt sich mit den Algorithmen und mathematischen Methoden zur Erkennung von Gesten und der Nutzung von Gesten zur Mensch-Computer-Interaktion. Jede Körperhaltung und Körperbewegung kann dabei prinzipiell eine Geste darstellen. Die größte Bedeutung hat jedoch die Erkennung von Hand- und Kopfgesten. Eine Variante der Gestenerkennung ist die Erkennung so genannter Mausgesten.

Inhaltsverzeichnis

Definition

Mit Bezug auf die Mensch-Computer-Interaktion definieren Kurtenbach und Hulteen eine Geste wie folgt: „A gesture is a motion of the body that contains information. Waving goodbye is a gesture. Pressing a key on a keyboard is not a gesture because the motion of a finger on its way to hitting a key is neither observed nor significant. All that matters is which key was pressed“.[1] Im Gegensatz dazu verzichten Harling und Edwards auf die Forderung nach Bewegung und verstehen unter einer Geste auch statische Handhaltungen.[2] Es kann zwischen Systemen unterschieden werden, bei denen sich die zur Erkennung notwendige Sensorik direkt am Körper des Benutzers befindet, und solchen, bei denen der Benutzer durch externe Sensorik beobachtet wird.

Gerätebasierte Gestenerkennung

Die meisten auf am Körper getragener oder mit der Hand geführter Sensorik basierenden Systeme nutzen in Datenhandschuhe integrierte Beschleunigungs- oder Positionssensoren. Der Nachteil von auf Datenhandschuhen basierenden Systemen ist, dass der Benutzer den Handschuh anziehen muss, um das System zu nutzen. Mit der Hand geführte Systeme wie der Controller der Nintendo Wii und der durch die Firma BeeCon hergestellte BlueWand[3] können ebenfalls zur Gesteneingabe genutzt werden. Beide Systeme lassen sich durch den Benutzer in die Hand nehmen und verfügen über Beschleunigungssensoren, um die Bewegung des jeweiligen Gerätes festzustellen.

Kamerabasierte Gestenerkennung

Bei Systemen mit externer Sensorik handelt es sich zumeist um kameragestützte Systeme.[4] Die Kameras werden genutzt, um Bilder des Benutzers zu erstellen. Dabei existieren sowohl Systeme mit einer Kamera als auch mit mehreren Kameras. Kamerabasierte Verfahren greifen auf Techniken der Bildanalyse zurück, um die Körperhaltung des Benutzers zu erkennen. Kameragestützte Gestenerkennung wird beispielsweise in Spielen für das an Spielekonsolen anschließbare EyeToy verwendet.

Gestenarten

Der Buchstabe „J“ in einer kanadischen Gebärdensprache

Es kann außerdem nach zwei Gestenarten unterschieden werden. Bei kontinuierlichen Gesten besteht eine direkte Verbindung zwischen der durch den Computer beobachteten Bewegung und einem Zustand im Computer. Beispielsweise kann durch Zeigen auf den Bildschirm ein Zeiger gesteuert werden. Bei diskreten Gesten handelt es sich hingegen um beschränkte Mengen von eindeutigen Gesten, mit denen in der Regel jeweils eine Aktion verknüpft ist. Ein Beispiel für diskrete Gesten ist die Gebärdensprache, bei der jede Gebärde mit einer bestimmten Bedeutung verknüpft ist.[5]

Erkennung

Bei der eigentlichen Erkennung von Gesten fließen die Informationen der Sensorik in Algorithmen ein, welche die Rohdaten analysieren und Gesten erkennen. Dabei kommen Algorithmen zur Mustererkennung zum Einsatz. Zur Entfernung von Rauschen in den Eingabedaten und zur Datenreduktion erfolgt häufig im ersten Schritt eine Vorberarbeitung der Sensordaten. Anschließend werden Merkmale aus den Eingabedaten extrahiert. Diese Merkmale dienen als Eingabe für die Klassifikation. Hierfür werden häufig Hidden Markov Models, künstliche neuronale Netze und weitere Techniken, die ihren Ursprung meist in der Forschung zur künstliche Intelligenz haben, eingesetzt.

Einzelnachweise

  1. Kurtenbach G. und Hulteen E.A. „Gestures in Human-Computer Communication“. In: The Art of Human-Computer Interface Design. pp. 309–317, 1990
  2. P.A. Harling und A.D.N. Edwards. 1997. "Hand Tension as a Gesture Segmentation Cue." In: Progress in Gestural Interaction, pp. 75-88.
  3. Fuhrmann T., Klein M. und Odendahl M. „The BlueWand as interface for ubiquitous and wearable computing environments”. In: Proceedings of the European Conference on Personal Mobile Communications. pp. 91–95, 2003
  4. Pavlovic V.I., Sharma R. und Huang T.S. „Visual interpretation of hand gestures for human-computer interaction: a review”. IEEE Transactions on Pattern Analysis and Machine Intelligence. vol. 19, pp. 677–695, 1997.
  5. Huang C.L. und Huang W.Y. „Sign language recognition using model-based tracking and a 3D Hopfield neural network”. Machine Vision and Applications. vol. 10, pp. 292–307, 1998.

Weblinks


Wikimedia Foundation.

Игры ⚽ Нужно сделать НИР?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • TablePC — Hybrid Tablet PC (HP TC1000) mit angeklappter Tastatur Tablet PC (engl. tablet Schreibtafel, US engl. tablet Notizblock) bezeichnet einen tragbaren stiftbedienbaren Computer, der unter anderem wie ein Notizblock verwendet werden kann. Der… …   Deutsch Wikipedia

  • TabletPC — Hybrid Tablet PC (HP TC1000) mit angeklappter Tastatur Tablet PC (engl. tablet Schreibtafel, US engl. tablet Notizblock) bezeichnet einen tragbaren stiftbedienbaren Computer, der unter anderem wie ein Notizblock verwendet werden kann. Der… …   Deutsch Wikipedia

  • Tablet PC — Hybrid Tablet PC (HP TC1000) mit angeklappter Tastatur Tablet PC (engl. tablet Schreibtafel, US engl. tablet Notizblock) bezeichnet einen tragbaren stiftbedienbaren Computer, der unter anderem wie ein Notizblock verwendet werden kann. Der… …   Deutsch Wikipedia

  • Tablett-PC — Hybrid Tablet PC (HP TC1000) mit angeklappter Tastatur Tablet PC (engl. tablet Schreibtafel, US engl. tablet Notizblock) bezeichnet einen tragbaren stiftbedienbaren Computer, der unter anderem wie ein Notizblock verwendet werden kann. Der… …   Deutsch Wikipedia

  • Tablett PC — Hybrid Tablet PC (HP TC1000) mit angeklappter Tastatur Tablet PC (engl. tablet Schreibtafel, US engl. tablet Notizblock) bezeichnet einen tragbaren stiftbedienbaren Computer, der unter anderem wie ein Notizblock verwendet werden kann. Der… …   Deutsch Wikipedia

  • Bildverstehen — Der Begriff Maschinelles Sehen oder Bildverstehen beschreibt im Allgemeinen die computergestützte Lösung von Aufgabenstellungen, die sich an den Fähigkeiten des menschlichen visuellen Systems orientieren. Vor allem werden maschinell sehende… …   Deutsch Wikipedia

  • Computersehen — Der Begriff Maschinelles Sehen oder Bildverstehen beschreibt im Allgemeinen die computergestützte Lösung von Aufgabenstellungen, die sich an den Fähigkeiten des menschlichen visuellen Systems orientieren. Vor allem werden maschinell sehende… …   Deutsch Wikipedia

  • Geste — Als Geste (v. lat.: gerere = tragen, ausführen; PPP: gestum) bezeichnet man zeichenhafte Bewegungen bestimmter Körperteile (v. a. Hand und Kopf) zum Zwecke der nonverbalen Kommunikation. Gesten sind u. a. Winken, Augenrollen, Nicken, Achselzucken …   Deutsch Wikipedia

  • Gesten — Als Geste (v. lat.: gerere = tragen, ausführen; PPP: gestum) bezeichnet man zeichenhafte Bewegungen bestimmter Körperteile (v. a. Hand und Kopf) zum Zwecke der nonverbalen Kommunikation. Gesten sind u. a. Winken, Augenrollen, Nicken, Achselzucken …   Deutsch Wikipedia

  • Gestus — Als Geste (v. lat.: gerere = tragen, ausführen; PPP: gestum) bezeichnet man zeichenhafte Bewegungen bestimmter Körperteile (v. a. Hand und Kopf) zum Zwecke der nonverbalen Kommunikation. Gesten sind u. a. Winken, Augenrollen, Nicken, Achselzucken …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”