Duplex perception of speech

Duplex perception of speech

Unter duplex perception of speech, also der doppelten Wahrnehmung von Sprache, auch einfach nur als duplex perception bezeichnet, versteht man ein stimmliches (phonetisches) bzw. sprachliches (linguistisches) Phänomen, bei welchem ein akustisches Signal sowohl als sprachliches als auch als nicht-sprachliches Signal wahrgenommen (perzipiert) wird.

Im Grunde handelt es sich bei der duplex perception lediglich um eine Theorie, die durch verschiedene Experimente belegbar sein soll. Bei diesen Experimenten wurden bestimmte Silben vorgespielt, bei denen die Übergänge zwischen den Lauten (bestimmten Konsonanten, den Plosiven, und einem Vokal) teilweise entfernt wurden. Diese Übergänge, also der Moment zwischen der Aussprache der Laute, wurden ebenfalls aufgenommen und isoliert vorgespielt. Im letzten Teil des Experiments wurde dann die Silbe ohne den isolierten Übergang auf dem einen Ohr und der isolierte Übergang auf dem anderen Ohr abgespielt, um feststellen zu können, ob der Übergang einerseits ausschließlich als Geräusch (nicht-sprachliches Signal), andererseits aber auch als Bestandteil der Silbe (und damit sprachlich) wahrgenommen wird.

Das menschliche Gehör kann in der Regel Frequenzen im Bereich von 20 bis 20.000 Hertz wahrnehmen. Ein Ton besteht allerdings nicht nur aus einer einzigen Frequenz, sondern setzt sich aus vielen Partial- oder Teiltönen zusammen. Um einen bestimmten Vokal (also a, e, i, o oder u) identifizieren zu können, ist es u.a. notwendig, dass bei diesem Vokallaut bestimmte Frequenzen bzw. Frequenzbereiche verstärkt sind. Diese verstärkten Frequenzbereiche bezeichnet man in der Akustik bzw. in der Phonetik als Formanten. Beim Laut o ist beispielsweise der Bereich um 500 Hertz verstärkt und auch der Frequenzbereich um 1000 Hz bildet einen sogenannten Gipfel. Bei der Bezeichnung der Formanten (F1, F2, F3 usw.) geht man von den niedrigen Frequenzen zu den höheren. Der Laut o hat also den Formant F1 bei 500 Hz und den Formant F2 bei 1000 Hz.

Die beiden ersten Gipfel in den unteren Frequenzbereichen sind mitentscheidend für die Erkennung der Vokale, während die Gipfel in den oberen Frequenzbereichen dafür weniger relevant sind, sondern mehr Parameter wie die Klangfarbe u.ä. beeinflussen.

Ein Plosivlaut (als weiterer in den Experimenten benutzter Laut) entsteht durch eine kurzzeitige Unterbrechung des Atemflussstromes und die sich daran sofort anschließende Freisetzung der angestauten Luft. Stimmlich führt dies zu einer kleinen Explosion, die den Klang produziert. Die Freisetzung der angestauten Luft findet bei den verschiedenen Plosivlauten an verschiedenen Stellen im Mund- bzw. Rachenraum statt. Bei den Lauten b und p wird die Luft unmittelbar hinter den Lippen gestaut, bei den Lauten d und t wird die Luft hinter den Zähnen und bei den Lauten g und k schließlich am hinteren Zungenrücken bzw. am Gaumen gestaut.

Experimente zur duplex perception

Bei den Experimenten zur duplex perception wurden Versuchspersonen Silben vorgesprochen, die jeweils aus der Kombination eines Plosivlauts (also aus einem der Konsonanten b, p, t, d, k oder g) und aus einem Vokal bestanden. Dadurch ergaben sich also Silben wie ba, ta, pu, ko oder da.

Bei dieser Kombination (Silbe) beeinflusst der Plosivlaut für einen kurzen Moment die Formanten des nachfolgenden Vokals. Bei Silben wie pa, ta oder ga gehen die Sprachlaute fließend ineinander über. Da die Artikulationsstelle bei den Plosiven allerdings unterschiedlich ist, wird auch der folgende Vokal jeweils von einer anderen Ausgangsposition angegangen, wobei die Formanten des Vokals kurzzeitig beeinflusst werden. Die Werte für die Formanten werden erst nach einem kurzen Übergang erreicht. Dieser Übergang, der als Transition bezeichnet wird, kann sowohl von unten als auch von oben erfolgen.

Beispiel: Die Werte für die Formanten, die beim a bei 1000 Hz (F1) und bei 1400 Hz (F2) liegen, werden bei der Silbe ba von unten erreicht, weil das b für einen kurzen Zeitraum von 20-40 msec dafür sorgt, dass diese Frequenzbereiche verstärkt werden und sich dann dem Normalwert angleichen. Dieses Angleichen bezeichnet man als Glissando, weil sich die Tonhöhe etwas nach oben verschiebt. Bei den Silben da und ga wird F1 ebenfalls von unten erreicht, F2 aber von oben, so dass ein gegensätzliches Glissando entsteht.

Ein Glissando kommt in der gesprochenen Sprache wesentlich häufiger vor als in der Musik. Es stellt den Übergang von einer Tonhöhe zu einer anderen (höher oder tiefer) dar, ohne dass dabei wie bei den meisten Musikinstrumenten ein Sprung oder ein Absatz entsteht). Das bekannteste Beispiel für ein (gesprochenes) Glissando stellt wohl das Ende eines Fragesatzes dar, bei dem der Sprecher mit der Stimme meist auf den letzten beiden Silben deutlich "nach oben" (bezogen auf die Tonhöhe) geht, um die Frage zu kennzeichnen.

In der Musik werden wesentlich häufiger deutlich voneinander getrennte Tonhöhen verwendet. Man kann sich die Veränderung der Tonhöhe bei einer Melodie wie eine Treppe (jede Stufe entspricht einer Tonhöhe) vorstellen, die immer wieder die Richtung wechselt, wobei die Tonhöhenunterschiede sehr verschieden (also mal größer, mal kleiner) sein können. Glissandi kommen in der Musik seltener vor, da sie nicht mit allen Instrumenten möglich sind. Ein Glissando kann man sich wie ein Teilstück einer Achterbahn (hoch oder runter) vorstellen, bei der es eben keine Sprünge gibt, da die Bahn von einer Höhe zur anderen gleitet.

Im ersten Experiment wurden nun die Übergänge zwischen den Lauten verändert, indem der F3-Übergang (also das Glissando) isoliert und entfernt wurde. Die Versuchspersonen konnten nun nicht mehr erkennen, wo der Plosivlaut im Mundraum gebildet wurde, konnten also die Artikulationsstelle des Plosivs nicht zuordnen.

Wurde den Probanden der Übergang isoliert dargeboten, so nahmen sie diesen auch nur als Glissando und damit als nicht-sprachliches Phänomen wahr.

Wurde den Versuchspersonen im letzten Experiment auf einem Ohr die defekte Plosiv-Vokal-Silbe und auf dem anderen Ohr die Transition vorgespielt, wurde nicht nur die Silbe eindeutig mit Artikulationsstelle identifiziert, sondern gleichzeitig auch das Glissando wahrgenommen.

Weblinks

Literaturquellen

  • Liberman AM, Isenberg D, Rakerd B.: Duplex perception of cues for stop consonants: evidence for a phonetic mode.
  • Friedrich Michael Dannenbauer: Sprachwissenschaftliche Grundlagen. In: Manfred Grohnfeldt (Hrsg.): Lehrbuch der Sprachheilpädagogik und Logopädie
  • Gerhard Böhme: Sprach-, Sprech-, Stimm- und Schluckstörungen

Wikimedia Foundation.

Игры ⚽ Нужно решить контрольную?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Duplex perception — Unter duplex perception of speech, auch einfach nur kurz duplex perception genannt, versteht man ein phonetisches bzw. linguistisches Phänomen, bei welchem ein akustisches Signal als Sprach und als nicht sprachliches Signal perzipert wird. Bei… …   Deutsch Wikipedia

  • Duplex perception — refers to the linguistic phenomenon whereby part of the acoustic signal is used for both a speech and a nonspeech percept. A listener is presented with two simultaneous, dichotic stimuli. One ear receives an isolated third formant transition that …   Wikipedia

  • Motor theory of speech perception — When we hear spoken words we sense that they are made of auditory sounds. The motor theory of speech perception argues that behind the sounds we hear are the intended movements of the vocal tract that pronounces them. The motor theory of speech… …   Wikipedia

  • McGurk effect — The McGurk effect is a perceptual phenomenon which demonstrates an interaction between hearing and vision in speech perception. It is a compelling illusion in which humans perceive mismatched audiovisual speech as a completely different… …   Wikipedia

  • J. C. R. Licklider — infobox person name = Joseph Carl Robnett Licklider image size = 106x149 other names = J.C.R Lick Computing s Johnny Appleseed nationality = flagicon|USA North American birth date = birth date|1915|03|11 birth place = St. Louis, Missouri, USA… …   Wikipedia

  • Musique en réseau — Un concert de musique en réseau ou de télémusique consiste en une ou des interactions en temps réel, en direct et à distance, assurées par un réseau informatique (et télématique) qui permet aux musiciens répartis dans différents lieux distants de …   Wikipédia en Français

  • communication — I (New American Roget s College Thesaurus) Act of communicating ideas Nouns 1. communication, intercourse, conversation, speech, writing, correspondence; message, tidings, news(see information). 2. communicator, messenger, nuncio; herald, crier,… …   English dictionary for students

  • Life Sciences — ▪ 2009 Introduction Zoology       In 2008 several zoological studies provided new insights into how species life history traits (such as the timing of reproduction or the length of life of adult individuals) are derived in part as responses to… …   Universalium

  • Business and Industry Review — ▪ 1999 Introduction Overview        Annual Average Rates of Growth of Manufacturing Output, 1980 97, Table Pattern of Output, 1994 97, Table Index Numbers of Production, Employment, and Productivity in Manufacturing Industries, Table (For Annual… …   Universalium

  • opinion — opin·ion /ə pin yən/ n 1 a: a belief stronger than impression and less strong than positive knowledge b: a formal expression of a judgment or appraisal by an expert see also opinion testimony at testimony compare …   Law dictionary

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”