Diphon

Diphon: Ein Diphon beschreibt in der konkatenativen Sprachsynthese den kurzen Abschnitt (Baustein) gesprochener Sprache, der in der Mitte eines Phons beginnt und in der Mitte des folgenden Phons endet. Ein Diphon enthält dadurch den durch Koartikulation entstehenden Übergang zwischen den beiden Lauten. Die Verkettung von Bausteinen, die jeweils nur ein Phon umfassen, führt bei der Sprachsynthese nur zu äußerst unbefriedigenden Ergebnissen, da die Koartikulation zwischen den Lauten in diesem Fall nicht berücksichtigt werden kann. Im Gegensatz dazu führt Diphonsynthese bereits zu erstaunlich guten Resultaten, die verständlich und hinreichend natürlich klingen. Die Qualität lässt sich durch die Verwendung längerer Bausteine anstelle von Diphonen (zum Beispiel Silben, häufige Wörter oder Lautfolgen) weiter steigern, was allerdings oft aus Gründen der Inventargröße nicht mehr praktikabel ist.
Die verwendeten Diphonbausteine werden im Verlauf der Synthese zum Beispiel mit Hilfe des PSOLA-Algorithmus in ihren prosodischen Informationen (Stärke, Grundfrequenz, Dauer) manipuliert, um eine natürliche Sprechmelodie zu erzeugen.

Drei Sprachsynthesesysteme, die auf Basis der Diphonsynthese funktionieren, sind DreSS, SVOX und das kostenlose Programm Mbrola.

Weblinks

The Mbrola Project - engl.

Kategorie:
Phonetik

Игры ⚽ Нужно решить контрольную?

Schlagen Sie auch in anderen Wörterbüchern nach:

PSOLA — Dieser Artikel als Sprachausgabe. Unter Sprachsynthese versteht man die künstliche Erzeugung der menschlichen Sprechstimme (fälschlicherweise wird es oft auch als Synonym für Vorleseautomat oder Text to Speech System (TTS) verwendet) … Deutsch Wikipedia
Sprachausgabe — Dieser Artikel als Sprachausgabe. Unter Sprachsynthese versteht man die künstliche Erzeugung der menschlichen Sprechstimme (fälschlicherweise wird es oft auch als Synonym für Vorleseautomat oder Text to Speech System (TTS) verwendet) … Deutsch Wikipedia
Sprachsynthesizer — Dieser Artikel als Sprachausgabe. Unter Sprachsynthese versteht man die künstliche Erzeugung der menschlichen Sprechstimme (fälschlicherweise wird es oft auch als Synonym für Vorleseautomat oder Text to Speech System (TTS) verwendet) … Deutsch Wikipedia
Stimmsynthese — Dieser Artikel als Sprachausgabe. Unter Sprachsynthese versteht man die künstliche Erzeugung der menschlichen Sprechstimme (fälschlicherweise wird es oft auch als Synonym für Vorleseautomat oder Text to Speech System (TTS) verwendet) … Deutsch Wikipedia
Talkie — Dieser Artikel als Sprachausgabe. Unter Sprachsynthese versteht man die künstliche Erzeugung der menschlichen Sprechstimme (fälschlicherweise wird es oft auch als Synonym für Vorleseautomat oder Text to Speech System (TTS) verwendet) … Deutsch Wikipedia
Text-to-Speech — Dieser Artikel als Sprachausgabe. Unter Sprachsynthese versteht man die künstliche Erzeugung der menschlichen Sprechstimme (fälschlicherweise wird es oft auch als Synonym für Vorleseautomat oder Text to Speech System (TTS) verwendet) … Deutsch Wikipedia

Academic dictionaries and encyclopedias

Diphon

Weblinks

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Academic dictionaries and encyclopedias

Deutsch Wikipedia

Diphon

Weblinks

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Direct link