Gesetz der Verteilung von Morphlängen

Gesetz der Verteilung von Morphlängen

Die Länge eines Morphs kann verschieden definiert werden: als die Zahl der Buchstaben, Laute oder Phoneme. Untersucht man nun für eine Reihe von Texten, wie häufig Morphe verschiedener Länge in ihnen vorkommen, so kann man feststellen, dass sie von einem Sprachgesetz gesteuert sind. Untersuchungen zu Lexika stehen noch aus; es ist aber damit zu rechnen, dass bei Texten und Lexika unterschiedliche Verteilungen das Vorkommen der Morphe repräsentieren werden. Es handelt sich im Prinzip um das gleiche Sprachgesetz, das die Quantitative Linguistik besonders für die Häufigkeitsverteilung der Wortlängen entwickelt hat (Gesetz der Verteilung von Wortlängen; Theorie: Wimmer u.a.).[1]

Inhaltsverzeichnis

Beispiel

Ein Beispiel für eine Morphlängenverteilung (gemessen als Zahl der Phoneme pro Morph) in einem kurzen Pressetext:[2]

x
n(x)
NP(x)
1
28
26.02
2
42
44.86
3
31
31.07
4
17
13.47
5
3
5.58

(Dabei ist x: Zahl der Morphe pro Wort, n(x) die in diesem Text beobachtete Zahl der Morphe pro Wort; NP(x) die Zahl der Morphe pro Wort, die berechnet wird, wenn man die Hyperpoisson-Verteilung an die beobachteten Daten anpasst. Ergebnis: die Hyperpoisson-Verteilung ist für diesen Text ein gutes Modell mit dem Testkriterium P = 0.30, wobei P als gut erachtet wird, wenn es größer/ gleich 0.05 ist. Für ausführlichere Erläuterungen sei auf die angegebene Literatur verwiesen.)

Die Morphlängenverteilung dieses Textes ist für das Deutsche recht typisch: am häufigsten sind die Morphe, die aus 2 bzw. 3 Phonemen bestehen; sowohl die ein- als auch die mehrphonemigen sind dagegen fast immer seltener.

Die Untersuchungen zu Morphlängen sind insgesamt gesehen noch nicht sehr zahlreich. [3] Immerhin kann gezeigt werden, dass bei Morphlängen in 42 deutschen Prosatexten die Hyperpoisson-Verteilung ein gutes Modell ist. Bei anderen Sprachen und anderen Textarten sind andere Modelle möglich. Creutz (2003) [4] etwa zeigt, dass im finnischen Wörterbuch verschiedene Verteilungen angewendet werden müssen, je nach dem, ob man Morph-Types oder Morph-Token verwendet. Es spricht damit bisher aber nichts gegen die allgemeine Hypothese, dass sprachliche Einheiten beliebiger Art sich in Texten oder Wörterbüchern gemäß bestimmten Gesetzen verteilen.

Siehe auch

Literatur

  • Karl-Heinz Best: Morphlänge. In: Reinhard Köhler, Gabriel Altmann, & Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik - Quantitative Linguistics. Ein internationales Handbuch. de Gruyter, Berlin/ N.Y. 2005, S. 255-260. ISBN 3-11-015578-8
  • Karl-Heinz Best: Wie viele Morphe enthalten Wörter in deutschen Pressetexten? In: Glottometrics 13, 2006, 47-58.
  • Regina Pustet & Gabriel Altmann: Morpheme Length Distribution in Lakota. In: Journal of Quantitative Linguistics 12, 2005, 53-63.

Weblinks

Wiktionary Wiktionary: Morphlänge – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen

Einzelnachweise

  1. Gejza Wimmer, Gabriel Altmann: The Theory of Word Length Distribution: Some Results and Generalizations. In: Peter Schmidt (Hrsg.): Glottometrika 15. Wissenschaftlicher Verlag Trier, Trier 1996, S. 112-133; Gejza Wimmer, Reinhard Köhler, Rüdiger Grotjahn & Gabriel Altmann: Towards a Theory of Word Length Distribution. In: Journal of Quantitative Linguistics 1, 1994, 98-106
  2. Karl-Heinz Best: Zur Länge von Morphen in deutschen Texten. In: Karl-Heinz Best (Hrsg.): Häufigkeitsverteilungen in Texten (S. 1-14). Göttingen: Peust & Gutschmidt, 2001, S. 9
  3. http://lql.uni-trier.de/index.php/Morph_length
  4. Mathias Creutz: Unsupervised Segmentation of Words Using Prior Distributions of Morph Length and Frequency. In: 41st Annual Meeting of the Association for Computational Linguistics, Proceedings of the Conference. Bd. 3, 2003: 280-287

Wikimedia Foundation.

Игры ⚽ Нужен реферат?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Gesetz der Verteilung von Schriftzeichen verschiedener Komplexität — Das Gesetz der Verteilung von Schriftzeichen verschiedener Komplexität sagt aus, dass Schriftzeichen verschiedener Komplexitätsgrade in Texten gemäß einem theoretisch begründbaren Sprachgesetz verwendet werden. Inhaltsverzeichnis 1 Komplexität… …   Deutsch Wikipedia

  • Gesetz der Verteilung von Wortlängen — Das Gesetz der Verteilung von Wortlängen bedeutet, dass Wörter unterschiedlicher Länge in Texten und/oder in Wörterbüchern nicht chaotisch, sondern gesetzmäßig verteilt sind. Die Wortlänge kann man verschieden definieren; am geläufigsten wird sie …   Deutsch Wikipedia

  • Gesetz der Verteilung von Satzlängen — Das Gesetz der Verteilung von Satzlängen behandelt die Frage, wie oft Sätze verschiedener Komplexität in Texten verwendet werden. Ein besonders einfaches Kriterium für Satzkomplexität ist ihre Länge, die verschieden definiert werden kann: als die …   Deutsch Wikipedia

  • Gesetz der Verteilung rhythmischer Einheiten verschiedener Länge — In der Sprachwissenschaft wird die Länge rhythmischer Einheiten danach bestimmt, wie viele Silben zwischen zwei betonten Silben in einem Satz oder Text vorkommen. Folgen zwei betonte Silben aufeinander, hat man eine rhythmische Einheit der Länge… …   Deutsch Wikipedia

  • Quantitative Linguistik — Die Quantitative Linguistik (auch: Statistische Linguistik; engl. Quantitative Linguistics, Statistical Linguistics) ist eine Disziplin der Mathematischen Linguistik und damit der allgemeinen Linguistik bzw. Sprachwissenschaft insgesamt.… …   Deutsch Wikipedia

  • Morph — Ein Morph ist die kleinste bedeutungstragende Einheit der Sprache auf der Ebene der Parole, die man gewinnt, wenn man Wörter zerlegt, segmentiert. Das bedeutet, dass Wörter in die Bestandteile (Konstituenten) zerlegt werden, die zur Bedeutung des …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”