- Gesetz der Verteilung von Morphlängen
-
Die Länge eines Morphs kann verschieden definiert werden: als die Zahl der Buchstaben, Laute oder Phoneme. Untersucht man nun für eine Reihe von Texten, wie häufig Morphe verschiedener Länge in ihnen vorkommen, so kann man feststellen, dass sie von einem Sprachgesetz gesteuert sind. Untersuchungen zu Lexika stehen noch aus; es ist aber damit zu rechnen, dass bei Texten und Lexika unterschiedliche Verteilungen das Vorkommen der Morphe repräsentieren werden. Es handelt sich im Prinzip um das gleiche Sprachgesetz, das die Quantitative Linguistik besonders für die Häufigkeitsverteilung der Wortlängen entwickelt hat (Gesetz der Verteilung von Wortlängen; Theorie: Wimmer u.a.).[1]
Inhaltsverzeichnis
Beispiel
Ein Beispiel für eine Morphlängenverteilung (gemessen als Zahl der Phoneme pro Morph) in einem kurzen Pressetext:[2]
x n(x) NP(x) 1 28 26.02 2 42 44.86 3 31 31.07 4 17 13.47 5 3 5.58 (Dabei ist x: Zahl der Morphe pro Wort, n(x) die in diesem Text beobachtete Zahl der Morphe pro Wort; NP(x) die Zahl der Morphe pro Wort, die berechnet wird, wenn man die Hyperpoisson-Verteilung an die beobachteten Daten anpasst. Ergebnis: die Hyperpoisson-Verteilung ist für diesen Text ein gutes Modell mit dem Testkriterium P = 0.30, wobei P als gut erachtet wird, wenn es größer/ gleich 0.05 ist. Für ausführlichere Erläuterungen sei auf die angegebene Literatur verwiesen.)
Die Morphlängenverteilung dieses Textes ist für das Deutsche recht typisch: am häufigsten sind die Morphe, die aus 2 bzw. 3 Phonemen bestehen; sowohl die ein- als auch die mehrphonemigen sind dagegen fast immer seltener.
Die Untersuchungen zu Morphlängen sind insgesamt gesehen noch nicht sehr zahlreich. [3] Immerhin kann gezeigt werden, dass bei Morphlängen in 42 deutschen Prosatexten die Hyperpoisson-Verteilung ein gutes Modell ist. Bei anderen Sprachen und anderen Textarten sind andere Modelle möglich. Creutz (2003) [4] etwa zeigt, dass im finnischen Wörterbuch verschiedene Verteilungen angewendet werden müssen, je nach dem, ob man Morph-Types oder Morph-Token verwendet. Es spricht damit bisher aber nichts gegen die allgemeine Hypothese, dass sprachliche Einheiten beliebiger Art sich in Texten oder Wörterbüchern gemäß bestimmten Gesetzen verteilen.
Siehe auch
- Gesetz der Verteilung rhythmischer Einheiten verschiedener Länge;
- Gesetz der Verteilung von Satzlängen;
- Gesetz der Verteilung von Silbenlängen;
- Gesetz der Verteilung von Wortlängen.
Literatur
- Karl-Heinz Best: Morphlänge. In: Reinhard Köhler, Gabriel Altmann, & Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik - Quantitative Linguistics. Ein internationales Handbuch. de Gruyter, Berlin/ N.Y. 2005, S. 255-260. ISBN 3-11-015578-8
- Karl-Heinz Best: Wie viele Morphe enthalten Wörter in deutschen Pressetexten? In: Glottometrics 13, 2006, 47-58.
- Regina Pustet & Gabriel Altmann: Morpheme Length Distribution in Lakota. In: Journal of Quantitative Linguistics 12, 2005, 53-63.
Weblinks
Wiktionary: Morphlänge – Bedeutungserklärungen, Wortherkunft, Synonyme, ÜbersetzungenEinzelnachweise
- ↑ Gejza Wimmer, Gabriel Altmann: The Theory of Word Length Distribution: Some Results and Generalizations. In: Peter Schmidt (Hrsg.): Glottometrika 15. Wissenschaftlicher Verlag Trier, Trier 1996, S. 112-133; Gejza Wimmer, Reinhard Köhler, Rüdiger Grotjahn & Gabriel Altmann: Towards a Theory of Word Length Distribution. In: Journal of Quantitative Linguistics 1, 1994, 98-106
- ↑ Karl-Heinz Best: Zur Länge von Morphen in deutschen Texten. In: Karl-Heinz Best (Hrsg.): Häufigkeitsverteilungen in Texten (S. 1-14). Göttingen: Peust & Gutschmidt, 2001, S. 9
- ↑ http://lql.uni-trier.de/index.php/Morph_length
- ↑ Mathias Creutz: Unsupervised Segmentation of Words Using Prior Distributions of Morph Length and Frequency. In: 41st Annual Meeting of the Association for Computational Linguistics, Proceedings of the Conference. Bd. 3, 2003: 280-287
Kategorien:- Linguistische Morphologie
- Quantitative Linguistik
Wikimedia Foundation.