- Gesetz der Verteilung von Satzlängen
-
Das Gesetz der Verteilung von Satzlängen behandelt die Frage, wie oft Sätze verschiedener Komplexität in Texten verwendet werden. Ein besonders einfaches Kriterium für Satzkomplexität ist ihre Länge, die verschieden definiert werden kann: als die Zahl der Buchstaben, Silben, Wörter, Teilsätze usw. je Satz. Untersucht man nun für Texte, wie häufig Sätze verschiedener Länge in ihnen vorkommen, so kann man feststellen, dass sie von einem Sprachgesetz gesteuert sind. Es handelt sich im Prinzip um das gleiche Sprachgesetz, das auch die Häufigkeitsverteilung der Wortlängen betrifft (Gesetz der Verteilung von Wortlängen; Theorie: Wimmer u.a. [1]).
Inhaltsverzeichnis
Anwendung verschiedener Definitionen für Satzkomplexität
Wilhelm Fucks hat die Satzlänge nach der Zahl der Silben pro Satz bestimmt, die Sätze in Klassen von 1-5, 6-10 Silben undsoweiter eingeteilt und die Polya-Verteilung als ein für den Stil etlicher Autoren geeignetes Modell benannt.[2] Bestimmt man die Satzlänge nach der Zahl der Teilsätze (clauses) je Satz, so kann bei rund 500 deutschen Texten die Hyperpoisson-Verteilung als gutes Modell angesehen werden.[3] Bei anderen Kriterien für die Satzlänge[4], in anderen Sprachen, bei anderen Textsorten etc. sind oft auch andere Modelle geeigneter. Wählt man zum Beispiel als Kriterium für die Satzlänge die Zahl der Wörter je Satz, kommt als Modell für deutsche Texte die negative Binomialverteilung in Frage.[5]
Bestimmt man dagegen die Länge syntaktischer Konstruktionen nach der Zahl ihrer Endknoten, so folgen diese ebenfalls Gesetzen. [6]
Man kann statt der Länge der Sätze auch die Satztiefe als Komplexitätsmaß wählen. Die Satztiefe lässt sich z.B. durch die Menge der Regeln definieren, die in einer generativen Syntax benötigt werden, um einen Satz zu erzeugen; äquivalent: Zahl der Knoten in einem Baumgraphen für einen solchen Satz. Auch in diesem Fall gelten entsprechende Verteilungsgesetze.[7]
Zusammenfassend lässt sich sagen: Die Untersuchungen zu Satzlängen unterstützen bisher die von der Quantitativen Linguistik vertretene Hypothese, dass Sprachsystem und -verwendung sich gemäß bestimmten, theoretisch begründbaren Sprachgesetzen verhalten.
Ein Beispiel
Die folgende Tabelle gibt ein Beispiel für eine Verteilung von Sätzen verschiedener Länge (gemessen als Zahl der clauses) in einem kurzen deutschen Prosatext.[8] Die Beobachtungsdaten sind der Untersuchung von Niehaus (1997) entnommen, die Anpassung der Hyperpoisson-Verteilung wurde neu berechnet. [9]
x n(x) NP(x) 1 73 68.40 2 30 36.44 3 21 19.14 4 9 9.92 5 6 5.07 6 3 2.56 7 1 1.27 8 1 1.20 (Dabei ist x: Zahl der clauses je Satz, beginnend mit x = 1; n(x) ist die in diesem Text beobachtete Zahl der Sätze mit x clauses; NP(x) ist die Zahl der clauses, die berechnet wird, wenn man die Hyperpoisson-Verteilung an die beobachteten Daten anpasst. Ergebnis: Die Hyperpoisson-Verteilung ist für diesen Text ein gutes Modell mit dem Testkriterium P = 0.84, wobei P als gut erachtet wird, wenn es größer oder gleich 0.05 ist. Für ausführlichere Erläuterungen sei auf die angegebene Literatur verwiesen.)
Siehe auch
- Gesetz der Verteilung von Morphlängen
- Gesetz der Verteilung rhythmischer Einheiten verschiedener Länge
- Gesetz der Verteilung von Schriftzeichen verschiedener Komplexität
- Gesetz der Verteilung von Silbenlängen
- Gesetz der Verteilung von Wortlängen
- Quantitative Linguistik
Literatur
- Gabriel Altmann: Verteilungen der Satzlängen. In: Klaus-Peter Schulz (ed.): Glottometrika 9. Brockmeyer, Bochum 1988, S. 147-169.
- Gabriel Altmann: Wiederholungen in Texten. Brockmeyer, Bochum 1988. ISBN 3-88339-663-X.
- Karl-Heinz Best: Satzlängen im Deutschen: Verteilungen, Mittelwerte, Sprachwandel. In: Göttinger Beiträge zur Sprachwissenschaft 7, 2001, 7-31.
- Karl-Heinz Best: Wie viele Wörter enthalten Sätze im Deutschen? Ein Beitrag zu den Sherman-Altmann-Gesetzen. In: Karl-Heinz Best (Hrsg.): Häufigkeitsverteilungen in Texten. Peust & Gutschmidt 2001, S. 167-201. ISBN 3-933043-08-5.
- Karl-Heinz Best: Satzlänge. In: Reinhard Köhler, Gabriel Altmann, & Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik - Quantitative Linguistics. Ein internationales Handbuch. de Gruyter, Berlin/ N.Y. 2005, S. 298-304. ISBN 3-11-015578-8.
- Emmerich Kelih: Untersuchungen zur Satzlänge in russischen und slowenischen Prosatexten. Band 1 & Band 2. Diplomarbeit, Graz 2002.
- Emmerich Kelih, Peter Grzybek: Satzlängen: Definitionen, Häufigkeiten, Modelle. In: A. Mehler (Ed.): Quantitative Methoden in Computerlinguistik und Sprachtechnologie. [= Special Issue of: LDV-Forum. Zeitschrift für Computerlinguistik und Sprachtechnologie // Journal for Computational Linguistics and Language Technology 2004.]
Einzelnachweise
- ↑ Gejza Wimmer, Gabriel Altmann: The Theory of Word Length Distribution: Some Results and Generalizations. In: Peter Schmidt (Hrsg.): Glottometrika 15. Wissenschaftlicher Verlag Trier, Trier 1996, S. 112-133; Gejza Wimmer, Reinhard Köhler, Rüdiger Grotjahn & Gabriel Altmann: Towards a Theory of Word Length Distribution. In: Journal of Quantitative Linguistics 1, 1994, 98-106; http://lql.uni-trier.de/index.php/Sentence_and_clause_length
- ↑ Wilhelm Fucks: Nach allen Regeln der Kunst. Deutsche Verlags-Anstalt, Stuttgart 1968, S. 84-88.
- ↑ Zur Eignung der Hyperpoisson-Verteilung im Vergleich zu anderen Verteilungen bei Anwendung dieses Kriteriums siehe Best 2005, S. 301.
- ↑ Siehe dazu zum Beispiel: Emmerich Kelih, Peter Grzybek: Häufigkeiten von Satzlängen: Zum Faktor der Intervallgröße als Einflussvariable (am Beispiel slowenischer Texte). In: Glottometrics 8, 2004, S. 23-41.
- ↑ Dazu: Best 2001, Wie viele Wörter..., 198f.
- ↑ http://lql.uni-trier.de/index.php/Length_of_syntactic_constructions
- ↑ http://lql.uni-trier.de/index.php/Depth_of_syntactic_constructions
- ↑ Es handelt sich um: G. Prokop: Die Maus im Fenster. In: G. Prokop: Die Maus im Fenster. Gute-Nacht-Geschichten. Zürich/Köln 1982, S. 7-18.
- ↑ Brigitta Niehaus: Untersuchung zur Satzlängenhäufigkeit im Deutschen. In: Karl-Heinz Best (Hrsg.): Glottometrika 16. The Distribution of Word and Sentence Length. Wissenschaftlicher Verlag Trier, Trier 1997, S. 213-275, Daten S. 240. ISBN 3-88476-276-1.
Weblinks
Wiktionary: Satzlänge – Bedeutungserklärungen, Wortherkunft, Synonyme, ÜbersetzungenWiktionary: Satzlängenverteilung – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen
Wikimedia Foundation.