Gesetz der Verteilung von Satzlängen

Gesetz der Verteilung von Satzlängen

Das Gesetz der Verteilung von Satzlängen behandelt die Frage, wie oft Sätze verschiedener Komplexität in Texten verwendet werden. Ein besonders einfaches Kriterium für Satzkomplexität ist ihre Länge, die verschieden definiert werden kann: als die Zahl der Buchstaben, Silben, Wörter, Teilsätze usw. je Satz. Untersucht man nun für Texte, wie häufig Sätze verschiedener Länge in ihnen vorkommen, so kann man feststellen, dass sie von einem Sprachgesetz gesteuert sind. Es handelt sich im Prinzip um das gleiche Sprachgesetz, das auch die Häufigkeitsverteilung der Wortlängen betrifft (Gesetz der Verteilung von Wortlängen; Theorie: Wimmer u.a. [1]).

Inhaltsverzeichnis

Anwendung verschiedener Definitionen für Satzkomplexität

Wilhelm Fucks hat die Satzlänge nach der Zahl der Silben pro Satz bestimmt, die Sätze in Klassen von 1-5, 6-10 Silben undsoweiter eingeteilt und die Polya-Verteilung als ein für den Stil etlicher Autoren geeignetes Modell benannt.[2] Bestimmt man die Satzlänge nach der Zahl der Teilsätze (clauses) je Satz, so kann bei rund 500 deutschen Texten die Hyperpoisson-Verteilung als gutes Modell angesehen werden.[3] Bei anderen Kriterien für die Satzlänge[4], in anderen Sprachen, bei anderen Textsorten etc. sind oft auch andere Modelle geeigneter. Wählt man zum Beispiel als Kriterium für die Satzlänge die Zahl der Wörter je Satz, kommt als Modell für deutsche Texte die negative Binomialverteilung in Frage.[5]

Bestimmt man dagegen die Länge syntaktischer Konstruktionen nach der Zahl ihrer Endknoten, so folgen diese ebenfalls Gesetzen. [6]

Man kann statt der Länge der Sätze auch die Satztiefe als Komplexitätsmaß wählen. Die Satztiefe lässt sich z.B. durch die Menge der Regeln definieren, die in einer generativen Syntax benötigt werden, um einen Satz zu erzeugen; äquivalent: Zahl der Knoten in einem Baumgraphen für einen solchen Satz. Auch in diesem Fall gelten entsprechende Verteilungsgesetze.[7]

Zusammenfassend lässt sich sagen: Die Untersuchungen zu Satzlängen unterstützen bisher die von der Quantitativen Linguistik vertretene Hypothese, dass Sprachsystem und -verwendung sich gemäß bestimmten, theoretisch begründbaren Sprachgesetzen verhalten.

Ein Beispiel

Die folgende Tabelle gibt ein Beispiel für eine Verteilung von Sätzen verschiedener Länge (gemessen als Zahl der clauses) in einem kurzen deutschen Prosatext.[8] Die Beobachtungsdaten sind der Untersuchung von Niehaus (1997) entnommen, die Anpassung der Hyperpoisson-Verteilung wurde neu berechnet. [9]

x
n(x)
NP(x)
1
73
68.40
2
30
36.44
3
21
19.14
4
9
9.92
5
6
5.07
6
3
2.56
7
1
1.27
8
1
1.20


(Dabei ist x: Zahl der clauses je Satz, beginnend mit x = 1; n(x) ist die in diesem Text beobachtete Zahl der Sätze mit x clauses; NP(x) ist die Zahl der clauses, die berechnet wird, wenn man die Hyperpoisson-Verteilung an die beobachteten Daten anpasst. Ergebnis: Die Hyperpoisson-Verteilung ist für diesen Text ein gutes Modell mit dem Testkriterium P = 0.84, wobei P als gut erachtet wird, wenn es größer oder gleich 0.05 ist. Für ausführlichere Erläuterungen sei auf die angegebene Literatur verwiesen.)

Siehe auch

Literatur

  • Gabriel Altmann: Verteilungen der Satzlängen. In: Klaus-Peter Schulz (ed.): Glottometrika 9. Brockmeyer, Bochum 1988, S. 147-169.
  • Gabriel Altmann: Wiederholungen in Texten. Brockmeyer, Bochum 1988. ISBN 3-88339-663-X.
  • Karl-Heinz Best: Satzlängen im Deutschen: Verteilungen, Mittelwerte, Sprachwandel. In: Göttinger Beiträge zur Sprachwissenschaft 7, 2001, 7-31.
  • Karl-Heinz Best: Wie viele Wörter enthalten Sätze im Deutschen? Ein Beitrag zu den Sherman-Altmann-Gesetzen. In: Karl-Heinz Best (Hrsg.): Häufigkeitsverteilungen in Texten. Peust & Gutschmidt 2001, S. 167-201. ISBN 3-933043-08-5.
  • Karl-Heinz Best: Satzlänge. In: Reinhard Köhler, Gabriel Altmann, & Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik - Quantitative Linguistics. Ein internationales Handbuch. de Gruyter, Berlin/ N.Y. 2005, S. 298-304. ISBN 3-11-015578-8.
  • Emmerich Kelih: Untersuchungen zur Satzlänge in russischen und slowenischen Prosatexten. Band 1 & Band 2. Diplomarbeit, Graz 2002.
  • Emmerich Kelih, Peter Grzybek: Satzlängen: Definitionen, Häufigkeiten, Modelle. In: A. Mehler (Ed.): Quantitative Methoden in Computerlinguistik und Sprachtechnologie. [= Special Issue of: LDV-Forum. Zeitschrift für Computerlinguistik und Sprachtechnologie // Journal for Computational Linguistics and Language Technology 2004.]

Einzelnachweise

  1. Gejza Wimmer, Gabriel Altmann: The Theory of Word Length Distribution: Some Results and Generalizations. In: Peter Schmidt (Hrsg.): Glottometrika 15. Wissenschaftlicher Verlag Trier, Trier 1996, S. 112-133; Gejza Wimmer, Reinhard Köhler, Rüdiger Grotjahn & Gabriel Altmann: Towards a Theory of Word Length Distribution. In: Journal of Quantitative Linguistics 1, 1994, 98-106; http://lql.uni-trier.de/index.php/Sentence_and_clause_length
  2. Wilhelm Fucks: Nach allen Regeln der Kunst. Deutsche Verlags-Anstalt, Stuttgart 1968, S. 84-88.
  3. Zur Eignung der Hyperpoisson-Verteilung im Vergleich zu anderen Verteilungen bei Anwendung dieses Kriteriums siehe Best 2005, S. 301.
  4. Siehe dazu zum Beispiel: Emmerich Kelih, Peter Grzybek: Häufigkeiten von Satzlängen: Zum Faktor der Intervallgröße als Einflussvariable (am Beispiel slowenischer Texte). In: Glottometrics 8, 2004, S. 23-41.
  5. Dazu: Best 2001, Wie viele Wörter..., 198f.
  6. http://lql.uni-trier.de/index.php/Length_of_syntactic_constructions
  7. http://lql.uni-trier.de/index.php/Depth_of_syntactic_constructions
  8. Es handelt sich um: G. Prokop: Die Maus im Fenster. In: G. Prokop: Die Maus im Fenster. Gute-Nacht-Geschichten. Zürich/Köln 1982, S. 7-18.
  9. Brigitta Niehaus: Untersuchung zur Satzlängenhäufigkeit im Deutschen. In: Karl-Heinz Best (Hrsg.): Glottometrika 16. The Distribution of Word and Sentence Length. Wissenschaftlicher Verlag Trier, Trier 1997, S. 213-275, Daten S. 240. ISBN 3-88476-276-1.

Weblinks

Wiktionary Wiktionary: Satzlänge – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen
Wiktionary Wiktionary: Satzlängenverteilung – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen

Wikimedia Foundation.

Игры ⚽ Нужен реферат?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Gesetz der Verteilung von Schriftzeichen verschiedener Komplexität — Das Gesetz der Verteilung von Schriftzeichen verschiedener Komplexität sagt aus, dass Schriftzeichen verschiedener Komplexitätsgrade in Texten gemäß einem theoretisch begründbaren Sprachgesetz verwendet werden. Inhaltsverzeichnis 1 Komplexität… …   Deutsch Wikipedia

  • Gesetz der Verteilung von Wortlängen — Das Gesetz der Verteilung von Wortlängen bedeutet, dass Wörter unterschiedlicher Länge in Texten und/oder in Wörterbüchern nicht chaotisch, sondern gesetzmäßig verteilt sind. Die Wortlänge kann man verschieden definieren; am geläufigsten wird sie …   Deutsch Wikipedia

  • Gesetz der Verteilung von Morphlängen — Die Länge eines Morphs kann verschieden definiert werden: als die Zahl der Buchstaben, Laute oder Phoneme. Untersucht man nun für eine Reihe von Texten, wie häufig Morphe verschiedener Länge in ihnen vorkommen, so kann man feststellen, dass sie… …   Deutsch Wikipedia

  • Gesetz der Verteilung rhythmischer Einheiten verschiedener Länge — In der Sprachwissenschaft wird die Länge rhythmischer Einheiten danach bestimmt, wie viele Silben zwischen zwei betonten Silben in einem Satz oder Text vorkommen. Folgen zwei betonte Silben aufeinander, hat man eine rhythmische Einheit der Länge… …   Deutsch Wikipedia

  • Satzlänge — wird danach bestimmt, aus wie vielen kleineren Einheiten ein Satz besteht. So ist es möglich, die Satzlänge entsprechend der Zahl der Buchstaben oder auch anderer Schriftzeichen (etwa im Chinesischen), Laute, Phoneme, Morphe, Silben, Moren,… …   Deutsch Wikipedia

  • Quantitative Linguistik — Die Quantitative Linguistik (auch: Statistische Linguistik; engl. Quantitative Linguistics, Statistical Linguistics) ist eine Disziplin der Mathematischen Linguistik und damit der allgemeinen Linguistik bzw. Sprachwissenschaft insgesamt.… …   Deutsch Wikipedia

  • Wortlänge — wird danach bestimmt, aus wie vielen kleineren Einheiten ein Wort besteht. So ist es möglich, die Wortlänge entsprechend der Zahl der Buchstaben, Laute, Phoneme, Morphe, Silben oder Moren zu definieren. Eine weitere Möglichkeit besteht darin, die …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”