Lemma (Lexikografie)

Lemma (Lexikografie)

Das Lemma (griechisch λῆμμα, lēmma, „Annahme“) ist in der Lexikografie und Linguistik die Grundform eines Wortes, also die Wortform, unter der man es in einem Nachschlagewerk sucht (Zitierform, Grundform). Die korrekten Pluralformen lauten Lemmata und Lemmas.[1]

Inhaltsverzeichnis

Lemma, Lexem und Zitierform

Das Lemma ist der Eintrag oder das Stichwort in einem Wörterbuch (Lexikon, Enzyklopädie).[2] Man bezeichnet es sowohl als Grundform eines Wortes als auch als Zitier- oder Grundform eines Lexems.[3][4] Der Vorgang zur Bestimmung der genaueren Lemmata wird als Lemmaselektion oder auch Lemmatisierung bezeichnet.

Ein Lexem – eine sprachliche Grundform – könnte im Prinzip auf beliebige Weise benannt werden, da es als sprachliche Einheit über verschiedene Formen abstrahiert, aber selbst keine Form besitzt, die es gegenüber diesen anderen Formen auszeichnet. Üblicherweise werden Lexeme nach einer konventionell bestimmten Form benannt, die dann Zitierform (auch: Grundform, Stichwort) dieses Lexems heißt:

  • Im Deutschen ist die Zitierform für Nomen normalerweise der Nominativ Singular (z. B. Traum), für Verben der Infinitiv Präsens Aktiv (z. B. träumen).
  • Im Lateinischen ist die Zitierform für Verben das Paradigma (~Beispiel), das eine Reihenfolge bestimmter Modi (Infinitiv, Indikativ, Konjunktiv) und Tempora (Präsens, Perfekt…) angibt, die vor allem bei unregelmäßigen Verben sehr hilfreich ist. Diese Reihenfolge lautet in den meisten Wörterbüchern: 1. Person Singular Indikativ Präsens Aktiv, 1. Person Singular Indikativ Perfekt Aktiv, aktives Supinum I bzw. Partizip Perfekt Passiv (PPP) Neutrum und schließlich Infinitiv Präsens Aktiv (z. B. für „bringen/(er)tragen“ lautet das Paradigma: fero, tuli, latum, ferre).

Am Wort orientierte linguistische Nachschlagewerke (Lexika, Thesauri, etymologische Werke) verwenden als Lemma alle Lexeme, während Nachschlagewerke, die mehr an begrifflicher Lemmaselektierung interessiert sind (Sachwörterbücher, Fachglossare, Enzyklopädien und ähnliches) als Zitierform – insbesondere im Deutschen – das einfachste Substantiv bevorzugen: So fasst man etwa „der Traum“ mit dem Verb „träumen“ bzw. dessen Substantivierungen „das Träumen“ und „das Geträumte“ unter einem gemeinsamen Lemma zusammen, insofern sie denselben Sachverhalt beschreiben. Hier wird meist vom Lemma als einem Deskriptor gesprochen.

Dass die Wahl der Zitierform vom lexikologischen Typ des Nachschlagewerks abhängig ist, zeigt folgendes Beispiel:

  • Das Wort „Mäuse“ wird unter dem Lemma Maus eingeordnet.
    Diese Vorgehensweise wählt ein Wörterbuch, da „Maus“ lexikalische Zitierform des Plurals „Mäuse“ ist.
  • Das Wort „Maus“ wird unter dem Lemma Mäuse eingeordnet.
    Das Lemma kann einen Überbegriff für verwandte Themen darstellen: Hier ist die zoologische Gattung der Mäuse Überbegriff des umgangssprachlichen „Maus“, die taxonomische Zitierform wird höher bewertet als die der Umgangssprache („Alles, was in etwa wie eine Maus aussieht, ist eine Maus“). Dafür wird die „Maus“ als Eingabegerät eines Computers als eigenständiges Lemma geführt.

Lemmatisierung

Die lexikographische Reduktion der Flexionsformen eines Wortes auf eine Grundform, also die Festlegung der Grundform eines Lexems und die Anordnung der Lemmata wird auch Lemmatisierung genannt. Eine Teilmenge unmittelbar aufeinander folgender Lemmata bildet eine Lemmastrecke.

Unter Lemmatisierung wird außerdem die Zuordnung (oder auch Rückführung) einer Vollform zum entsprechenden Lemma verstanden. Dieser Vorgang ist je nach Anwendung in der Sprachtechnologie von Bedeutung. Beim Einsatz von statistischen Modellen etwa eignet sich die Lemmatisierung eines sehr kleinen Textkorpus’ manchmal dazu, die Frequenz einzelner Lexeme zu erhöhen und dadurch das statistische Rauschen zu verringern. Die Vollformen des Korpus werden dabei durch ihr Lemma ersetzt, bevor die statistische Auswertung gemacht wird. Gab es vorher beispielsweise die Wortformen „traf“, „treffe“, „trifft“ und „treffen“ jeweils ein Mal im Korpus, so gibt es nach der Lemmatisierung nur noch das Lemma „treffen“ – allerdings mit einer Frequenz von vier. Das Lexem „treffen“ hat damit ein potenziell viel höheres Gewicht im Korpus, als es die einzelnen Vollformen vor der Lemmatisierung hatten.

Lemmaselektion

Vor der Lemmatisierung wird eine Lemmaselektion durchgeführt, bei der entschieden wird, welche Arten von Lemmata in das Lexikon aufgenommen werden. Die Lemmaselektion ist notwendig, da eine vollständige Lemmatisierung aller Wörter, Wortteile und Wortgruppen einer Sprache mühsam ist. Ein Kriterium für die Aufnahme eines Lemma in ein Lexikon ist die Zeitspanne, in der der Begriff in der jeweiligen Sprache existiert.

Eng verbunden ist die Lemmaselektierung mit der Verschlagwortung der herangezogenen Texte – die sich bei gesamtsprachlichen Werken erübrigt, weil der vollständige Sprachschatz erschlossen werden soll, bei fach- und anderen gruppensprachlichen Lexika aber durchaus relevant ist, und mit der Frage nach Synonymie, Homonymie und den Polysemen.

Siehe auch

Literatur

  • Patrick Brandt, Rolf-Albert Dietrich, Georg Schön: Sprachwissenschaft: ein roter Faden für das Studium der deutschen Sprache (= UTB 8331). Köln, Weimar, Wien: Böhlau, 2. Aufl. 2006. ISBN 978-3-8252-8331-5.
  • Winfried Ulrich: Linguistische Grundbegriffe. Berlin, Stuttgart: Borntraeger, 5. Aufl. 2002. ISBN 3-443-03111-0.

Weblinks

Quellen

  1. http://www.duden-suche.de/suche/abstract.php?shortname=fx&artikel_id=98767&verweis=1
  2. Brandt, Dietrich, Schön: Sprachwissenschaft. 2. Aufl. 2006, S. 151
  3. Eintrag Lemma, Lemmatisierung. In: Glück: Metzler-Lexikon Sprache, 3. Aufl. 2005
  4. Eintrag Lemma. In: Ulrich: Linguistische Grundbegriffe, 5. Aufl. 2002

Wikimedia Foundation.

Игры ⚽ Поможем решить контрольную работу

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Lemma — (Neutrum, gr. λῆμμα: „Aufgenommenes, Aufgegriffenes“; Plural: Lemmata) bedeutet: Lemma (Lexikografie), in Lexikografie und Linguistik die Grundform eines Schlagwortes (= Stichwortes) Lemma (Edition), in der Editionswissenschaft das Wort, auf …   Deutsch Wikipedia

  • Lemma (Lexikographie) — Das Lemma (von griechisch λῆμμα lēmma, Gen. „Lemmas“, Pl. „Lemmata“) ist in der Lexikografie und Linguistik die Grundform eines Wortes, also die Wortform, unter der man es in einem Nachschlagewerk sucht (Zitierform, Grundform). Der Vorgang zur… …   Deutsch Wikipedia

  • Mesostruktur (Lexikografie) — Als Mesostruktur bezeichnet man in einem Wörterbuch eine Struktur, welche die Verbindung zwischen einzelnen Einträgen und anderen Einheiten des Lexikons im Rahmen seiner Mikrostruktur beschreibt. Diese können z. B. ein Abkürzungsverzeichnis… …   Deutsch Wikipedia

  • Mikrostruktur (Lexikografie) — Als Mikrostruktur bezeichnet man in der Lexikografie und Enzyklopädik bei einem Wörterbuch oder vergleichbarem Nachschlagewerk die linear geordnete Menge der Angaben, die auf das Lemma folgen. Der Hauptteil ist der Bedeutungsteil mit Definitionen …   Deutsch Wikipedia

  • Makrostruktur (Lexikografie) — Als Makrostruktur bezeichnet man bei Wörterbüchern die systematisch geordnete Folge von Wörterbucheinträgen (Lemmata), über die die vermittelte Information zugänglich ist. Das Lemma repräsentiert das Lexem, zu dem Sprach oder Sachinformationen… …   Deutsch Wikipedia

  • Lemmata — Lemma (Neutrum, griech. λῆμμα „Aufgenommenes“, „Aufgegriffenes“; Plural: Lemmata, Lemmas) bedeutet: Lemma (Lexikografie), in Lexikografie und Linguistik die Grundform eines Schlagwortes (= Stichwortes). Lemma (Edition), in der… …   Deutsch Wikipedia

  • Diktionär — Ein Wörterbuch ist ein Nachschlagewerk, das Wörter oder andere sprachliche Einheiten in einer Liste verzeichnet, meist in alphabetischer Sortierung, und jedem Eintrag (Lemma) erklärende Informationen oder sprachliche Äquivalente zuordnet. Ein… …   Deutsch Wikipedia

  • Fachenzyklopädie — Ein Wörterbuch ist ein Nachschlagewerk, das Wörter oder andere sprachliche Einheiten in einer Liste verzeichnet, meist in alphabetischer Sortierung, und jedem Eintrag (Lemma) erklärende Informationen oder sprachliche Äquivalente zuordnet. Ein… …   Deutsch Wikipedia

  • Sprachwörterbuch — Ein Wörterbuch ist ein Nachschlagewerk, das Wörter oder andere sprachliche Einheiten in einer Liste verzeichnet, meist in alphabetischer Sortierung, und jedem Eintrag (Lemma) erklärende Informationen oder sprachliche Äquivalente zuordnet. Ein… …   Deutsch Wikipedia

  • Universalwörterbuch — Ein Wörterbuch ist ein Nachschlagewerk, das Wörter oder andere sprachliche Einheiten in einer Liste verzeichnet, meist in alphabetischer Sortierung, und jedem Eintrag (Lemma) erklärende Informationen oder sprachliche Äquivalente zuordnet. Ein… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”