KSTEM

KSTEM

Der von Robert Krovetz entwickelte KSTEM-Algorithmus basiert auf morphologischen Regeln und einem Stammlexikon, mit dessen Hilfe er versucht, ein fehlerhaftes Stemming zu vermeiden. KSTEM entfernt Suffixe solange von einem Wort, bis es die durch Regeln reduzierte Wortform im Lexikon findet. Nur wenige Suffixe werden entfernt, wenn das neu zu stemmende Wort nicht im Wörterbuch steht. Wortformen, die im Lexikon gefunden werden, werden nicht gestemmt, da man annimmt, dass sie nicht weiter ableitbar sind.

Literatur

  • R. Krovetz: Viewing Morphology as an Inference Process. In: Proceedings of the Sixteenth Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, S. 191–203, 1993 [1]

Wikimedia Foundation.

Игры ⚽ Нужен реферат?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Grundformenreduktion — Als Stemming (Grundformenreduktion, Normalformenreduktion) bezeichnet man im Information Retrieval ein Verfahren, mit dem verschiedene morphologische Varianten eines Wortes auf ihren gemeinsamen Wortstamm zurückgeführt werden, z. B. Wikis auf… …   Deutsch Wikipedia

  • Normalformenreduktion — Als Stemming (Grundformenreduktion, Normalformenreduktion) bezeichnet man im Information Retrieval ein Verfahren, mit dem verschiedene morphologische Varianten eines Wortes auf ihren gemeinsamen Wortstamm zurückgeführt werden, z. B. Wikis auf… …   Deutsch Wikipedia

  • Stammformreduktion — Als Stemming (Grundformenreduktion, Normalformenreduktion) bezeichnet man im Information Retrieval ein Verfahren, mit dem verschiedene morphologische Varianten eines Wortes auf ihren gemeinsamen Wortstamm zurückgeführt werden, z. B. Wikis auf… …   Deutsch Wikipedia

  • Stemming — Als Stemming (Grundformenreduktion, Normalformenreduktion) bezeichnet man im Information Retrieval ein Verfahren, mit dem verschiedene morphologische Varianten eines Wortes auf ihren gemeinsamen Wortstamm zurückgeführt werden, z. B. Wikis… …   Deutsch Wikipedia

  • Stemming — es un método para reducir una palabra a su raíz o (en inglés) a un stem o tema. Hay algunos algoritmos de stemming que ayudan en sistemas de recuperación de información. Stemming aumenta el recall que es una medida sobre el número de documentos… …   Wikipedia Español

  • Стемминг — Стемматизация (стемминг)  это процесс нахождения основы слова для заданного исходного слова. Основа слова необязательно совпадает с морфологическим корнем слова. Алгоритм стемматизации представляет собой давнюю проблему в области… …   Википедия

  • gelekštė — gelẽkštė sf. (2) 1. geležtė: Kriaunos ir gelẽkštė lenktinio peilio VšR. Duokit man peilį su dviem gelẽkštėm Ss. 2. nelenkiamas peilis, geležė: Išgaišo gelẽkštė, nėra kuom blynai verčia Tvr. Kur padėjai gelẽkštę, man reikia duonos atsiriekt… …   Dictionary of the Lithuanian Language

  • makštė — 3 màkštė sf. ppr. pl. (2) žr. makštas 1: Palopyk makštès skūrele, tai ilgiau turės Knv. Su màkštėm po sveklyčią vaikščio[ja], o jau darbelio jokio! Rud …   Dictionary of the Lithuanian Language

  • prapūkštyti — tr. pūsčiojant pravalyti: Mažrimas sutrynė varpą delne, prapūkštęs sužėrė grūdus į burną J.Avyž. | refl. tr.: Sutrynęs rugių varpą prasipūkštyk – pažiūrėk, kaip šįmet grūdai atrodo Jnšk. Su arpu kelius pūrelius prasipūkštėm, vešim malti Jnšk.… …   Dictionary of the Lithuanian Language

  • prisunkstyti — 1. iter. 1 prisunkti 3. | refl. tr.: Vainoras, prisisunkstęs alaus ąsočius, vaišino visus rš. 2. tr. po truputį prisamstyti, semiant nuo dugno: Prisunkstysi padugnių [nuo kibiro dugno semdamas vandenį] Lp. Taip nėra vandenio šulny – led… …   Dictionary of the Lithuanian Language

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”