Text-Extraktion

Text-Extraktion

Die Text Extraction (auch Keyphrase Extraction) bzw. Textextrahierung ist eine Methode zur automatischen Zusammenfassung eines Textes mit Hilfe computerlinguistischer Techniken. Dabei werden Teile eines Textes - zum Beispiel Sätze oder ganze Abschnitte - mittels statistischer und/oder heuristischer Methoden bezüglich ihrer Wichtigkeit oder Relevanz bewertet. Diese scores of importance dienen als Grundlage für die Entscheidung, welche Teile ("keyphrases") extrahiert und zu einem kürzeren Text zusammengestellt werden, der dann einen Überblick über die Inhalte des Originaltextes bietet und in der Regel als extract oder abstract bezeichnet wird.

Nach Karen Sparck Jones (1999) haben die mit dieser Methode produzierten Zusammenfassungen den Nachteil, dass sie zumeist wenig kohärent und somit nur schlecht lesbar und unter Umständen sogar unverständlich sind. Andererseits ist diese Methode und ihre Varianten vermutlich einfacher in automatischen Systemen zu modellieren. Beispiele dafür sind die Systeme von Luhn (1959) und Edmundson (1969) und die Ansätze von Rath et al. (1961) und Brandow et al. (1995).

Bibliographie

  • Mani, I./Maybury, M. (1999): Advances in Automatic Text Summarization. Massachusetts Institute of Technology
  • Brandow, R./Mitze, K./Rau, L.F. (1995): Automatic condensation of electronic publications by sentence selection.
  • Rath, G. J./Resnick, A./Savage, T.R. (1961): The Formation of Abstracts by the Selection of Sentences.
  • Sparck Jones, K. (1999): Automatic Summarizing: Factors and Directions.
  • In: Mani/Maybury 1999, S. 1-14 (Einleitung)

Wikimedia Foundation.

Игры ⚽ Поможем решить контрольную работу

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Text Mining — Text Mining, seltener auch Textmining, Text Data Mining oder Textual Data Mining, ist ein Bündel von Analyseverfahren, die die algorithmusassistierte Entdeckung von Bedeutungsstrukturen aus un oder schwachstrukturierten Textdaten ermöglichen soll …   Deutsch Wikipedia

  • Google Scholar — Logo Google Scholar ist ein Suchdienst des Unternehmens Google Inc. und dient der allgemeinen Literaturrecherche wissenschaftlicher Dokumente. Dazu zählen sowohl kostenlose Dokumente aus dem freien Internet als auch kostenpflichtige Angebote.… …   Deutsch Wikipedia

  • Faservolumenanteil — Der Faservolumenanteil, oder Faservolumengehalt, ist das Verhältnis des Volumens der Fasern zum Gesamtvolumen eines faserverstärkten Materials. Er wird mit φ abgekürzt. Der Faservolumenanteil berechnet sich analog dem Volumenanteil einer… …   Deutsch Wikipedia

  • Faservolumengehalt — Der Faservolumenanteil, oder Faservolumengehalt, ist das Verhältnis des Volumens der Fasern zum Gesamtvolumen eines faserverstärkten Materials. Er wird mit abgekürzt. Der Faservolumenanteil berechnet sich analog dem Volumenanteil einer… …   Deutsch Wikipedia

  • Data Mining — Unter Data Mining (englisch für „Datenschürfen“) versteht man die systematische Anwendung von Methoden, die meist statistisch mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung. Hierbei geht es vor allem um das… …   Deutsch Wikipedia

  • Data mining — Unter Data Mining (englisch für „Datenschürfen“) versteht man die systematische Anwendung von Methoden, die meist statistisch mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung. Hierbei geht es vor allem um das… …   Deutsch Wikipedia

  • Dataminer — Unter Data Mining (englisch für „Datenschürfen“) versteht man die systematische Anwendung von Methoden, die meist statistisch mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung. Hierbei geht es vor allem um das… …   Deutsch Wikipedia

  • Datamining — Unter Data Mining (englisch für „Datenschürfen“) versteht man die systematische Anwendung von Methoden, die meist statistisch mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung. Hierbei geht es vor allem um das… …   Deutsch Wikipedia

  • Datenschürfung — Unter Data Mining (englisch für „Datenschürfen“) versteht man die systematische Anwendung von Methoden, die meist statistisch mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung. Hierbei geht es vor allem um das… …   Deutsch Wikipedia

  • Matchplus — Unter Data Mining (englisch für „Datenschürfen“) versteht man die systematische Anwendung von Methoden, die meist statistisch mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung. Hierbei geht es vor allem um das… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”