Text Extraction

Text Extraction

Die Text Extraction (auch Keyphrase Extraction) bzw. Textextrahierung ist eine Methode zur automatischen Zusammenfassung eines Textes mit Hilfe computerlinguistischer Techniken. Dabei werden Teile eines Textes - zum Beispiel Sätze oder ganze Abschnitte - mittels statistischer und/oder heuristischer Methoden bezüglich ihrer Wichtigkeit oder Relevanz bewertet. Diese scores of importance dienen als Grundlage für die Entscheidung, welche Teile ("keyphrases") extrahiert und zu einem kürzeren Text zusammengestellt werden, der dann einen Überblick über die Inhalte des Originaltextes bietet und in der Regel als extract oder abstract bezeichnet wird.

Nach Karen Sparck Jones (1999) haben die mit dieser Methode produzierten Zusammenfassungen den Nachteil, dass sie zumeist wenig kohärent und somit nur schlecht lesbar und unter Umständen sogar unverständlich sind. Andererseits ist diese Methode und ihre Varianten vermutlich einfacher in automatischen Systemen zu modellieren. Beispiele dafür sind die Systeme von Luhn (1959) und Edmundson (1969) und die Ansätze von Rath et al. (1961) und Brandow et al. (1995).

Bibliographie

  • Mani, I./Maybury, M. (1999): Advances in Automatic Text Summarization. Massachusetts Institute of Technology
  • Brandow, R./Mitze, K./Rau, L.F. (1995): Automatic condensation of electronic publications by sentence selection.
  • Rath, G. J./Resnick, A./Savage, T.R. (1961): The Formation of Abstracts by the Selection of Sentences.
  • Sparck Jones, K. (1999): Automatic Summarizing: Factors and Directions.
  • In: Mani/Maybury 1999, S. 1-14 (Einleitung)

Wikimedia Foundation.

Игры ⚽ Нужно решить контрольную?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Text-Extraction — Die Text Extraction (auch Keyphrase Extraction) bzw. Textextrahierung ist eine Methode zur automatischen Zusammenfassung eines Textes mit Hilfe computerlinguistischer Techniken. Dabei werden Teile eines Textes zum Beispiel Sätze oder ganze… …   Deutsch Wikipedia

  • text extraction — teksto ištraukimas statusas T sritis informatika apibrėžtis Lokalizavime – teksto ištraukimas iš ↑vykdomojo failo tam, kad jį būtų galima išversti į kitą kalbą nedekompiliavus programos. Tekstas būna įdėtas specialiu formatu. Yra keli skirtingi… …   Enciklopedinis kompiuterijos žodynas

  • Text Mining — Text Mining, seltener auch Textmining, Text Data Mining oder Textual Data Mining, ist ein Bündel von Analyseverfahren, die die algorithmusassistierte Entdeckung von Bedeutungsstrukturen aus un oder schwachstrukturierten Textdaten ermöglichen soll …   Deutsch Wikipedia

  • Text-Extraktion — Die Text Extraction (auch Keyphrase Extraction) bzw. Textextrahierung ist eine Methode zur automatischen Zusammenfassung eines Textes mit Hilfe computerlinguistischer Techniken. Dabei werden Teile eines Textes zum Beispiel Sätze oder ganze… …   Deutsch Wikipedia

  • Text mining — Text mining, sometimes alternately referred to as text data mining , roughly equivalent to text analytics , refers generally to the process of deriving high quality information from text. High quality information is typically derived through the… …   Wikipedia

  • Text analytics — The term text analytics describes a set of linguistic, lexical, pattern recognition,extraction, tagging/structuring, visualization, and predictive techniques. The termalso describes processes that apply these techniques, whether independently or… …   Wikipedia

  • Text mining — Fouille de textes La fouille de textes ou l extraction de connaissances dans les textes est une spécialisation de la fouille de données et fait partie du domaine de l intelligence artificielle. Cette technique est souvent désignée sous l… …   Wikipédia en Français

  • Text-Mining — Der Begriff Text Mining (engl. für „Textschürfen“) bezeichnet die automatisierte Entdeckung relevanter Informationen aus Textdaten. Mit statistischen und linguistischen Mitteln erschließt Text Mining Software aus Texten Informationen, die die… …   Deutsch Wikipedia

  • Extraction de connaissances à partir de bases de données — Exploration de données L’exploration de données, aussi connue sous les noms fouille de données, data mining (forage de données) ou encore Extraction de Connaissances à partir de Données (ECD en français, KDD en Anglais), a pour objet l’extraction …   Wikipédia en Français

  • Extraction de caractéristique en vision par ordinateur — Pour les articles homonymes, voir extraction de caractéristique (homonymie). En vision par ordinateur, l extraction de caractéristiques visuelles (ou visual features extraction en anglais) consiste en des transformations mathématiques calculées… …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”