Text-Extraction

Text-Extraction: Die Text-Extraction (auch Keyphrase Extraction) bzw. Textextrahierung ist eine Methode zur automatischen Zusammenfassung eines Textes mit Hilfe computerlinguistischer Techniken. Dabei werden Teile eines Textes - zum Beispiel Sätze oder ganze Abschnitte - mittels statistischer und/oder heuristischer Methoden bezüglich ihrer Wichtigkeit oder Relevanz bewertet. Diese scores of importance dienen als Grundlage für die Entscheidung, welche Teile ("keyphrases") extrahiert und zu einem kürzeren Text zusammengestellt werden, der dann einen Überblick über die Inhalte des Originaltextes bietet und in der Regel als extract oder abstract bezeichnet wird.

Nach Karen Spärck Jones (1999) haben die mit dieser Methode produzierten Zusammenfassungen den Nachteil, dass sie zumeist wenig kohärent und somit nur schlecht lesbar und unter Umständen sogar unverständlich sind. Andererseits ist diese Methode und ihre Varianten vermutlich einfacher in automatischen Systemen zu modellieren. Beispiele dafür sind die Systeme von Luhn (1959) und Edmundson (1969) und die Ansätze von Rath et al. (1961) und Brandow et al. (1995).

Bibliographie

Mani, I./Maybury, M. (1999): Advances in Automatic Text Summarization. Massachusetts Institute of Technology

Brandow, R./Mitze, K./Rau, L.F. (1995): Automatic condensation of electronic publications by sentence selection.

Rath, G. J./Resnick, A./Savage, T.R. (1961): The Formation of Abstracts by the Selection of Sentences.

Sparck Jones, K. (1999): Automatic Summarizing: Factors and Directions.

In: Mani/Maybury 1999, S. 1-14 (Einleitung)

Kategorien:
Dokumentation
Computerlinguistik

Игры ⚽ Поможем написать курсовую

Schlagen Sie auch in anderen Wörterbüchern nach:

Text Extraction — Die Text Extraction (auch Keyphrase Extraction) bzw. Textextrahierung ist eine Methode zur automatischen Zusammenfassung eines Textes mit Hilfe computerlinguistischer Techniken. Dabei werden Teile eines Textes zum Beispiel Sätze oder ganze… … Deutsch Wikipedia
text extraction — teksto ištraukimas statusas T sritis informatika apibrėžtis Lokalizavime – teksto ištraukimas iš ↑vykdomojo failo tam, kad jį būtų galima išversti į kitą kalbą nedekompiliavus programos. Tekstas būna įdėtas specialiu formatu. Yra keli skirtingi… … Enciklopedinis kompiuterijos žodynas
Text Mining — Text Mining, seltener auch Textmining, Text Data Mining oder Textual Data Mining, ist ein Bündel von Analyseverfahren, die die algorithmusassistierte Entdeckung von Bedeutungsstrukturen aus un oder schwachstrukturierten Textdaten ermöglichen soll … Deutsch Wikipedia
Text-Extraktion — Die Text Extraction (auch Keyphrase Extraction) bzw. Textextrahierung ist eine Methode zur automatischen Zusammenfassung eines Textes mit Hilfe computerlinguistischer Techniken. Dabei werden Teile eines Textes zum Beispiel Sätze oder ganze… … Deutsch Wikipedia
Text mining — Text mining, sometimes alternately referred to as text data mining , roughly equivalent to text analytics , refers generally to the process of deriving high quality information from text. High quality information is typically derived through the… … Wikipedia
Text analytics — The term text analytics describes a set of linguistic, lexical, pattern recognition,extraction, tagging/structuring, visualization, and predictive techniques. The termalso describes processes that apply these techniques, whether independently or… … Wikipedia
Text mining — Fouille de textes La fouille de textes ou l extraction de connaissances dans les textes est une spécialisation de la fouille de données et fait partie du domaine de l intelligence artificielle. Cette technique est souvent désignée sous l… … Wikipédia en Français
Text-Mining — Der Begriff Text Mining (engl. für „Textschürfen“) bezeichnet die automatisierte Entdeckung relevanter Informationen aus Textdaten. Mit statistischen und linguistischen Mitteln erschließt Text Mining Software aus Texten Informationen, die die… … Deutsch Wikipedia
Extraction de connaissances à partir de bases de données — Exploration de données L’exploration de données, aussi connue sous les noms fouille de données, data mining (forage de données) ou encore Extraction de Connaissances à partir de Données (ECD en français, KDD en Anglais), a pour objet l’extraction … Wikipédia en Français
Extraction de caractéristique en vision par ordinateur — Pour les articles homonymes, voir extraction de caractéristique (homonymie). En vision par ordinateur, l extraction de caractéristiques visuelles (ou visual features extraction en anglais) consiste en des transformations mathématiques calculées… … Wikipédia en Français

Academic dictionaries and encyclopedias

Text-Extraction

Bibliographie

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Academic dictionaries and encyclopedias

Deutsch Wikipedia

Text-Extraction

Bibliographie

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Direct link