Themenentdeckung und -verfolgung

Themenentdeckung und -verfolgung

Das Forschungsfeld der Themenentdeckung und -verfolgung [1] (Topic Detection and Tracking , TDT; auch event-based information organization) befasst sich mit der Entwicklung von Technologien, die es ermöglichen, Nachrichten aus dem Fernsehen, dem Internet oder Radio zu erfassen und diese dann in einzelne Meldungen zu trennen und in bestimmte Themengebiete oder ein Themengebiet einzuordnen. Sie finden zum Beispiel beim Nachrichtendienst Google News Anwendung.

Die Forschung wurde von der DARPA mit dem Ziel vorangetrieben, Nachrichtenanalysten den Umgang mit der wachsenden Informationsflut zu erleichtern.

Im Gegensatz zur traditionellen Aufgabe des Information Retrieval wird kein eindeutiger Informationsbedarf eines Suchenden vorausgesetzt, sondern das Erkennen neuer Themen angestrebt.

Das Problem wird in fünf Aufgaben unterteilt[2]

  1. Segmentierung: Trennung von Texten in einzelne Meldungen
  2. Themenentdeckung: Identifizierung neuer Themengebiete und Gruppierung der Meldungen nach Themengebiet
  3. Cluster-Erkennung: Einteilung eingehender Meldungen nach Themengebieten
  4. Themenverfolgung: Finden weiterer Meldungen zu einem Themengebiet
  5. Link-Erkennung: Bestimmung, ob zwei zufällig gewählte Meldungen sich mit einem gemeinsamen Themengebiet befassen

Zur Bewältigung der Aufgaben werden Techniken des Information Retrieval, des Text Mining und der Computerlinguistik eingesetzt.[3]

Einzelnachweise

  1. Themenentdeckung und -verfolgung, Publikation von Prof. Dr. Wolfgang G. Stock
  2. James Allan (Hrsg.): Topic Detection and Tracking. Event-based Information Organization. In: The Information Retrieval Series. Vol. 12, Springer, 2002, ISBN 978-0-7923-7664-4, S. 3 f. (Eingeschränkte Vorschau in der Google Buchsuche).
  3. Juha, Makkonen, Helena Ahonen-Myka, Marko Salmenkivi: Simple Semantics in Topic Detection and Tracking. In: Information Retrieval. Vol. 7, Nr. 3, Springer, 2004, S. 347–368 (SpringerLink).

Literatur

  • James Allan (Hrsg.): Topic Detection and Tracking. Event-based Information Organisation. Kluwer, Boston MA u. a. 2002, ISBN 0-7923-7664-1 (Kluwer International Series on Information Retrieval 12).

Wikimedia Foundation.

Игры ⚽ Поможем сделать НИР

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”