- Relevance feedback
-
Das Relevance Feedback-Verfahren findet im Information Retrieval Anwendung, einer Teildisziplin der Informatik und der Informationswissenschaft. Es beschreibt ein Verfahren zur schrittweise verlaufenden Verbesserung von Suchergebnissen einer textbasierten Suche (z.B. von Suchmaschinen).
Inhaltsverzeichnis
Grundidee
Die Idee besteht darin, die Relevanz bereits gefundener Dokumente für die Suche ähnlicher Dokumente einzusetzen. Daher auch das Wort Relevance Feedback, denn es beschreibt eine Informationsrückkopplung über das Ergebnis vorangegangener Suchen. Das Relevance Feedback baut dabei auf vorhandene Suchverfahren auf ( Probabilistischen Modell oder Vektorraummodell).
Verfahren
- Anhand einer initialen Suchanfrage Q extrahiert das Retrievalsystem eine erste Dokumentenmenge aus dem Dokumentenraum.
- Der Nutzer kennzeichnet dann in der Suchergebnismenge besonders relevante (positives Feedback) und eventuell auch irrelevante Dokumente (negatives Feedback).
- Das Retrievalsystem berechnet aufgrund dieser Information
-
- im Vektorraummodell eine neue Suchanfrage Q', deren Vektor den relevanten Dokumenten ähnlicher und den irrelevanten Dokumenten unähnlicher ist als Q,
- im Probabilistisches Modell neue bedingte Wahrscheinlichkeiten, die den Zusammenhang zwischen dem Auftreten von Termen im Indexat und der Relevanzeinschätzung repräsentieren.
-
- Das Retrievalsystem führt den Suchschritt mit der neuen Suchanfrage Q' (Vektorraummodell) bzw. wieder mit Q aber auf der Basis der neuen Wahrscheinlichkeitsschätzungen (Probabilistisches Modell) erneut aus und findet eine neue Dokumentenmenge, die den Interessen des Nutzers besser entsprechen sollte.
- Die neuen Dokumente werden dem Nutzer präsentiert.
- Dieser kann erneutes Feedback geben (Rückkehr zu Schritt 2).
So wird das Suchergebnis Schritt für Schritt verbessert.
Motivation
Ein Problem für heutige Suchmaschinen sind die oft viel zu kurzen Suchanfragen. Im Mittel gehen diese kaum über 2 Wörter hinaus. Dies führt zu einer hohen Anzahl mehrdeutiger Anfragen. Ein weiteres Problem liegt Ungenauigkeiten / Unschärfen der Inhaltserschließung der Dokumente. Das Relevance Feedback entschärft diese Probleme, da das System zunehmend bessere Hypothesen über die Anforderungen aufbauen kann, die der Nutzer an relevante Dokumente stellt.
Nachteile
Ein Nachteil des Relevance Feedback liegt in dem Aufwand, den die wiederholten Relevanzeinschätzungen dem Nutzer abverlangen.
Literaturangaben
Gerard Salton, Michael J. McGill: Introduction to modern information retrieval, New York, McGraw-Hill, 1983.
Wikimedia Foundation.