Relevance Feedback

Relevance Feedback

Das Relevance Feedback-Verfahren findet im Information-Retrieval Anwendung, einer Teildisziplin der Informatik und der Informationswissenschaft. Es beschreibt ein Verfahren zur schrittweise verlaufenden Verbesserung von Suchergebnissen einer textbasierten Suche (z. B. von Suchmaschinen).

Inhaltsverzeichnis

Grundidee

Die Idee besteht darin, die Relevanz bereits gefundener Dokumente für die Suche ähnlicher Dokumente einzusetzen. Daher auch das Wort Relevance Feedback, denn es beschreibt eine Informationsrückkopplung über das Ergebnis vorangegangener Suchen. Das Relevance Feedback baut dabei auf vorhandene Suchverfahren auf (Probabilistisches Modell oder Vektorraummodell).

Verfahren

  1. Anhand einer initialen Suchanfrage Q extrahiert das Retrievalsystem eine erste Dokumentenmenge aus dem Dokumentenraum.
  2. Der Nutzer kennzeichnet dann in der Suchergebnismenge besonders relevante (positives Feedback) und eventuell auch irrelevante Dokumente (negatives Feedback).
  3. Das Retrievalsystem berechnet aufgrund dieser Information
    • im Vektorraummodell eine neue Suchanfrage Q', deren Vektor den relevanten Dokumenten ähnlicher und den irrelevanten Dokumenten unähnlicher ist als Q,
    • im Probabilistischen Modell neue bedingte Wahrscheinlichkeiten, die den Zusammenhang zwischen dem Auftreten von Termen im Indexat und der Relevanzeinschätzung repräsentieren.
  4. Das Retrievalsystem führt den Suchschritt mit der neuen Suchanfrage Q' (Vektorraummodell) bzw. wieder mit Q aber auf der Basis der neuen Wahrscheinlichkeitsschätzungen (Probabilistisches Modell) erneut aus und findet eine neue Dokumentenmenge, die den Interessen des Nutzers besser entsprechen sollte.
  5. Die neuen Dokumente werden dem Nutzer präsentiert.
  6. Dieser kann erneutes Feedback geben (Rückkehr zu Schritt 2).

So wird das Suchergebnis Schritt für Schritt verbessert.

Motivation

Ein Problem für heutige Suchmaschinen sind die oft viel zu kurzen Suchanfragen. Im Mittel gehen diese kaum über 2 Wörter hinaus. Dies führt zu einer hohen Anzahl mehrdeutiger Anfragen. Ein weiteres Problem sind Ungenauigkeiten / Unschärfen bei der Inhaltserschließung der Dokumente. Besondere Motivation gewinnt das Relevance Feedback aus dem Multimedia Information Retrieval, da hier zwischen Suchanfrage und Dokument häufig ein Medienbruch zu überwinden ist, indem etwa eine textuell definierte Suchanfrage auf Bilddaten anzuwenden ist. Das Relevance Feedback trägt dazu bei, diese Probleme zu entschärfen, da das System zunehmend bessere Hypothesen über die Anforderungen aufbauen kann, die der Nutzer an relevante Dokumente stellt.

Nachteile

Ein Nachteil des Relevance Feedback liegt in dem Aufwand, den die wiederholten Relevanzeinschätzungen dem Nutzer abverlangen.

Blind Relevance Feedback

Das Blind Relevance Feedback (oder auch bekannt als Pseudo Relevance Feedback) beseitigt diese Nachteile des manuellen Relevance Feedback, bringt aber andere Nachteile mit sich. Die Relevanz der Suchanfrage wird nicht manuell vom Nutzer gekennzeichnet, sondern automatisch (daher der Name "Blind"). Das Suchsystem assoziiert automatisch eine Relevanz für die jeweiligen Ergebnis Dokumente, woraufhin dann die Suchanfrage per Query Expansion automatisch erweitert wird, und eine neue Ergebnisliste mit der erweiterten Suchanfrage generiert wird. Da bei diesem Verfahren kein manueller Eingriff mehr nötig ist, sind die Ergebnisse für den Nutzer meist zu ungenau.

Literatur

  • Christopher D. Manning, Prabhakar Raghavan, Hinrich Schütze: Introduction to Information Retrieval, Cambridge University Press, 2008, ISBN 0521865719.

Wikimedia Foundation.

Игры ⚽ Поможем решить контрольную работу

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Relevance feedback — is a feature of some information retrieval systems. The idea behind relevance feedback is to take the results that are initially returned from a given query and to use information about whether or not those results are relevant to perform a new… …   Wikipedia

  • Relevance feedback — Die Artikel Relevanz Feedback, Relevanz Feedback (IRS), Relevance Feedback und Relevanz Feedback (IS) überschneiden sich thematisch. Hilf mit, die Artikel besser voneinander abzugrenzen oder zu vereinigen. Beteilige dich dazu an der Diskussion… …   Deutsch Wikipedia

  • Feedback — For other uses, see Feedback (disambiguation). Feedback describes the situation when output from (or information about the result of) an event or phenomenon in the past will influence an occurrence or occurrences of the same (i.e. same defined)… …   Wikipedia

  • Relevanz-Feedback — Die Artikel Relevanz Feedback, Relevanz Feedback (IRS), Relevance Feedback und Relevanz Feedback (IS) überschneiden sich thematisch. Hilf mit, die Artikel besser voneinander abzugrenzen oder zu vereinigen. Beteilige dich dazu an der Diskussion… …   Deutsch Wikipedia

  • Relevanz-Feedback (IRS) — Die Artikel Relevanz Feedback, Relevanz Feedback (IRS), Relevance Feedback und Relevanz Feedback (IS) überschneiden sich thematisch. Hilf mit, die Artikel besser voneinander abzugrenzen oder zu vereinigen. Beteilige dich dazu an der Diskussion… …   Deutsch Wikipedia

  • 360-degree feedback — In human resources, 360 degree feedback, also known as multi rater feedback , multisource feedback , or multisource assessment , is employee development feedback that comes from all around the employee. 360 refers to the 360 degrees in a circle.… …   Wikipedia

  • Concept Search — A concept search (or conceptual search) is an automated information retrieval method that is used to search electronically stored unstructured text (for example, digital archives, email, scientific literature, etc.) for information that is… …   Wikipedia

  • Social search — or a social search engine is a type of web search method that determines the relevance of search results by considering the interactions or contributions of users. When applied to web search this user based approach to relevance is in contrast to …   Wikipedia

  • Discounted cumulative gain — (DCG) is a measure of effectiveness of a Web search engine algorithm or related applications, often used in information retrieval. Using a graded relevance scale of documents in a search engine result set, DCG measures the usefulness, or gain, of …   Wikipedia

  • Information retrieval — This article is about information retrieval in general. For the fictional government department, see Brazil (film). Information retrieval (IR) is the area of study concerned with searching for documents, for information within documents, and for… …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”