Latent semantisches Indizieren

Latent semantisches Indizieren

Die Latent semantische Indizierung, kurz LSI genannt, ist eine Methode, um Dokumente automatisch zu klassifizieren.

Mit dieser Methode kann eine Suchmaschine feststellen, um was es bei einem Text oder einer Internetseite geht. Man nimmt einfach an, dass z.B. eine Seite über Apple-Computer meistens ebenfalls die Wörter iMac oder iPod enthält.

Latent Semantische Indizierung geht also im Vergleich zur normalen Indizierung einen Schritt weiter. Es werden nicht nur die Schlüsselwörter einer Seite gespeichert, sondern es wird auch untersucht, welche anderen Seiten ebenfalls diese Begriffe enthalten. LSI betrachtet Dokumente mit vielen gleichen Begriffen als "semantische Nähe" und Dokumente mit nur einigen wenigen gleichen Wörtern als "semantisch Entfernt".

Diese im Grunde genommen einfache Methode stimmt dennoch überraschend gut mit einer menschlichen Klassifizierung von Dokumenten überein. Obwohl der LSI Algorithmus zwar nicht versteht, was der Text bedeutet, ist die Mustererkennung überraschend hoch.

Indem sie zusätzliches Gewicht auf in Verbindung stehende Wörter in Inhalten legt, bewirkt eine Latent Semantische Indizierung einen Negativeffekt auf das Ranking einer Seite, das nur die Suchbegriffe enthält, aber nicht die oftmals mit Ihnen in Verbindung stehenden Wörter.

Weblinks


Wikimedia Foundation.

Игры ⚽ Поможем сделать НИР

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Latent Semantisches Indizieren — Die Latent semantische Indizierung, kurz LSI genannt, ist eine Methode, um Dokumente automatisch zu klassifizieren. Mit dieser Methode kann eine Suchmaschine feststellen, um was es bei einem Text oder einer Internetseite geht. Man nimmt einfach… …   Deutsch Wikipedia

  • Latent semantische Indizierung — Die Latent semantische Indizierung, kurz LSI genannt, ist eine Methode, um Dokumente automatisch zu klassifizieren. Mit dieser Methode kann eine Suchmaschine feststellen, um was es bei einem Text oder einer Internetseite geht. Man nimmt einfach… …   Deutsch Wikipedia

  • Wissensinfrastruktur — Unter der Wissensinfrastruktur einer Gesellschaft werden jene Einrichtungen verstanden, die die Produktion, die Distribution und den Gebrauch von Informationen bestimmen und damit organisieren, wie diese Informationen in das Wissen einer… …   Deutsch Wikipedia

  • Internetsuchmaschine — Eine Suchmaschine ist ein Programm zur Recherche von Dokumenten, die in einem Computer oder einem Computernetzwerk wie z. B. dem World Wide Web gespeichert sind. Internet Suchmaschinen haben ihren Ursprung in Information Retrieval Systemen. Sie… …   Deutsch Wikipedia

  • Jobsuchmaschine — Eine Suchmaschine ist ein Programm zur Recherche von Dokumenten, die in einem Computer oder einem Computernetzwerk wie z. B. dem World Wide Web gespeichert sind. Internet Suchmaschinen haben ihren Ursprung in Information Retrieval Systemen. Sie… …   Deutsch Wikipedia

  • Suchmaschinen — Eine Suchmaschine ist ein Programm zur Recherche von Dokumenten, die in einem Computer oder einem Computernetzwerk wie z. B. dem World Wide Web gespeichert sind. Internet Suchmaschinen haben ihren Ursprung in Information Retrieval Systemen. Sie… …   Deutsch Wikipedia

  • Suchprogramm — Eine Suchmaschine ist ein Programm zur Recherche von Dokumenten, die in einem Computer oder einem Computernetzwerk wie z. B. dem World Wide Web gespeichert sind. Internet Suchmaschinen haben ihren Ursprung in Information Retrieval Systemen. Sie… …   Deutsch Wikipedia

  • Web-Suche — Eine Suchmaschine ist ein Programm zur Recherche von Dokumenten, die in einem Computer oder einem Computernetzwerk wie z. B. dem World Wide Web gespeichert sind. Internet Suchmaschinen haben ihren Ursprung in Information Retrieval Systemen. Sie… …   Deutsch Wikipedia

  • Websuche — Eine Suchmaschine ist ein Programm zur Recherche von Dokumenten, die in einem Computer oder einem Computernetzwerk wie z. B. dem World Wide Web gespeichert sind. Internet Suchmaschinen haben ihren Ursprung in Information Retrieval Systemen. Sie… …   Deutsch Wikipedia

  • Geosemantik — (im Englischen ist der Begriff geospatial semantics üblich) ist ein interdisziplinäres Forschungsfeld und befasst sich mit der Bedeutung von Geoinformation. Die Vision des virtuellen Globus Inhaltsverzeichnis …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”