Latent semantische Indizierung

Latent semantische Indizierung

Die Latent semantische Indizierung, kurz LSI genannt, ist eine Methode, um Dokumente automatisch zu klassifizieren.

Mit dieser Methode kann eine Suchmaschine feststellen, um was es bei einem Text oder einer Internetseite geht. Man nimmt einfach an, dass z.B. eine Seite über Apple-Computer meistens ebenfalls die Wörter iMac oder iPod enthält.

Latent Semantische Indizierung geht also im Vergleich zur normalen Indizierung einen Schritt weiter. Es werden nicht nur die Schlüsselwörter einer Seite gespeichert, sondern es wird auch untersucht, welche anderen Seiten ebenfalls diese Begriffe enthalten. LSI betrachtet Dokumente mit vielen gleichen Begriffen als "semantische Nähe" und Dokumente mit nur einigen wenigen gleichen Wörtern als "semantisch Entfernt".

Diese im Grunde genommen einfache Methode stimmt dennoch überraschend gut mit einer menschlichen Klassifizierung von Dokumenten überein. Obwohl der LSI Algorithmus zwar nicht versteht, was der Text bedeutet, ist die Mustererkennung überraschend hoch.

Indem sie zusätzliches Gewicht auf in Verbindung stehende Wörter in Inhalten legt, bewirkt eine Latent Semantische Indizierung einen Negativeffekt auf das Ranking einer Seite, das nur die Suchbegriffe enthält, aber nicht die oftmals mit Ihnen in Verbindung stehenden Wörter.

Weblinks


Wikimedia Foundation.

Игры ⚽ Нужно сделать НИР?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Latent semantische Optimierung — Die Latent semantische Optimierung (oft mit LSO abgekürzt) bezeichnet die inhaltliche Optimierung von Texten und Webseiten im Allgemeinen und ist somit der Suchmaschinenoptimierung (SEO) nicht unähnlich. Bei einer LSO wird der Inhalt einer… …   Deutsch Wikipedia

  • Latent Semantisches Indizieren — Die Latent semantische Indizierung, kurz LSI genannt, ist eine Methode, um Dokumente automatisch zu klassifizieren. Mit dieser Methode kann eine Suchmaschine feststellen, um was es bei einem Text oder einer Internetseite geht. Man nimmt einfach… …   Deutsch Wikipedia

  • Latent semantisches Indizieren — Die Latent semantische Indizierung, kurz LSI genannt, ist eine Methode, um Dokumente automatisch zu klassifizieren. Mit dieser Methode kann eine Suchmaschine feststellen, um was es bei einem Text oder einer Internetseite geht. Man nimmt einfach… …   Deutsch Wikipedia

  • Geosemantik — (im Englischen ist der Begriff geospatial semantics üblich) ist ein interdisziplinäres Forschungsfeld und befasst sich mit der Bedeutung von Geoinformation. Die Vision des virtuellen Globus Inhaltsverzeichnis …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”