Volltextindexierung

Volltextindexierung

Volltextindexierung ist die (automatische) Erfassung sämtlicher Wörter eines Textes im Index. Ausgenommen davon sind in der Regel Stoppwörter.

Volltextindexierung wird entweder ergänzend zu intellektuell vergebenen Deskriptoren eingesetzt oder dient gänzlich als Ersatz für ein intellektuelles Ordnungssystem.

Ein populärer Irrglaube ist, dass Volltextindizes grundsätzlich besser sind als von Menschen erstellte Ordnungssysteme. Ein weniger populärer Irrglaube ist, dass Volltextindizes nur verwendet werden (sollten), wenn Zeit und Geld für ein funktionierendes Ordnungssystem fehlen - richtiger ist es, dass "Volltextindexierung" nicht gegen Ordnungssysteme bestehen kann.

Inhaltsverzeichnis

Vorteile

Indexierung mittels Volltextindexierung hat eine Erhöhung des Recalls eines Retrievalsystems zufolge, zumal dadurch im Normalfall die Anzahl der Stichwörter höher ist.

Der Rechercheur kann ohne Kenntnis des Ordnungssystems suchen.

Als Ergänzung zu einem Intellektuellen Ordnungssystem kann der Volltextindex als "Backbone" dienen.

Nachteile

Die Precision eines Retrievalsystems geht durch den Einsatz von Volltextindizierung enorm zurück. Wird ein Begriff in einem Text nur am Rande erwähnt, ist das Dokument trotzdem unter diesem zu finden.

Die Suche im Volltextindex dauert länger, da Volltextindizes inhärent größer sind als intellektuell erstellte. Das mag, auf eine einzelne Suche bezogen, zwar im Bereich von Bruchteilen von Sekunden liegen, ist aber mit steigender Nutzerzahl eines Retrievalsystems nicht mehr zu vernachlässigen.

Zusammenfassung

Volltextindizes fungieren, selbst wenn gepaart mit Ranking-Algorithmen, im allgemeinen als wenig passable Retrieval-Werkzeuge (siehe auch Google) und eher als Unterstützung von intellektuellen Ordnungssystemen.

Siehe auch


Wikimedia Foundation.

Игры ⚽ Нужна курсовая?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Automatische Indexierung — Dieser Artikel beschäftigt sich mit der Erschließung von Dokumenten. Weitere Bedeutungen siehe unter Index und Indizierung. Als Indexierung oder auch Verschlagwortung (Österreich: Beschlagwortung) bezeichnet man beim Information Retrieval die… …   Deutsch Wikipedia

  • Grundformenreduktion — Als Stemming (Grundformenreduktion, Normalformenreduktion) bezeichnet man im Information Retrieval ein Verfahren, mit dem verschiedene morphologische Varianten eines Wortes auf ihren gemeinsamen Wortstamm zurückgeführt werden, z. B. Wikis auf… …   Deutsch Wikipedia

  • Indexieren — Dieser Artikel beschäftigt sich mit der Erschließung von Dokumenten. Weitere Bedeutungen siehe unter Index und Indizierung. Als Indexierung oder auch Verschlagwortung (Österreich: Beschlagwortung) bezeichnet man beim Information Retrieval die… …   Deutsch Wikipedia

  • Manuelle Indexierung — Dieser Artikel beschäftigt sich mit der Erschließung von Dokumenten. Weitere Bedeutungen siehe unter Index und Indizierung. Als Indexierung oder auch Verschlagwortung (Österreich: Beschlagwortung) bezeichnet man beim Information Retrieval die… …   Deutsch Wikipedia

  • Normalformenreduktion — Als Stemming (Grundformenreduktion, Normalformenreduktion) bezeichnet man im Information Retrieval ein Verfahren, mit dem verschiedene morphologische Varianten eines Wortes auf ihren gemeinsamen Wortstamm zurückgeführt werden, z. B. Wikis auf… …   Deutsch Wikipedia

  • Stammformreduktion — Als Stemming (Grundformenreduktion, Normalformenreduktion) bezeichnet man im Information Retrieval ein Verfahren, mit dem verschiedene morphologische Varianten eines Wortes auf ihren gemeinsamen Wortstamm zurückgeführt werden, z. B. Wikis auf… …   Deutsch Wikipedia

  • Suchbegriff — Ein Stichwort ist in der Dokumentation ein Wort, welches der inhaltlichen Erschließung eines Dokumentes dient. Vom Standpunkt des Suchenden aus ist es der Suchbegriff. Inhaltsverzeichnis 1 Stichwort und Schlagwort 2 Stichwortverzeichnis 3 Siehe… …   Deutsch Wikipedia

  • Verschlagwortung — Dieser Artikel beschäftigt sich mit der Erschließung von Dokumenten. Weitere Bedeutungen siehe unter Index und Indizierung. Als Indexierung oder auch Verschlagwortung (Österreich: Beschlagwortung) bezeichnet man beim Information Retrieval die… …   Deutsch Wikipedia

  • Google Scholar — Logo Google Scholar ist ein Suchdienst des Unternehmens Google Inc. und dient der allgemeinen Literaturrecherche wissenschaftlicher Dokumente. Dazu zählen sowohl kostenlose Dokumente aus dem freien Internet als auch kostenpflichtige Angebote.… …   Deutsch Wikipedia

  • Indexierung — Als Indexierung, auch Verschlagwortung (Österreich, Bayern: Beschlagwortung) oder Verstichwortung, bezeichnet man beim Information Retrieval die Zuordnung von Deskriptoren zu einem Dokument zur Erschließung der darin enthaltenen Sachverhalte. Es… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”