- Volltextindexierung
-
Volltextindexierung ist die (automatische) Erfassung sämtlicher Wörter eines Textes im Index. Ausgenommen davon sind in der Regel Stoppwörter.
Volltextindexierung wird entweder ergänzend zu intellektuell vergebenen Deskriptoren eingesetzt oder dient gänzlich als Ersatz für ein intellektuelles Ordnungssystem.
Ein populärer Irrglaube ist, dass Volltextindizes grundsätzlich besser sind als von Menschen erstellte Ordnungssysteme. Ein weniger populärer Irrglaube ist, dass Volltextindizes nur verwendet werden (sollten), wenn Zeit und Geld für ein funktionierendes Ordnungssystem fehlen - richtiger ist es, dass "Volltextindexierung" nicht gegen Ordnungssysteme bestehen kann.
Inhaltsverzeichnis
Vorteile
Indexierung mittels Volltextindexierung hat eine Erhöhung des Recalls eines Retrievalsystems zufolge, zumal dadurch im Normalfall die Anzahl der Stichwörter höher ist.
Der Rechercheur kann ohne Kenntnis des Ordnungssystems suchen.
Als Ergänzung zu einem Intellektuellen Ordnungssystem kann der Volltextindex als "Backbone" dienen.
Nachteile
Die Precision eines Retrievalsystems geht durch den Einsatz von Volltextindizierung enorm zurück. Wird ein Begriff in einem Text nur am Rande erwähnt, ist das Dokument trotzdem unter diesem zu finden.
Die Suche im Volltextindex dauert länger, da Volltextindizes inhärent größer sind als intellektuell erstellte. Das mag, auf eine einzelne Suche bezogen, zwar im Bereich von Bruchteilen von Sekunden liegen, ist aber mit steigender Nutzerzahl eines Retrievalsystems nicht mehr zu vernachlässigen.
Zusammenfassung
Volltextindizes fungieren, selbst wenn gepaart mit Ranking-Algorithmen, im allgemeinen als wenig passable Retrieval-Werkzeuge (siehe auch Google) und eher als Unterstützung von intellektuellen Ordnungssystemen.
Siehe auch
Wikimedia Foundation.