- Unternehmenssuche
-
Enterprise Search bzw. Unternehmenssuche bezeichnet ein Teilgebiet von Information Retrieval und bezeichnet den Vorgang der computergestützten inhaltsorientierten Suche mit Hilfe einer unternehmensinternen Suchmaschine, welche Content mittels so genannter Crawler indexiert.
Die Suche wird jedoch in der Regel nicht live auf den ursprünglichen Datenquellen durchgeführt, sondern auf dem Suchindex. Dieser Index beinhaltet primär interne Datenquellen wie Dokumente von verschiedenen Datenbanken und Einträge von Dateisystemen.
Treffer oder gefundene Dokumente werden im Kontext der Suchanfrage als Textauszug („Snippet“) angezeigt. Durch diese Vorschau lässt sich schnell die Relevanz der Ergebnisse beurteilen. Durch die fortlaufende Indexierung der einzelnen Datenquellen wird die Aktualität der Resultate (Result Set) gewährleistet.
Aus Sicht von Unternehmen ist der Nutzen von Enterprise Search die Unterstützung der Mitarbeiter bei der Suche nach arbeitsrelevanten Informationen.
Inhaltsverzeichnis
Wie es funktioniert
Suchmaschinen bestehen in den meisten Fällen aus drei Hauptkomponenten: einer Crawling/Indexing Engine, einer Query Engine und einer Ranking/Relevancy Engine.
Die Crawling/Indexing Engine sorgt für das Retrieval der Dokumente und Daten von einer Quelle und legt diese Informationen in einer effizient durchsuchbaren Struktur ab. Ausserdem sorgt sie für die Erstellung von Dokumenten Caches, die zur Darstellung der Dokumenten Snippets/Summaries in der Resultat Seite notwendig sind. Die Query Engine sucht nach Suchbegriff Treffern im Index und erstellt eine Liste dieser Vorkommnisse. Die Ranking/Relevancy Engine ist zuständig für die Sortierung resp. Reihenfolge der Treffer verantwortlich.
Schnittstellen
Viele Enterprise-Search-Hersteller bieten verschiedenste Adaptoren oder Konnektoren für weit verbreitete Unternehmsanwendungen an, um die Inhalte in der Suchlösung anzeigen zu können. Neben dem direkten Abfragen der Kundendatenbank sind beispielsweise Plugins für Gruppen-E-Mail-Anwendungen, Content- oder Dokumenten-Management-Systeme typisch. Auch ein Einbinden als eigenes Filesystem (Netzlaufwerk) ist oft möglich. Oft wird auch mit "Federated Search" Konnektoren gearbeitet, welche die Suchabfrage an ein Zielsystem weitergeben und danach die erhaltenen Teilergebnisse in die Ergebnisse integriert.
Komponenten
Allgemein wird zwischen Frontend und Backend unterschieden.
Das Backend beinhaltet typischerweise neben den einzelnen Konnektoren den Crawler, Indexer sowie Parser für die von den verschiedenen Frontends gestellten Suchanfragen. Diese Anfragen werden an die eigentliche Suchmaschine weitergeleitet, die die Informationen aus der indizierten Datenbank zur Verfügung stellt.
Im Frontend gibt es generell größere Gestaltungsfreiheit. Es kann einfach ein Eingabefeld sein, oder mehr Komfort bieten, beispielsweise durch Vorschläge bei vermuteten Tippfehlern, das anzeigen weiterer verwandter Themenfelder oder navigation durch eine TagCloud oder Facettenklassifikation. Das immer weitere Einschränken des Suchbegriffes (beispielsweise entlang eines Taxonomie-Baumes wird auch als Drilldown bezeichnet. Die Formatierung des Resultates (beispielsweise Aufteilung in verschiedene Seiten) wird typischerweise ebenfalls im Frontend erledigt. Das Frontend beinhaltet typischerweise auch alle reinen Komfortfunktionen wie beispielsweise die möglichkeit, Suchanfragen zu speichern und später erneut zu stellen.
Vergleich Unternehmens-Suche und Internet Suche
In Enterprise Search wie auch der Internet Suche werden grundsätzlich ähnliche Techniken und Algorithmen eingesetzt. Dies sind zum einen die Crawler. Eine weitere Gemeinsamkeit sind die grossen Indexe und die Sortierung der Treffer nach Relevanz.
Folgende Unterschiede bestehen:
- Sicherheit: Die Autorisierung der Benutzer von Dateien und Ordner innerhalb des Unternehmens sichergestellt werden.
- Linkstruktur: Das Ranking wird nicht mit dem Parameter „Anzahl Links auf ein Dokument“ beeinflusst.
- Quellen: Die durchsuchbaren Daten stammen nicht nur von Webserver, sondern auch von verschiedenen anderen Anwendungen.
- Inhalte: Inhalte sind nicht für die Indexierung durch eine Suchmaschine optimiert resp. manipuliert und es gibt keinen SPAM.
Vergleich Unternehmenssuchmaschine / Datenbank
Im Gegensatz zu Datenbanken mit dem Zweck der Verwaltung der strukturierten Inhalte werden Suchmaschinen vor allem für die Erschliessung von unstrukturierten Inhalten eingesetzt. Eine grosser Unterschied besteht auch im Hinblick auf die Anzahl zu durchsuchende Quellen, so können diese bei Enterprise Search verschiedene sein. Die Abfragen bei Datenbank beschränken sich normalweise auf eine. Die Abfragesprache selbst gestaltet sich bei Sucharchitekturen um einiges einfacher, da schlicht Schlüsselwörter eingegeben werden können und keine Datebankabfragesprachen wie SQL notwendig sind. Neben diesen Aspekten sind Suchmaschinen um ein vielfaches schneller, so dauert eine Abfrage in der Regel maximal eine Sekunde im Gegensatz zu aufwendigen Datenbankabfragen die mehrere Stunden dauern können
Siehe auch
Literatur
- Making Search Work: Implementing Web, Intranet and Enterprise Search, Martin White, ISBN 1-57387-305-5
Weblinks
Wikimedia Foundation.