- Catalogue Enrichment
-
Mit Kataloganreicherung (englisch catalog enrichment) werden Einträge eines Bibliothekskatalogs um weiterführende Informationen ergänzt, die über die reguläre Formal- und Sacherschließung hinausgehen.
Inhaltsverzeichnis
Beispiele und Formen
Die weiterführenden Inhalte im Rahmen der Kataloganreicherung können unter anderem sein:
- Inhaltsverzeichnisse (Tables of Content, TOCs)
- Inhaltsangaben und Abstracts
- Rezensionen
- Volltexte
- Empfehlungsdienste
- Coverabbildungen
- Deskriptoren, maschinell generierte (aufgrund computerlingustistischer und/oder statistischer Extraktions- und Modifikationsverfahren auf Basis digitalisierter oder importierter Texte wie TOC, Abstract, Volltext, Rezension)
- Tagging, von Nutzern manuell ergänzte freie Deskriptoren oder von Verlagen übernommene Deskriptoren
- Query Expansion, die Erweiterung der Benutzeranfragen durch zusätzliche semantische Ressourcen (Thesaurus, Ontologie, Klassifikation, Taxonomie, Übersetzung und andere Listen)
Umsetzung und Geschichte
Die Anreicherung kann entweder durch Einbringung der Informationen (Inhaltsverzeichnisse, Inhaltsangaben, maschinell generierte Deskriptoren usw.) in den Katalogeintrag selbst oder durch Verlinkung erfolgen, wobei die verlinkte Quelle entweder auf einem Server der Bibliothek liegt oder von einem externen Anbieter zur Verfügung gestellt wird.
Viele Formen der Kataloganreicherung werden bereits seit mehreren Jahren von Buchhändlern im Internet angewandt. Anfang der 90er-Jahre erweiterte die Universitätsbibliothek Düsseldorf durch die maschinelle Indexierung der Titel und Untertitel die Menge der suchbaren Worte um Grundformen, Komposita-Zerlegung, Synonyme und Schlagworte aus der Deutschen Schlagwortnormdatei. Kataloganreicherung insbesondere mit Inhaltsverzeichnissen und daraus maschinell generierten Deskriptoren ist im deutschsprachigen Raum seit 2002 State-of-the-Art. Die zusätzlichen Inhalte sind in den Katalogsystemen teils über maschinell generierte Deskriptoren abfragbar, teils auch über in den Katalog übertragene meist kurze Texte.
Einige Bibliotheken beziehen die zusätzlichen Inhalte in die Suche bewusst nicht ein, insbesondere weil die meisten Bibliothekssysteme kein Relevance Ranking besitzen und bei eher allgemeinen Begriffen zu große Treffermengen befürchtet werden. Dadurch geht jedoch die Chance verloren, sehr spezifische Fachbegriffe oder z.B. Autoren von Sammelwerken finden zu können, die über maschinelle Indexierung erkannt und extrahiert werden (siehe auch Named Entity Recognition, Information Extraction oder Text Analytics).
Die Entwicklung zum Einsatz von Suchmaschinen additiv oder alternativ zum den OPACs (online public access catalog) der Bibliothekssysteme zeichnet sich klar als Trend ab. Sowohl nationale und internationale Bibliotheksverbundanbieter (wie OCLC mit WorldCat) und die Bibliothekssystemanbieter konkurrieren um Suchlösungen für den Bibliotheksmarkt. Deutscher Pionier ist dandelon.com. Seit 2003 nutzen die Bibliotheken, die gemeinsam dandelon.com als Austauschplattform für Kataloganreicherung aufbauen, diese Datenbank auch als frei zugängliche Suchmaschine, die die Anfrage automatisch gegen zahlreiche Fachthesauri validiert und darüber semantisch um Synonyme, Akronyme, Übersetzungen und Unterbegriffe erweitert und schließlich die Suchergebnisse nach Relevanz sortiert. Die Datenbank kombiniert die Suche in Feldern, die den jeweiligen Bibliothekskatalogen entnommen sind, zusätzlich importierten Daten von Verlagen, darunter vor allem Abstracts und Klappentexte sowie die digitalisierten oder importierten Volltexte bis hin zu ganzen Büchern. Die Suchergebnisse verlinken auf den jeweiligen Bibliotheksdatensatz zurück, wo ein Teil der Titel als E-Books lizenziert und direkt zugänglich sind.
Die deutschen Bibliotheksverbünde vereinbarten 2007 Standards für die Digitalisierung von Inhaltsverzeichnissen und Methoden des Austauschs. Seit 2008 nimmt die Deutsche Nationalbibliothek an der Produktion von Inhaltsverzeichnissen teil.
Man trifft in manchen amerikanischen Verbundkatalogen Inhaltsverzeichnisse (als Content Notes) an, deren Inhalte über die Keyword-Suche auffindbar sind und in denen bei Sammelbänden auch die Namen der Beitragsautoren über die Verfassersuche zur Verfügung stehen. Google geht das Thema noch forcierter an: es arrangiert sich Ende 2008 mit US-Verlagen und Autorenorganisationen bezüglich der Urheberrechte und digitalisiert massenhaft ganze Bibliotheken und die ganzen Werke und verlinkt über OCLC-WorldCat auf die dort registrierten Bibliotheken.
Literatur
- Löhrer, Sabine: [http://www.informationswissenschaft.ch/fileadmin/uploads/pdf/csi/CSI_15_Loehrer_FINAL.pdf Kataloganreicherung in Hochschulbibliotheken, Diplomarbeit (PDF), Chur, 2007
- Joachim Eberhardt: Angewandte Ethik: Zum moralischen Status des Catalogue Enrichment. In: LIBREAS - Library Ideas 2(1), 2006.
- Hauer, Manfred: ``Vergleich der Retrievalleistungen von Bibliothekskatalogen gegen erweiterte und neue Konzept. Benchmarking: Google Scholar, dandelon.com, Vorarlberger Landesbibliothek, weitere OPACs´´ In: ABI-Technik 2005, Heft Dezember, S 295-301
Weblinks
Wikimedia Foundation.