- Google Buchsuche
-
Google Book Search (ehemals: Google Print), im deutschsprachigen Raum auch Google Buchsuche, ist eine Dienstleistung des US-amerikanischen Unternehmens Google Inc. mit dem Ziel, das in Büchern gespeicherte Wissen der Welt vorwiegend durch Digitalisierung für die Volltextsuche verfügbar zu machen. Google Buchsuche befindet sich derzeit in einer öffentlichen Betaphase (Stand: Mai 2008).
Inhaltsverzeichnis
Beschreibung
Google Book Search speist sich aus zwei Quellen: Google Print im engeren Sinn, dem – nicht weiter kontroversen – Kooperationsprojekt mit Verlagen, und dem juristisch umstrittenen Google Library, bei dem Bücher großer akademischer Bibliotheken ohne Zustimmung der Rechteinhaber massenweise gescannt werden.
Geschichte
Im Oktober 2004 stellte sich der auf die Buchverlage ausgerichtete Aspekt auf der Frankfurter Buchmesse von Google Print vor (Pressekonferenz mit den Firmengründern Sergey Brin und Larry Page). Erste Berichte über Google Print gab es im gleichen Monat. Im Dezember 2004 begannen Suchergebnisse aus gescannten Büchern in den Ergebnislisten der englischen Suchoberfläche Google.com zu erscheinen. Google möchte bis 2015 15 Millionen Bücher (entspricht 4,5 Milliarden Seiten) gescannt haben.
Seit April 2005 existiert eine eigene Suche für die Inhalte des Programms.
Im Oktober 2005 präsentierte man zur Frankfurter Buchmesse deutsche und anderssprachige Benutzungsoberflächen.
Am 4. November 2005 wurde die Suchseite, nunmehr mit einer Möglichkeit der Abfrage nach Zeiträumen in der erweiterten Suche versehen, offiziell vorgestellt.
Am 17. November 2005 kündigte Google die Umbenennung des Dienstes in seinem Firmen-Weblog an. [1] Zu diesem Zeitpunkt leiteten Anfragen von print.google.com nach books.google.com um.
Im September 2008 kündigte Google an, gemeinsam mit nordamerikanischen Zeitungsverlagen Zeitungen zu digitalisieren. Die Digitalisate sollen durchsuchbar sein, mit dem Webbrowser navigierbar und erscheinen wie in der Printausgabe mitsamt den Fotographien, Schlagzeilen und Werbeanzeigen. [2]
Kooperation mit den Verlagen
Google erhält von den Verlagen Bücher oder PDF-Dateien zugesandt. Die Bücher werden gescannt und durch OCR als E-Texte in den Index aufgenommen. Nutzer können jeweils nur vergleichsweise wenige Seiten des einzelnen Buchs einsehen. Nach einigen Seiten können nur (kostenfrei) registrierte Nutzer eine Anzahl weiterer Seiten einsehen. Eine Reihe von Seiten ist von vornherein für den Zugriff gesperrt. Nach Erschöpfung des Tageskontingents können keine weiteren Seiten betrachtet werden. Frei zugänglich sind in der Regel das Inhaltsverzeichnis, nicht selten auch das Register.
Google versucht die Inhalte durch eine Art Kopierschutz (sogenanntes „Digital Rights Management“) zu schützen.
Kooperation mit Bibliotheken
Google hat vor, in den nächsten Jahren den kompletten Bestand der Bibliothek der University of Michigan (über 7 Millionen Bände) einzuscannen sowie große Teile der US-Universitätsbibliotheken Harvard und Stanford, der New York Public Library und in Europa der Bodleian Library der Oxford University. Auch die Bibliotheken der Universitäten in Virginia, Wisconsin-Madison, Princeton, Kalifornien sowie in Texas-Austin beteiligen sich.
Ende 2006 traten zwei weitere Institutionen dem Verbund der Bibliotheken bei, die Bücher bei Google digitalisieren lassen: Die Nationalbibliothek von Katalonien, Biblioteca de Catalunya in Barcelona und die Bibliothek der Universidad Complutense Madrid. Reg Carr, Leiter der Bodleian Library, der bis dahin einzigen europäischen Partner-Bibliothek, begrüßte die beiden neuen Teilnehmer begeistert und wies die Einwände gegen das Projekt zurück.
Am 6. März 2007 gab die Bayerische Staatsbibliothek in München bekannt, als erste deutsche Bibliothek mit dem Projekt zu kooperieren. Es sollen nun etwa eine Million urheberrechtsfreier Werke aus den historischen Beständen und aus Spezialsammlungen digitalisiert werden.[3] Ausgenommen von dem Digitalisierungsprojekt sind nur die Handschriften- und Inkunabelbestände sowie seltene und besonders wertvolle historische Drucke.[4]
Im Juli 2008 gab die Bibliothèque Municipale de Lyon als erste französische Bibliothek bekannt ihre Bücher digitalisieren zu lassen.[5]
Heftige Kritik von Autoren- und Verlegerseite hat Google dazu gebracht, das Scannen von urheberrechtlich geschützten Büchern bis November 2005 auszusetzen. Bis zu diesem Zeitpunkt sollten die Rechteinhaber angeben, welche Bücher sie nicht zugänglich gemacht haben möchten (Opt-Out-Lösung). Während Google sich auf den fair use des US-Rechts beruft und dabei von renommierten Juristen unterstützt wird, fordern die Verleger und Autorenverbände, dass kein Buch ohne Zustimmung ins Programm eingestellt wird (Opt-In). Im Oktober 2005 wurden in den USA Klagen von Autoren und Verlegern gegen Google eingereicht.
Stellungnahmen und Kritik
Durch Googles Projekt sind die traditionellen Träger kostenfreier Digitalisierung, vor allem die Bibliotheken, unter Druck geraten. Grundsätzlich begrüßt man die Möglichkeit, riesige Buchbestände kostenfrei im Volltext durchsuchen und gemeinfreie ältere Bücher vollständig lesen zu können.
Der vehementeste Kritiker in Europa ist der ehemalige Direktor der Französischen Nationalbibliothek, Jean-Noël Jeanneney, der mit Gallica das ambitionierteste freie europäische Digitalisierungsprojekt betreibt. Er befürchtet, dass durch die englischsprachige Ausrichtung des Projekts die europäischen Sprachen ins Hintertreffen geraten könnten und warnt vor der „Google-Arroganz“ und der Dominanz einer Hypermacht.[6] Der Historiker Jeanneney plädiert dafür, dass Europa eine Alternative zum Google-Digitalisierungsprojekt auf die Beine stellt. An Google kritisiert er vor allem die Hegemonie des Englischen und den Kumulationseffekt (bei ihm genannt die „Blickfang-Methode“, üblich ist der Begriff „Ranking“, siehe: PageRank), der dazu führe, dass im Kampf um die Aufmerksamkeit des Lesers eine gewollte Konzentration auf die Listenführer stattfinde. Der stärkere Anbieter wird immer noch stärker auf Kosten des Schwächeren. Dadurch werde Google besonders für die Werbung wichtig. Diesem „kapitalistischen“ Google-Prinzip möchte Jeanneney ein Modell entgegensetzen, bei dem der Staat das Sagen in Dingen des kulturellen Gedächtnisses hat. 19 National- und Universitäts-Bibliotheken in Europa haben den Appell der französischen Nationalbibliothek unterzeichnet, um eine drohende geistige und kulturelle Vorherrschaft der USA zu verhindern.
Kritiker bemängelten an Google Library, dass die Partnerbibliotheken mit Knebelverträgen über den Tisch gezogen wurden. Aus bibliothekarischer Sicht werden die oft miserable OCR-Qualität[7] und die mangelhaften Metadaten bemängelt. Die Suchmaschine behält den gesamten Digitalisierungsprozess als Betriebsgeheimnis in der Hand und schließt die Mitarbeiter der Universitäten systematisch aus; sie haben keinen Zugang zu den Räumen des Scan-Projekts und etwaige Fenster sind abgeklebt.
Europäische Nutzer beschweren sich darüber, dass Google für US-Nutzer alle vor 1923 erschienenen Bücher frei zugänglich macht, bei Nicht-US-Nutzern aber alle Bücher nach 1864 als unfrei behandelt, obwohl darunter sehr viele Bücher sind, die in allen Staaten der Welt Public Domain sein dürften (siehe: Regelschutzfrist). Auch bezeichnet Google reine Reprints gemeinfreier Werke als copyrighted material, was zumindest nach US-Recht eine unbegründete Anmaßung (Copyfraud) darstellen dürfte.
Bücher, die nur US-Bürgern zugänglich sind, können mittels eines in den USA ansässigen Proxyservers trotzdem weltweit eingesehen werden. [8]
Bücher aus der Universitätsbibliothek von Michigan sind außer bei Google auch über den OPAC Mirlyn zugänglich. Dort kann auch der OCR-Text der einzelnen Seiten abgerufen werden.
Weitere Projekte
- Die Open Content Alliance u.a. mit Konkurrent Yahoo, dem Internetarchiv und der University of California hat im Rahmen der Open Library in großem Umfang Bücher katalogisiert und digitalisiert, als Open Content und unter strikter Wahrung des Urheberrechts.
- Auch der Konkurrent und mögliche Partner von Google, das Internet-Versandhaus Amazon bietet gescannte Bücher im Volltext an, konzentriert sich jedoch auf aktuell im Handel erhältliche Bücher, und will damit den Verkauf gedruckter Bücher fördern. Mit seiner Suche „Search Inside a Book“ [9] macht Amazon Titelseite, Klappentext, Inhaltsverzeichnis, Register und zwei Seiten vor und hinter einem Suchergebnis verfügbar.
- Die Suchmaschine A9.com[10], eine Amazon-eigene Suchmaschine, die Microsofts Suchtechnologie mit Amazons „Search Inside the Book“ verknüpft, zeigt auf der Basis eines noch kleinen, englischsprachigen Katalogs, wie sich in eingescannten Büchern, Bildern und Websites übergreifend suchen lässt.
- In Deutschland gibt es zwei große universitäre Digitalisierungszentren: in Göttingen und in München. Bis zum heutigen Tag (Mai 2006) wurden im Göttinger Digitalisierungszentrum 4.487.815 Seiten in 11.726 Bänden digitalisiert. Rund die Hälfte davon ist frei zugänglich. Das Göttinger Vorzeigeobjekt ist die Digitalisierung der Gutenberg-Bibel. Das Münchener Digitalisierungszentrum hat derzeit ca. 30 000 Titel frei zugänglich im Netz bereitgestellt.
- MINERVA
- die Internetprojekte Wikisource und Project Gutenberg
- Gallica
- The European Library eine europäische Initiative, die den Zugang zu den digitalisierten Werken der Mitgliedsländer verbessern soll.
- Auch große Verlage wie Random House (Bertelsmann) beginnen ihre Buchbestände zu digitalisieren und für Suchmaschinen auffindbar zu machen. Random House stellte im Februar 2007 Teile seiner Buchbestände (5.000 Titel, weitere sollen folgen) online. [11] Mit Insight ermöglicht das Unternehmen seinen Kunden eine festgelegte Anzahl von Seiten pro Titel zu durchsuchen. [12]
- Seit Oktober 2007 ist mit Zeno.org eine weitere Online-Bibliothek verfügbar.
- Libreka - Die deutsche Antwort des Börsenvereins des Deutschen Buchhandels auf Google Book Search
Siehe auch
- Bibliothek des Litterarischen Vereins in Stuttgart (Liste von Digitalisaten)
Belege
- ↑ Jen Grant: Judging Book Search by its cover. Nov. 2005.
- ↑ Punit Soni: Bringing history online, one newspaper at a time, googleblog.blogspot.com 8. September 2008
- ↑ Jens Redmer: The Bavarian State Library becomes largest non-English library partner. In: Inside Google Book Search. 06. März 2007. Abgerufen am 11. März 2007.
- ↑ Klaus Ceynowa: Der `BSB-Google-Deal`. Eine Million Bücher der Bayerischen Staatsbibliothek online in: BibliotheksMagazin. Mitteilungen aus den Staatsbibliotheken in Berlin und München, Nr. 1/2008, S. 3-7[1]
- ↑ Google digitalisiert Stadtbibliothek von Lyon , derstandard.at, 13. Juli 2008
- ↑ Michael Mönninger: Die Google-Bibliothek. in: Die Zeit. Hamburg 2005,32. ISSN 0044-2070
- ↑ Malte Herwig: Die entleibte Bibliothek. In Der Spiegel 12/2007, S. 186f.
- ↑ Beispiel einer via browseatwork.com verlinkbaren Seite
- ↑ Amazon „Search Inside a Book“
- ↑ A9.com
- ↑ Insight, newly launched digital search & browsing service to offer 5,000-plus Random House, Inc. U. S. titles (PDF), Pressemitteilung, 27. Februar 2007
- ↑ Insight Web Service, Random House
Literatur
- Jean-Noël Jeanneney: Googles Herausforderung. Für eine europäische Bibliothek. Mit einem neuen Vorwort des Autors zur dt. Ausg. Nachwort Klaus-Dieter Lehmann. Übers. Sonja Finck, Nathalie Mälzer-Semlinger. Stiftung Preuß. Kulturbesitz Berlin. Wagenbach-Verlag, Berlin-Hamburg 2006 (deutsche Ausg.) ISBN 3803125340 = Quand Google défie l'Europe. Plaidoyer pour un sursaut Paris: Mille et Une Nuits, 2005 (Origausg.) ISBN 2842059123 – Rezension auf www.romanistik.info – Rezension auf Bloogle
- Heiner Wittmann „Google print“ und die europäischen Reaktionen. Eine digitale Bibliothek der EU als Antwort? in: Dokumente. Zeitschrift für den deutsch-französischen Dialog H. 4, 2005, 63 ff.
- Dirk Lewandowski Die Search Engines erobern die Buchwelt (PDF), In: Password, Das deutsche Newsletter für Informationsprofis. Hattingen 11/2005, S. 29 ISSN 0930-3693
- Dirk Lewandowski: Google Buchsuche. Bücher kostenlos zum Download (PDF), In: Password, 10/2006, S.36
- Google Book Search Bibliography, digital-scholarship.org
Weblinks
- Google-Books
- Ist Google-Print eine Herausforderung für Europa?
- GooglePrint, umfangreiche Informationsseite
- Tipps und Tricks von Wikisource
- Daten zur Entwicklung
- Bibliographie englischer Publikationen
- Katalog der Titel, wichtige Ergänzung zur Google-Suche
- Beschluss der Europ. Kommission IP/05/528 vom 3.5.05 zur Errichtung einer Digitalen Europ. Bibliothek „TEL“
- Artikel v. Henning Hoff. in: Die Zeit. Mai 2005. ISSN 0044-2070
- Wischenbart: Wissen ist Macht. in: Perlentaucher.de, Mai 2005.
- Search Inside books from A9.com, Google.com and MSN Live Search
Google-Dienstleistungen (Projekte im Beta-Stadium siehe Google Labs)Suchen: (PageRank) • Books • Desktop • Produkte • Maps • Scholar • Groups • Web
Werbung: AdSense • AdWords • Analytics • DoubleClick
Kommunikation und Publishing: App Engine • Blogger • iGoogle • Kalender • Text & Tabellen • Knol • Gmail • Groups • Health • orkut • Panoramio • Reader • YouTube
Software: Browser Sync • Chrome • Desktop • Earth • Gears • Pack • Picasa • SketchUp • Talk • Toolbar • Updater
Wikimedia Foundation.