Google Buchsuche

Google Buchsuche
Hamlet, Originalausgabe

Google Book Search (ehemals: Google Print), im deutschsprachigen Raum auch Google Buchsuche, ist eine Dienstleistung des US-amerikanischen Unternehmens Google Inc. mit dem Ziel, das in Büchern gespeicherte Wissen der Welt vorwiegend durch Digitalisierung für die Volltextsuche verfügbar zu machen. Google Buchsuche befindet sich derzeit in einer öffentlichen Betaphase (Stand: Mai 2008).

Inhaltsverzeichnis

Beschreibung

Google Book Search speist sich aus zwei Quellen: Google Print im engeren Sinn, dem – nicht weiter kontroversen – Kooperationsprojekt mit Verlagen, und dem juristisch umstrittenen Google Library, bei dem Bücher großer akademischer Bibliotheken ohne Zustimmung der Rechteinhaber massenweise gescannt werden.

Geschichte

Im Oktober 2004 stellte sich der auf die Buchverlage ausgerichtete Aspekt auf der Frankfurter Buchmesse von Google Print vor (Pressekonferenz mit den Firmengründern Sergey Brin und Larry Page). Erste Berichte über Google Print gab es im gleichen Monat. Im Dezember 2004 begannen Suchergebnisse aus gescannten Büchern in den Ergebnislisten der englischen Suchoberfläche Google.com zu erscheinen. Google möchte bis 2015 15 Millionen Bücher (entspricht 4,5 Milliarden Seiten) gescannt haben.

Seit April 2005 existiert eine eigene Suche für die Inhalte des Programms.

Im Oktober 2005 präsentierte man zur Frankfurter Buchmesse deutsche und anderssprachige Benutzungsoberflächen.

Am 4. November 2005 wurde die Suchseite, nunmehr mit einer Möglichkeit der Abfrage nach Zeiträumen in der erweiterten Suche versehen, offiziell vorgestellt.

Am 17. November 2005 kündigte Google die Umbenennung des Dienstes in seinem Firmen-Weblog an. [1] Zu diesem Zeitpunkt leiteten Anfragen von print.google.com nach books.google.com um.

Im September 2008 kündigte Google an, gemeinsam mit nordamerikanischen Zeitungsverlagen Zeitungen zu digitalisieren. Die Digitalisate sollen durchsuchbar sein, mit dem Webbrowser navigierbar und erscheinen wie in der Printausgabe mitsamt den Fotographien, Schlagzeilen und Werbeanzeigen. [2]

Kooperation mit den Verlagen

Google erhält von den Verlagen Bücher oder PDF-Dateien zugesandt. Die Bücher werden gescannt und durch OCR als E-Texte in den Index aufgenommen. Nutzer können jeweils nur vergleichsweise wenige Seiten des einzelnen Buchs einsehen. Nach einigen Seiten können nur (kostenfrei) registrierte Nutzer eine Anzahl weiterer Seiten einsehen. Eine Reihe von Seiten ist von vornherein für den Zugriff gesperrt. Nach Erschöpfung des Tageskontingents können keine weiteren Seiten betrachtet werden. Frei zugänglich sind in der Regel das Inhaltsverzeichnis, nicht selten auch das Register.

Google versucht die Inhalte durch eine Art Kopierschutz (sogenanntes „Digital Rights Management“) zu schützen.

Kooperation mit Bibliotheken

Google hat vor, in den nächsten Jahren den kompletten Bestand der Bibliothek der University of Michigan (über 7 Millionen Bände) einzuscannen sowie große Teile der US-Universitätsbibliotheken Harvard und Stanford, der New York Public Library und in Europa der Bodleian Library der Oxford University. Auch die Bibliotheken der Universitäten in Virginia, Wisconsin-Madison, Princeton, Kalifornien sowie in Texas-Austin beteiligen sich.

Ende 2006 traten zwei weitere Institutionen dem Verbund der Bibliotheken bei, die Bücher bei Google digitalisieren lassen: Die Nationalbibliothek von Katalonien, Biblioteca de Catalunya in Barcelona und die Bibliothek der Universidad Complutense Madrid. Reg Carr, Leiter der Bodleian Library, der bis dahin einzigen europäischen Partner-Bibliothek, begrüßte die beiden neuen Teilnehmer begeistert und wies die Einwände gegen das Projekt zurück.

Am 6. März 2007 gab die Bayerische Staatsbibliothek in München bekannt, als erste deutsche Bibliothek mit dem Projekt zu kooperieren. Es sollen nun etwa eine Million urheberrechtsfreier Werke aus den historischen Beständen und aus Spezialsammlungen digitalisiert werden.[3] Ausgenommen von dem Digitalisierungsprojekt sind nur die Handschriften- und Inkunabelbestände sowie seltene und besonders wertvolle historische Drucke.[4]

Im Juli 2008 gab die Bibliothèque Municipale de Lyon als erste französische Bibliothek bekannt ihre Bücher digitalisieren zu lassen.[5]

Heftige Kritik von Autoren- und Verlegerseite hat Google dazu gebracht, das Scannen von urheberrechtlich geschützten Büchern bis November 2005 auszusetzen. Bis zu diesem Zeitpunkt sollten die Rechteinhaber angeben, welche Bücher sie nicht zugänglich gemacht haben möchten (Opt-Out-Lösung). Während Google sich auf den fair use des US-Rechts beruft und dabei von renommierten Juristen unterstützt wird, fordern die Verleger und Autorenverbände, dass kein Buch ohne Zustimmung ins Programm eingestellt wird (Opt-In). Im Oktober 2005 wurden in den USA Klagen von Autoren und Verlegern gegen Google eingereicht.

Stellungnahmen und Kritik

Scanfehler in 2008 in der Bayerischen Staatsbibliothek München von Google gescanntem Buch

Durch Googles Projekt sind die traditionellen Träger kostenfreier Digitalisierung, vor allem die Bibliotheken, unter Druck geraten. Grundsätzlich begrüßt man die Möglichkeit, riesige Buchbestände kostenfrei im Volltext durchsuchen und gemeinfreie ältere Bücher vollständig lesen zu können.

Der vehementeste Kritiker in Europa ist der ehemalige Direktor der Französischen Nationalbibliothek, Jean-Noël Jeanneney, der mit Gallica das ambitionierteste freie europäische Digitalisierungsprojekt betreibt. Er befürchtet, dass durch die englischsprachige Ausrichtung des Projekts die europäischen Sprachen ins Hintertreffen geraten könnten und warnt vor der „Google-Arroganz“ und der Dominanz einer Hypermacht.[6] Der Historiker Jeanneney plädiert dafür, dass Europa eine Alternative zum Google-Digitalisierungsprojekt auf die Beine stellt. An Google kritisiert er vor allem die Hegemonie des Englischen und den Kumulationseffekt (bei ihm genannt die „Blickfang-Methode“, üblich ist der Begriff „Ranking“, siehe: PageRank), der dazu führe, dass im Kampf um die Aufmerksamkeit des Lesers eine gewollte Konzentration auf die Listenführer stattfinde. Der stärkere Anbieter wird immer noch stärker auf Kosten des Schwächeren. Dadurch werde Google besonders für die Werbung wichtig. Diesem „kapitalistischen“ Google-Prinzip möchte Jeanneney ein Modell entgegensetzen, bei dem der Staat das Sagen in Dingen des kulturellen Gedächtnisses hat. 19 National- und Universitäts-Bibliotheken in Europa haben den Appell der französischen Nationalbibliothek unterzeichnet, um eine drohende geistige und kulturelle Vorherrschaft der USA zu verhindern.

Kritiker bemängelten an Google Library, dass die Partnerbibliotheken mit Knebelverträgen über den Tisch gezogen wurden. Aus bibliothekarischer Sicht werden die oft miserable OCR-Qualität[7] und die mangelhaften Metadaten bemängelt. Die Suchmaschine behält den gesamten Digitalisierungsprozess als Betriebsgeheimnis in der Hand und schließt die Mitarbeiter der Universitäten systematisch aus; sie haben keinen Zugang zu den Räumen des Scan-Projekts und etwaige Fenster sind abgeklebt.

Europäische Nutzer beschweren sich darüber, dass Google für US-Nutzer alle vor 1923 erschienenen Bücher frei zugänglich macht, bei Nicht-US-Nutzern aber alle Bücher nach 1864 als unfrei behandelt, obwohl darunter sehr viele Bücher sind, die in allen Staaten der Welt Public Domain sein dürften (siehe: Regelschutzfrist). Auch bezeichnet Google reine Reprints gemeinfreier Werke als copyrighted material, was zumindest nach US-Recht eine unbegründete Anmaßung (Copyfraud) darstellen dürfte.

Bücher, die nur US-Bürgern zugänglich sind, können mittels eines in den USA ansässigen Proxyservers trotzdem weltweit eingesehen werden. [8]

Bücher aus der Universitätsbibliothek von Michigan sind außer bei Google auch über den OPAC Mirlyn zugänglich. Dort kann auch der OCR-Text der einzelnen Seiten abgerufen werden.

Weitere Projekte

  • Die Open Content Alliance u.a. mit Konkurrent Yahoo, dem Internetarchiv und der University of California hat im Rahmen der Open Library in großem Umfang Bücher katalogisiert und digitalisiert, als Open Content und unter strikter Wahrung des Urheberrechts.
  • Auch der Konkurrent und mögliche Partner von Google, das Internet-Versandhaus Amazon bietet gescannte Bücher im Volltext an, konzentriert sich jedoch auf aktuell im Handel erhältliche Bücher, und will damit den Verkauf gedruckter Bücher fördern. Mit seiner Suche „Search Inside a Book“ [9] macht Amazon Titelseite, Klappentext, Inhaltsverzeichnis, Register und zwei Seiten vor und hinter einem Suchergebnis verfügbar.
  • Die Suchmaschine A9.com[10], eine Amazon-eigene Suchmaschine, die Microsofts Suchtechnologie mit Amazons „Search Inside the Book“ verknüpft, zeigt auf der Basis eines noch kleinen, englischsprachigen Katalogs, wie sich in eingescannten Büchern, Bildern und Websites übergreifend suchen lässt.
  • In Deutschland gibt es zwei große universitäre Digitalisierungszentren: in Göttingen und in München. Bis zum heutigen Tag (Mai 2006) wurden im Göttinger Digitalisierungszentrum 4.487.815 Seiten in 11.726 Bänden digitalisiert. Rund die Hälfte davon ist frei zugänglich. Das Göttinger Vorzeigeobjekt ist die Digitalisierung der Gutenberg-Bibel. Das Münchener Digitalisierungszentrum hat derzeit ca. 30 000 Titel frei zugänglich im Netz bereitgestellt.
  • MINERVA
  • die Internetprojekte Wikisource und Project Gutenberg
  • Gallica
  • The European Library eine europäische Initiative, die den Zugang zu den digitalisierten Werken der Mitgliedsländer verbessern soll.
  • Auch große Verlage wie Random House (Bertelsmann) beginnen ihre Buchbestände zu digitalisieren und für Suchmaschinen auffindbar zu machen. Random House stellte im Februar 2007 Teile seiner Buchbestände (5.000 Titel, weitere sollen folgen) online. [11] Mit Insight ermöglicht das Unternehmen seinen Kunden eine festgelegte Anzahl von Seiten pro Titel zu durchsuchen. [12]
  • Seit Oktober 2007 ist mit Zeno.org eine weitere Online-Bibliothek verfügbar.
  • Libreka - Die deutsche Antwort des Börsenvereins des Deutschen Buchhandels auf Google Book Search

Siehe auch

Belege

  1. Jen Grant: Judging Book Search by its cover. Nov. 2005.
  2. Punit Soni: Bringing history online, one newspaper at a time, googleblog.blogspot.com 8. September 2008
  3. Jens Redmer: The Bavarian State Library becomes largest non-English library partner. In: Inside Google Book Search. 06. März 2007. Abgerufen am 11. März 2007.
  4. Klaus Ceynowa: Der `BSB-Google-Deal`. Eine Million Bücher der Bayerischen Staatsbibliothek online in: BibliotheksMagazin. Mitteilungen aus den Staatsbibliotheken in Berlin und München, Nr. 1/2008, S. 3-7[1]
  5. Google digitalisiert Stadtbibliothek von Lyon , derstandard.at, 13. Juli 2008
  6. Michael Mönninger: Die Google-Bibliothek. in: Die Zeit. Hamburg 2005,32. ISSN 0044-2070
  7. Malte Herwig: Die entleibte Bibliothek. In Der Spiegel 12/2007, S. 186f.
  8. Beispiel einer via browseatwork.com verlinkbaren Seite
  9. Amazon „Search Inside a Book“
  10. A9.com
  11. Insight, newly launched digital search & browsing service to offer 5,000-plus Random House, Inc. U. S. titles (PDF), Pressemitteilung, 27. Februar 2007
  12. Insight Web Service, Random House

Literatur

Weblinks


Wikimedia Foundation.

Игры ⚽ Нужна курсовая?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Google Bücher — books.google.de Kommerziell Ja Beschreibung Online Buchsuche Eigentümer …   Deutsch Wikipedia

  • Google Book Search — Hamlet, Originalausgabe Google Book Search (ehemals: Google Print), im deutschsprachigen Raum auch Google Buchsuche, ist eine Dienstleistung des US amerikanischen Unternehmens Google Inc. mit dem Ziel, das in Büchern gespeicherte Wissen der Welt… …   Deutsch Wikipedia

  • Google Books — Hamlet, Originalausgabe Google Book Search (ehemals: Google Print), im deutschsprachigen Raum auch Google Buchsuche, ist eine Dienstleistung des US amerikanischen Unternehmens Google Inc. mit dem Ziel, das in Büchern gespeicherte Wissen der Welt… …   Deutsch Wikipedia

  • Google Print — Hamlet, Originalausgabe Google Book Search (ehemals: Google Print), im deutschsprachigen Raum auch Google Buchsuche, ist eine Dienstleistung des US amerikanischen Unternehmens Google Inc. mit dem Ziel, das in Büchern gespeicherte Wissen der Welt… …   Deutsch Wikipedia

  • Google-Dienstleistungen — 37.422222222222 122.084444444447Koordinaten: 37° 25′ 20″ N, 122° 5′ 4″ W …   Deutsch Wikipedia

  • Google.org — 37.422222222222 122.084444444447Koordinaten: 37° 25′ 20″ N, 122° 5′ 4″ W …   Deutsch Wikipedia

  • Google Inc. — 37.422222222222 122.08444444444 Koordinaten: 37° 25′ 20″ N, 122° 5′ 4″ W Google Inc …   Deutsch Wikipedia

  • BLVS — Die Bibliothek des Litterarischen Vereins in Stuttgart (kurz BLVS oder BLV, seltener StLV) ist eine Buchreihe mit Ausgaben hauptsächlich deutscher Literatur des Mittelalters und der Frühen Neuzeit, die 1842 begründet wurde und bis heute in… …   Deutsch Wikipedia

  • Bibliothek des Literarischen Vereins in Stuttgart — Die Bibliothek des Litterarischen Vereins in Stuttgart (kurz BLVS oder BLV, seltener StLV) ist eine Buchreihe mit Ausgaben hauptsächlich deutscher Literatur des Mittelalters und der Frühen Neuzeit, die 1842 begründet wurde und bis heute in… …   Deutsch Wikipedia

  • Bibliothek des Litterarischen Vereins in Stuttgart — Die Bibliothek des Litterarischen Vereins in Stuttgart (kurz BLVS oder BLV, seltener StLV) ist eine Buchreihe mit Ausgaben hauptsächlich deutscher Literatur des Mittelalters und der Frühen Neuzeit, die 1842 begründet wurde und bis heute in… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”