Million Book Project

Million Book Project
Internet Archive in San Francisco
Internet Archive in der Bibliotheca Alexandrina. Hinter den Glasscheiben stehen die Racks mit den Archivcomputern.

Das Internet Archive in San Francisco ist ein gemeinnütziges Projekt, das 1996 von Brewster Kahle gegründet wurde. Es hat sich die Langzeitarchivierung digitaler Daten in frei zugänglicher Form zur Aufgabe gemacht.

Es speichert Momentaufnahmen von Webseiten, Usenet-Beiträgen, Filmen, Tonaufnahmen (hauptsächlich von Live-Konzerten), Büchern und Software. Ein Mirror der Daten von San Francisco befindet sich in der Bibliotheca Alexandrina.

Inhaltsverzeichnis

Dienste

Zum Archiv gehört auch die Wayback Machine, mit der man die gespeicherten Webseiten in verschiedenen Versionen abrufen kann. Die Auswahl der zu speichernden Seiten erfolgt über den Dienst Alexa Internet. Alle dort hinterlegten URLs werden regelmäßig aufgerufen und archiviert. Der Gesamtumfang beträgt etwa 85 Milliarden Seiten (Stand: März 2007). Die Seiten werden erst ca. 6 Monate nach dem Indexieren öffentlich verfügbar gemacht.

In dem „Million Book Project“ werden durch das Internet Archive Bücher, die durch das Ablaufen des Copyrights (us-amerikanisches Urheberrecht) oder aus anderen Gründen gemeinfrei geworden sind, digitalisiert und in den Dateiformaten DjVu, TIFF und PDF zum Herunterladen zur Verfügung gestellt.

Es werden mehrere Scan-Center (2009 insgesamt 12) unterhalten, zum Beispiel in Richmond. Gescant wird per Auftrag, berechnet werden pro Seite zehn US-Cent (Stand 2009). Die Auftraggeber, meist Bibliotheken, erhalten das Digitalisat, eine per OCR erstellte Textdatei, eine persistente Internetadresse sowie die Möglichkeit, die Digitalisate auf den Servern des Vereins zu hosten.[1] Weiterhin bestehen Kooperationsvereinbarungen mit selbst digitalisierenden Bibliotheken für einzelne Dienste, wie OCR und reduntantes Hosting.

Die Library of Congress hat im Dezember 2006 sechs Ausnahmen des US-Copyright-Gesetzes Digital Millennium Copyright Act gewährt[2]. Das Internet Archive darf somit Computer-Software oder -Spiele mit der Absicht der Erhaltung speichern, wenn die Originalhardware, -formate oder -technologie veraltet sind.

Das Archiv hat eine geschätzte Größe von drei Petabyte und wächst um ca. 100 Terabyte pro Monat[3]. Das Archiv ist vom US-Bundesstaat Kalifornien seit Anfang Mai 2007 offiziell als Bibliothek anerkannt.[4]

Kritik

Problematisch an der Wayback Machine ist einerseits, dass auch Inhalte erhalten bleiben, die die Autoren nicht mehr vertreten. Auch rechtswidrige Inhalte, etwa üble Nachreden, werden über Jahre der Öffentlichkeit zugänglich gemacht. Dies lässt sich jedoch durch eine entsprechende robots.txt-Datei im Stammverzeichnis der Domain beheben. Andererseits wird nicht alles gesichert, beispielsweise werden Bilder von Internetseiten häufig nicht mitgesichert und stehen nach dem Verschwinden der Originalseite nicht mehr zur Verfügung.

Quellen

  1. http://www.zeit.de/2008/04/OdE13-Wissen?page=2 Das digitale Alexandria, Die Zeit 4/2008
  2. Internet Archive wins copyright reprieve, The Register, 1. Dezember 2006
  3. Internet Archive to unveil massive Wayback Machine data center, Computerworld, abgerufen am 26. März 2009
  4. Internet Archive officially a library

Siehe auch

Weblinks


Wikimedia Foundation.

Игры ⚽ Нужно решить контрольную?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Million Book Project — The Million Book Project (or the Universal Library), is a book digitization project, led by Carnegie Mellon University School of Computer Science and University Libraries.[1] Working with government and research partners in India (Digital Library …   Wikipedia

  • Project Azorian — Hughes Glomar Explorer Coordinates …   Wikipedia

  • Project Stormfury — was an attempt to weaken tropical cyclones by flying aircraft into them and seeding with silver iodide. The project was run by the United States Government from 1962 to 1983.The hypothesis was that the silver iodide would cause supercooled water… …   Wikipedia

  • Project Mercury — Duration 1959 1963 Goal Place Americans into orbit for as long as one day Achievements First manned flight: May 5, 1961 First orbital flight …   Wikipedia

  • Project Habakkuk — or Habbakuk (spelling varies; see below) was a plan by the British in World War II to construct an aircraft carrier out of pykrete (a mixture of wood pulp and ice), for use against German U boats in the mid Atlantic, which were beyond the flight… …   Wikipedia

  • Project Cadmus — Publication information Publisher DC Comics First appearance Superman s Pal Jimmy Olsen #133 (October 1970) Created by …   Wikipedia

  • Project for the New American Century — Formation 1997 Extinction 2006 Type Public policy think tank …   Wikipedia

  • Project Cyclops — [http://ntrs.nasa.gov/archive/nasa/casi.ntrs.nasa.gov/19730010095 1973010095.pdf NASA Technical Report CR 114445 Project Cyclops: A design study of a system for detecting extraterrestial intelligent life] . 14.5 MB pdf file.] was a 1971 NASA… …   Wikipedia

  • Project Coast — was a top secret chemical and biological weapons (CBW) program instituted by the South African government during the apartheid era. Project Coast was the successor to a limited post war CBW program which mainly produced the lethal agents CX… …   Wikipedia

  • Million Pound Property Experiment — was a television series in 2003–2004 which aired on BBC Two in the United Kingdom in which designers Colin McAllister and Justin Ryan bought, renovated and re sold properties for a profit. This, as they gambled with a £100,000 loan from the BBC,… …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”