Webarchiv

Web-Archivierung ist das Sammeln und dauerhafte Ablegen von Netzpublikationen mit dem Zweck, in der Zukunft Öffentlichkeit und Wissenschaft einen Blick in die Vergangenheit bieten zu können.

Die größte internationale Einrichtung zur Web-Archivierung ist das Internet Archive in San Francisco (USA), das sich als Archiv des gesamten World Wide Web versteht. Staatliche Archive und Bibliotheken in vielen Ländern unternehmen Anstrengungen zur Sicherung der Netzüberlieferung in ihrem Bereich.

Die deutschen Archivgesetze definierten ab 1987 die Archivierung digitaler Unterlagen als Pflichtaufgabe der staatlichen Archive, die Umsetzung dieses Auftrags blieb aber zunächst mangelhaft. Im Jahr 2006 wurde das DNBG (Gesetz zur deutschen Nationalbibiliothek) verabschiedet, das den Auftrag der Deutschen Nationalbibliothek auf die Archivierung von Websites ausdehnt. Auch die Bundesländer planen, ihre Pflichtexemplar-Gesetze in diesem Sinne zu ändern oder haben die Änderung bereits vollzogen.

Archivierungsziele

Web-Archivierung verfolgt das Ziel, einen definierten Ausschnitt der im Internet vorhandenen Web-Präsenzen in systematischer Form abzubilden. Hierfür sind eine übergreifende Sammlungspolitik, ein Auswahlverfahren und die Häufigkeit der Archivierung vorab zu klären.

Eine archivierte Website sollte mit allen multimedialen Funktionen (HTML-Code, Stylesheets, JavaScript, Bilder und Video) auf Dauer erhalten werden. Der späteren Beschreibung, Nutzung und Erhaltung dienen Metadaten wie Provenienz, Übernahmezeitpunkt, MIME-Type und Umfang der Daten. Die Metadaten sichern Authentizität und Integrität der digitalen Archivalien.

Nach der Übernahme sind technische und juristische Vorkehrungen zu treffen, um eine ständige öffentliche Zugänglichkeit zu garantieren.

Auswahlverfahren

Unspezifisch

Bei diesem Auswahlverfahren wird eine ganze Domain nach und nach in ein Archiv geschrieben. Das Verfahren funktioniert wegen des großen Speicherbedarfs nur bei kleineren Domains (z. B. netarkivet.dk).

Auswahlliste

Eine Liste von Institutionen wird vorab festgelegt. Die Stabilität der mit den Institutionen verbundenen URLs ist regelmäßig zu prüfen.

Nutzung von Zugriffsstatistiken

In Zukunft ist ein "intelligentes" Harvesting denkbar, das aufgrund von Zugriffszählungen diejenigen Teile des Web (oder einer Auswahl) archiviert, die besonders hohe Zugriffsraten aufweisen.

Übernahmemethoden

Remote harvesting

Die üblichste Archivierungsmethode ist die Nutzung eines Web-Crawlers. Ein Web-Crawler ruft die Inhalte einer Website wie ein menschlicher Nutzer ab und schreibt die Ergebnisse in ein Archivobjekt. Die Ausgangsstruktur auf dem Server lässt sich dabei im Archiv nur selten exakt nachbauen.

Beispiele sind:

Heritrix
HTTrack
Offline Explorer

Archivierung des „Hidden Web“

Das "Hidden Web" oder "Deep Web" bezieht sich auf Datenbanken, die oft die eigentlichen Inhalte einer Website repräsentieren und nur auf Anfrage eines Nutzers ausgegeben werden. Zur Übernahme dieser Datenbanken ist eine Schnittstelle erforderlich, die meist auf XML beruht. Für einen solchen Zugang sind die Tools DeepArc (Bibliothèque nationale de France) und Xinq (National Library of Australia) entwickelt worden.

Transactional archiving

Dieses Verfahren dient der Archivierung der Ergebnisse eines Nutzungsprozesses von Websites. Es ist für Einrichtungen von Bedeutung, die aus rechtlichen Gründen einen Nachweis über ihre Nutzung zu führen haben. Voraussetzung ist die Installation eines Zusatzprogramms auf dem Webserver.

Siehe auch

Weblinks

International Internet Preservation Consortium (IIPC) – Internationales Konsortium mit der Aufgabe, Informationen und Wissen aus dem Internet für künftige Generationen zu übernehmen, zu erhalten und zugänglich zu machen
International Web Archiving Workshop (IWAW) – Jährlich stattfindender Workshop zur Web-Archivierung
The Library of Congress, Digital Collections and Programs
Library of Congress, Web Capture
Web archiving bibliography – Literaturliste zur Web-Archivierung
Web archiving discussion list – Diskutiert technische, organisatorische und rechtliche Fragen der Web-Archivierung
WebArchivist – Wissenschaftler, Bibliothekare und Archivare arbeiten an der Erhaltung und Analyse von Web-Ressourcen
Arbeitskreis Elektronische Archivierung der Vereinigung Deutscher Wirtschaftsarchivare(AKEA)
Umsetzungen von Web-Archivierung:

Wikimedia Foundation.

Игры ⚽ Поможем сделать НИР

Schlagen Sie auch in anderen Wörterbüchern nach:

Britische Beteiligung am Krieg in Afghanistan — Das Vereinigte Königreich beteiligt sich militärisch und zivil umfangreich an der westlichen Intervention in Afghanistan seit 2001, die militärische Präsenz in dem Land ist die zweitstärkste nach der der Vereinigten Staaten. Die Operationen der… … Deutsch Wikipedia
Jürgen-Peter Graf — (* 22. Dezember 1952 in Oberkirch (Baden)) ist Richter am deutschen Bundesgerichtshof. Sein Abitur bestand er 1971 am heutigen Hans Furler Gymnasium in Oberkirch. Nach Erfüllung seiner Wehrpflicht begann er 1972 das Studium der… … Deutsch Wikipedia
Emrah — Erdoğan (* 1. Januar 1971 in Ergani, Provinz Diyarbakır), auch bekannt unter seinem Künstlernamen Emrah, ist ein türkischer Sänger und Schauspieler. Er benutzt den Geburtsnamen seiner Mutter İpek als seinen Nachnamen. Emrah verlor seinen Vater im … Deutsch Wikipedia
Landesvermessungsamt Baden-Württemberg — Das Landesvermessungsamt Baden Württemberg war bis 31. Dezember 2008 eine Obere Landesbehörde für die öffentlichen Aufgaben des amtlichen Vermessungswesens, insbesondere der Landesvermessung und des Liegenschaftskatasters im Bundesland Baden… … Deutsch Wikipedia
Ministerium für Ernährung, Landwirtschaft und Forsten Baden-Württemberg — Das Ministerium für Ernährung und Ländlichen Raum Baden Württemberg, kurz MLR, ist eines von zehn Ministerien in der Landesverwaltung des Bundeslandes Baden Württemberg. Von 1952 bis 1953 hieß es „Ministerium für Landwirtschaft und Ernährung“,… … Deutsch Wikipedia
Ministerium für Ernährung und Ländlichen Raum Baden-Württemberg — Das Ministerium für Ernährung und Ländlichen Raum Baden Württemberg, kurz MLR, ist eines von zehn Ministerien in der Landesverwaltung des Bundeslandes Baden Württemberg. Von 1952 bis 1953 hieß es „Ministerium für Landwirtschaft und Ernährung“,… … Deutsch Wikipedia
Nilüfer Yumlu — (* 31. Mai 1955 in Cihangir, Istanbul), bekannt als Nilüfer, ist eine türkische Popsängerin. Sie nahm am 22. April 1978 mit dem Lied Sevince gemeinsam mit der Band Nazar am 23. Grand Prix Eurovision de la Chanson in Paris teil und belegte dabei… … Deutsch Wikipedia
Post und Telekom Austria — AG Rechtsform Aktiengesellschaft (Österreich) Gründung 1996 … Deutsch Wikipedia
Liste der Kriegsfischkutter — Diese Liste der Kriegsfischkutter dient als ergänzende Information zum Hauptartikel Kriegsfischkutter. Der Überblick zu den Nachkriegsbauten findet sich in der Liste der Kriegsfischkutter (Nachkriegsbau) ein Überblick zu Marinekennungen und… … Deutsch Wikipedia
Niedersächsische Landeszentrale für politische Bildung — Staatliche Ebene Land Niedersachsen Hauptsitz Hannover Behördenleitung Heinz Wunderlich Anzahl der Bediensteten 32[1] … Deutsch Wikipedia

Academic dictionaries and encyclopedias

Webarchiv

Inhaltsverzeichnis

Archivierungsziele

Auswahlverfahren

Unspezifisch

Auswahlliste

Nutzung von Zugriffsstatistiken

Übernahmemethoden

Remote harvesting

Archivierung des „Hidden Web“

Transactional archiving

Siehe auch

Weblinks

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Academic dictionaries and encyclopedias

Deutsch Wikipedia

Webarchiv

Inhaltsverzeichnis

Archivierungsziele

Auswahlverfahren

Unspezifisch

Auswahlliste

Nutzung von Zugriffsstatistiken

Übernahmemethoden

Remote harvesting

Archivierung des „Hidden Web“

Transactional archiving

Siehe auch

Weblinks

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Direct link