- 404 error
-
Ein toter oder defekter Verweis, bzw. engl Link, oder auch Dead Link ist ein Hyperlink im World Wide Web, der auf eine nicht (mehr) vorhandene Ressource (zum Beispiel eine Webseite oder Datei) zeigt. Beim Anwählen der URL eines solchen Verweises liefert der Webserver normalerweise eine Fehlerseite mit dem HTTP-Statuscode 404 Not Found, was bedeutet, dass die angeforderte Datei nicht gefunden wurde. Umgangssprachlich bezeichnet man aber auch Verweise, welche auf Seiten mit anderen Fehlerkennungen, wie z. B. 403 Forbidden oder 500 Server Error oder auf einen komplett nicht erreichbaren Zielrechner verweisen, als defekte Verweise.
Verweise auf nicht existierende Stellen sind auch aus gedruckten Nachschlagewerken bekannt.
Inhaltsverzeichnis
Ursachen
Tote Links sind ein bislang ungelöstes Problem des Hypertextes und im Kern darauf zurückzuführen, dass das Internet ein dezentrales Netzwerk ist. Daher kann die Integrität desselbigen niemals sichergestellt werden.
Die Gründe für das Existieren von toten Links können sehr unterschiedlich sein und vor allem an sehr unterschiedlichen Stellen auftreten. In der Praxis häufig anzutreffende Gründe sind unter anderem:
- Die Datei, auf die die URL verweist, ist verschoben, umbenannt oder gelöscht worden.
- Der Link auf der Ursprungseite ist fehlerhaft angegeben, beispielsweise bei der Groß- oder Kleinschreibung im URL-Bestandteil (URLs sind case sensitive) nach der Angabe des Domainnamens.
- Die gesuchte Domain ist neu bei einem Registrar vergeben worden und die Website selber noch ohne jeden Inhalt.
- Der Webserver ist nicht (mehr) erreichbar, beispielsweise wegen Netzproblemen oder weil der Rechner abgeschaltet ist.
- Der Host- bzw. Domainname der URL existiert nicht (mehr) oder kann nicht im DNS aufgelöst werden.
Auswirkung
Die Problematik bei nicht mehr vorhandenen URLs liegt im Wesentlichen daran, dass verlinkende Seiten von der Nichtexistenz nicht informiert werden bzw. nicht informiert werden können. So haben vor allem Suchmaschinen oft noch Webseiten indiziert, die seit Wochen oder Monaten nicht mehr existieren.
Tote Links wirken sich bei Suchmaschinen auch auf die Qualität der Suchergebnisse aus. Bei einigen Berechnungsmethoden des PageRanks, ein von dem Suchmaschinenbetreiber Google eingeführtes Verfahren zur Gütebestimmung von Webseiten, spielen tote Links eine Rolle (Lösung eines Eigenvektorproblems) und werden vor der Berechnung zunächst entfernt. Üblicherweise werden sie im letzten Schritt des numerischen Iterationsprozesses jedoch wieder eingefügt, so dass auch diesen Seiten ein PageRank zugewiesen wird.
Lösungsmöglichkeiten
Eine Möglichkeit, die allerdings eher die Symptome der Dead Links bekämpft, ist die Wayback Machine des Internetarchivs. Durch chronologische Kopien von Webseiten kann Zugriff auf teilweise längst nicht mehr im Original vorhandene Webseiten gewährt werden.
Ursachenbekämpfung betreiben hingegen Gremien wie das W3C mit der Kampagne Cool URIs don't change[1], die in der Öffentlichkeit das Bewusstsein für die Notwendigkeit persistenter URLs wecken. Zudem gibt es bereits Systeme, die das Ziel von unabänderlichen URLs verfolgen, beispielsweise das des Persistent Uniform Resource Locators.
Mythos der Entstehung
Der Fehlercode "404" soll dadurch entstanden sein, dass in der Anfangszeit des Internets der Server, der diesen Fehler durch fehlende Dateien hervorrief, im Raum 404 im CERN stand, wo der Ursprung des Internets zu finden ist. Diese Geschichte ist jedoch als eine Urban Legend einzustufen. In Wirklichkeit basiert der Fehlercode auf keiner lebendigen Geschichte wie dieser.
Einzelnachweise
Weblinks
- w3.org – Status Code Definitions Statuscode-Definition
Beispiele toter Links
- http://www.example.com/Gibt-es-nicht.html – Toter Link (inexistente Webseite) auf example.com
- ftp://gibt-es-nicht.example.com/ – nicht erreichbare (Sub-)Domain
Wikimedia Foundation.