- Protokoll-Datei
-
Eine Logdatei (engl. log file) beinhaltet das automatisch erstellte Protokoll aller oder bestimmter Aktionen von Prozessen auf einem Computersystem. Die korrekte Bezeichnung dafür ist deshalb Protokoll-Datei.
Wichtige Anwendungen finden sich vor allem im Bereich der Prozess-Kontrolle und im Automatisierungsbereich. Prinzipiell werden alle Aktionen mitgeschrieben, für die ein späteres Audit erforderlich ist oder sein könnte. Der Flugschreiber in Flugzeugen ist ein gutes Beispiel für erforderliche kontinuierliche Protokollierung, bei der jedoch eine Auswertung nur sehr selten durchgeführt wird.
Inhaltsverzeichnis
Grundlagen
Auf einem PC können Protokoll-Dateien bestimmter Aktionen von einem oder mehreren Nutzern an einem Rechner erstellt werden, ohne dass diese es bemerken oder ihre Arbeit beeinflusst wird. Wesentlich ist hierzu das System-Logbuch (unter Linux meist in /var/log/messages, aber auch Windows NT und Nachfolger schreiben entsprechende Einträge in eines oder mehrere Ereignisprotokolle), wenn entsprechend konfiguriert. Darin können u. a. die Anmeldungen am System protokolliert werden, aber auch weitere wichtige Informationen.
Neben dem Betriebssystem selbst schreiben meist Hintergrundprogramme (z. B. ein E-Mail-Server, ein Proxyserver und anderes) in eine Logdatei, um Aktionsmeldungen, Fehlermeldungen und Hinweise persistent verfügbar zu halten. Ähnliches gilt für Installations-Programme, Virenscanner und dergleichen.
Logdateien werden auch von Webservern erstellt, können aber auch außerhalb des Internets bei Untersuchungen der Benutzerfreundlichkeit von Programmen oder allgemeinem Nutzerverhalten in einem System genutzt werden.
Kann man selber auf einem Server mit der eigenen Webpräsenz keine Protokoll-Dateien abrufen, dann ermöglichen verschiedene Webdienste (z. B. Nedstat[1] oder W3 Statistics[2]) das Setzen eines kleinen Zählers auf der eigenen Webpräsenz. Dieser Zähler wird immer wieder beim Abrufen der Seite vom Anbieter-Server geladen, wo darauf hin eine Auswertung der Zugriffe mithilfe der Zugriffs-Protokoll-Datei in Form von Tabellen und Grafiken erstellt wird.
Die Logdatei wird bei der Logdateianalyse untersucht.
Das Wort Logfile wird in Teilen der Blogosphäre zunehmend auch als Begriff für einen Weblog-Eintrag genutzt. Mit dieser Bedeutung wurde der Begriff zunächst nur von Log-Files.de[3] verwendet, inzwischen ist er gerade bei Weblogs mit reinem Tagebuch-Charakter beliebt.
Prinzipieller Aufbau einer Protokollzeile in einer Logdatei
Datum/Uhrzeit Ereignis
Beispiel einer typischen Protokoll-Datei
2006-10-14 12:28:58 Setup version: Inno Setup version 5.1.8
Bei dem Beispiel handelt es sich um die Startmeldung in der Protokoll-Datei eines Installationsprogrammes (Inno Setup) unter Windows.
Beispiel einer typischen Webserver-Logdatei
183.121.143.32 - - [18/Mar/2003:08:04:22 +0200] "GET /images/logo.jpg HTTP/1.1" 200 512 "http://www.wikipedia.org/" "Mozilla/5.0 (X11; U; Linux i686; de-DE;rv:1.7.5)" 183.121.143.32 - - [18/Mar/2003:08:05:03 +0200] "GET /images/bild.png HTTP/1.1" 200 805 "http://www.google.org/" ...
Teilbereiche eines Eintrages einer typischen Webserver-Logdatei:
- Wer? - 183.121.143.32 - anfordernde Host-Adresse
- Wer genau? Benutzername falls notwendig ansonsten "-"
- Passwort? falls Benutzername dann auch Passwort ansonsten auch "-"
- Wann? - [18/Mar/2003:08:04:22 +0200] - Zeitstempel (Datum, Uhrzeit, Zeitverschiebung)
- Was? - "GET /images/logo.jpg HTTP/1.1" - Anforderung, eines Bildes, Übertragungsprotokoll
- Ok? - 200 - Statusnummer (200=Erfolgreiche Anfrage; vgl. HTTP-Statuscodes)
- Wie viel? - 512 - Menge der gesendeten Daten (Byte)
- Woher? - "http://www.wikipedia.org/" - Von welcher Internetseite wird angefordert
- Womit? - "Mozilla/5.0 (X11; U; Linux i686; de-DE; rv:1.7.6)" - Mit welchem Browser/Betriebssystem/Oberfläche
Bemerkung: das Woher? und Womit? entspricht nicht dem "Common Logfile Format" [1].
Zulässigkeit in Deutschland
Nach § 15 des deutschen Telemediengesetzes dürfen Diensteanbieter personenbezogene Daten eines Nutzers nur erheben und verwenden, soweit dies erforderlich ist, um die Inanspruchnahme von Telemedien zu ermöglichen und abzurechnen. Über das Ende des Nutzungsvorgangs hinaus dürfen Nutzungsdaten nur gespeichert werden, soweit sie für Zwecke der Abrechnung mit dem Nutzer erforderlich sind. Auf dieser Grundlage hat das Amtsgericht Berlin 2007 entschieden[4], dass die Protokollierung der IP-Adressen der Benutzer eines öffentlich zugänglichen Internetportals unzulässig ist, wenn gegen diese Einspruch erhoben wird. Dieses wird auch mit der Vorratsdatenspeicherung 2009 nicht hinfällig, da diese sich nur auf Internet Service Provider, nicht jedoch auf Anbieter von Webseiten selbst bezieht (Siehe hierzu §113a TMG Abs.4 und Abs.8).
Siehe auch
Literatur
Hinweise zur Auswertung:
- Kimball, R. / Merz, R.: The Data Webhouse Toolkit, New York et al. 2000.
- Massand, B. / Spiliopolou, M.: Web Usage Analysis and User Profiling, Berlin et al. 2000.
- Lutzky, C. / Teichmann, M.-H.: Logfiles in der Marktforschung: Gestaltungsoptionen für Analysezwecke, Jahrbuch der Absatz- und Verbrauchsforschung, 48. Jg., 2002, S. 295 - 317.
Weblinks
- Sichere Log-Dateien auf Grundlage kryptographisch verketteter Einträge (PDF)
- Magisterarbeit zum Thema Logdateianalyse: „Entwicklung und Test einer logfilebasierten Metrik zur Analyse von Website Entries am Beispiel einer akademischen Universitäts-Website“
- Beobachter, Ein Open-Source-Programm, um Logdateien zu überwachen
- Pantheios – Eine Datenprotokollierungs-Bibliothek für C++
Einzelnachweise
Wikimedia Foundation.