- Web Analytics
-
Web Analytics (auch Web-Controlling, Web-Analyse, Datenverkehrsanalyse, Traffic-Analyse, Clickstream-Analyse, Webtracking) ist die Sammlung und Auswertung des Verhaltens von Besuchern auf Websites. Ein Analytic-Tool untersucht typischerweise, woher die Besucher kommen, welche Bereiche auf einer Internetseite aufgesucht werden und wie oft und wie lange welche Unterseiten und Kategorien angesehen werden. In Deutschland ist der Einsatz solcher Werkzeuge aus Datenschutzgründen umstritten.
Sie wird vor allem zur Optimierung der Website und zur besseren Erreichung von Zielen der Website (z. B. Häufigkeit von Besuchen, Vermehrung von Seitenaufrufen, Bestellungen, Newsletter-Abonnements) eingesetzt. Grundlegend kann bei Web Analytics zwischen Auswertungsverfahren zur permanenten Messung der Site-Effektivität und Methoden zur Auffindung von Schwachpunkten in der Site und Verbesserungsmöglichkeiten unterschieden werden (siehe Methoden). Neben einer Reihe von freien Produkten bieten etwa 150 Unternehmen Lösungen für Web Analytics an.
Inhaltsverzeichnis
Begriff
Während sich global weitgehend der Begriff Web Analytics durchgesetzt hat, wird in Deutschland oft der Begriff 'Web Controlling' als Synonym verwendet. Der ältere Begriff 'Logdateianalyse' teilt mit Web Analytics eine Schnittmenge (Analyse von Webserver-Protokolldateien), allerdings kann mit Logdateianalyse auch die Analyse anderer Protokoll-Dateien gemeint sein. Wie 'Web Controlling' hat sich in Deutschland auch der Begriff 'Page Impression' (PI) abweichend vom international genutzten 'Page View' (PV) durchgesetzt. Gemeint ist in jedem Fall der Abruf einer Seite eines Internetangebotes durch einen menschlichen Besucher (keine Crawler, Spider etc.). Mehrere einzelne Seitenabrufe werden zu einer Sitzung zusammengefasst (Visit, Besuch). Ein Besucher (Unique User oder Visitor) kann eine Website in mehreren Sitzungen besuchen.
Ziele
Web Analytics dient der Analyse, Optimierung und Kontrolle von Prozessen, betreffend alle Internet-Aktivitäten eines Unternehmens. Web Controlling Tools ermöglichen es eine Vielzahl von Kennzahlen und Auswertungen bzgl. einer Webseite und den dazugehörigen Marketing-Aktionen nutzbringend zu messen. Wichtige Kennzahlen im elektronischen Handel beziehen sich zum Beispiel auf:
- die Wirksamkeit einzelner Werbemittel (z. B. Banner, Newsletter)
- die Anzahl der Besucher ihres Web-Shops
- den Anteil der Besucher, die etwas in den Warenkorb legen
- den Anteil der Besucher, die den Kaufprozess abschließen
- den durchschnittlichen Warenkorbwert
Ziel ist es nun, diese Kennzahlen und daraus generierten Statistiken (Statistiken über ROI, Warenkörbe, Konversionsraten, Online-Umsätze) auszuwerten und aufgrund dieser Ergebnisse neue Marketing-Aktionen zu starten und die eigene Webseite entsprechend zu optimieren.[1]
Verfahren zur Datensammlung
Gewöhnlich werden für Web Analytics entweder die Logdateien der Webserver ausgewertet oder bestimmte Tags in Websites zur Datengewinnung genutzt. Neben diesen beiden existieren noch Verfahren, die WebServer Plugins oder Netzwerk Sniffer benutzen.
Server-basierte Daten: Logdateianalyse
Die Software zum Betrieb von Websites, ein sogenannter Webserver wie Apache oder MS IIS, produziert gewöhnlich ein fortlaufendes Protokoll aller Aktivitäten der Software. Diente dies zunächst vor allem zur Aufzeichnung und Behebung von Fehlern im Betrieb, entdeckte man schnell die Möglichkeit, mithilfe dieser Logdatei Ergebnisse zur Beliebtheit der Website, zur Häufigkeit von Seitenabrufen und zur Aktivität der Website-Besucher zu sammeln. Da diese Protokolle direkt von der eigenen Software angelegt werden, zeigen sie ein getreues Abbild der Server-Aktivitäten. Zur Auswertung der Protokolle – pure Text-Dateien, die zeilenweise Aktivitäten der Software wiedergeben – wird gewöhnlich eine Software genutzt, die Statistiken erstellt, Daten zuordnet und in Grafiken und Tabellen anschaulich macht.
Client-basierte Daten: Tags und Pixel
Seit etwa 1996 gibt es ein weiteres, einfaches Verfahren zur Datensammlung: Direkt in den Quellcode der Website selbst werden unsichtbare Minibilder (1-Pixel-Grafiken) integriert. Ein Abruf dieser Grafik kann jetzt für genau einen Seitenabruf stehen. Die Pixel-Datei muss sich dabei nicht auf dem gleichen Server wie die eigentlichen Inhalte der Website befinden. So können ASP-Dienstleister die Sammlung, Speicherung und Auswertung der Daten übernehmen. Neben den noch immer genutzten 1-Pixel-Bildern wird heute von fast allen Lösungen zusätzlich Javascript-Code zur Datenerhebung eingesetzt. Diese 'Javascript-Tags' werden ebenso in den Quellcode der Seite integriert, können aber zusätzliche Informationen über den abrufenden Client (gewöhnlich den Browser) sammeln – z. B. grafische Auflösung des genutzten Monitors, Farbtiefe, im Browser installierte Plugins etc. Neuere Tools erlauben auch die Aufnahme der Mausbewegungen (Mouse Tracking) oder Tastatureingaben der Website-Besucher.[2]
Weitere Verfahren
Für die Netzwerk-Protokoll-Analyse (NPA, Network Sniffer) wird ein spezieller Decoder zwischen die eigenen Webserver und der Verbindung zum Internet eingesetzt. Dieser sammelt nun den gesamten Datenverkehr in diesem Netzwerk. Beim URL-Rewriting wird ein Proxy zwischen Webserver und Internet installiert, der in speziellen Logdateien die Datenverkehrsdaten speichert und dabei gleichzeitig zusätzliche Informationen (Session-IDs) in die URL schreibt. Sogenannte Hybrid-Verfahren verarbeiten mehr als eine Datenquelle gleichzeitig. Besonders die integrierte Auswertung von Tag-Daten und Server-Daten stellt eine besonders reichhaltige und zuverlässige, aber auch aufwändige Art der Datenverkehrsanalyse dar.
Cookies
Um einen einzelnen Seitenaufruf einer Sitzung und eine Sitzung einem eventuell wiederkehrenden Besucher zuordnen zu können, werden gewöhnlich Cookies eingesetzt. Es gibt heftige Debatten um dieses Thema, hier sei etwa auf die Seite HTTP-Cookie verwiesen. Festzuhalten bleibt, dass für eine professionelle Datenverkehrsanalyse, die in das Zentrum ihrer Aufmerksamkeit den 'Besucher' (nicht die einzelne Sitzung) stellt, Cookies gegenwärtig unabdingbar sind. Alternative Methoden mit Flash-Objekten scheinen nur eine Nischenexistenz zu führen. Im Unterschied zu klassischen Cookies können damit Besucher auch wiedererkannt werden, wenn sie verschiedene Browser verwenden.
Tag vs. Logdatei – Vor- und Nachteile
Datenverkehrsanalysen haben mit starken Verzerrungen im Datenbestand zu kämpfen. Keine Art der Analyse kann für sich beanspruchen, den tatsächlichen Datenverkehr einer Website wahrheitsgetreu abzubilden.
server-basiert client-basiert Seitenabrufe, die aus Proxies, Zwischenspeichern o. ä. bedient werden, können vom Server nicht registriert werden Verzerrungen durch Zwischenspeicher können vermieden werden die gewöhnliche Weise der Sitzungszuordnung (gleiche IP-Adresse für max. 30 Min.) ist hochgradig fehleranfällig durch Nutzung von Cookies kann die Sitzungs- und Besucher-Zuordnung bis auf ein für die weitere Verarbeitung akzeptables Maß gesteigert werden die gewöhnliche Weise der Besucher-Zuordnung (IP-Adresse, ggf. UserAgent) ist in keiner Hinsicht verlässlich Besucher, die Javascript und/oder Bilder in ihrem Browser blockieren, werden nicht erkannt Daten sind und bleiben im Unternehmen selbst Cookie-Blockaden und Löschraten sorgen für Unsicherheiten das Datenformat ist offen, Daten können von verschiedenen Analyse-Tools ausgewertet werden das Datenformat ist proprietär, d. h. Daten können bei einem Wechsel kaum von Anbieter A zu Anbieter B mitgenommen werden sämtliche Spider, Bots u. ä. werden in den Logdateien registriert Spider und Bots werden nur teilweise registriert – das verschlankt die anfallende Datenmenge, ist aber für Suchmaschinenoptimierungen ein Hindernis die Fehlermeldungen der Server werden unmittelbar registriert nicht alle Fehlermeldungen werden erkannt durch Javascript können reichere Daten über Clients gesammelt werden verschiedene Standorte, Server-Cluster, Domains und Subdomains o. ä. stellen kein wesentliches Problem dar Zusammenfassend lässt sich feststellen, dass das client-seitige Verfahren in Kombination mit 1-Party-Cookies heute das gebräuchlichste und – pragmatisch gesehen – das beste ist. Die Datenqualität ist stark genug, um auf dieser Grundlage belastbare Entscheidungen treffen zu können. Die Kosten für ein gleichwertig zuverlässiges System auf Basis von Logdateien (und Cookies) liegen im Allgemeinen deutlich höher und kommen am ehesten dort in Frage, wo eine erhebliche Sensibilität der Daten vorliegt.
Methoden
Allgemein lassen sich zwei Anwendungsbereiche von Web Analytics unterscheiden:
1. regelmäßiges Monitoring der Effektivität der Website und dazugehörige Kampagnen
Durch die Definition von Kennziffern (z. B. Kosten, Umsatz, Konversionsrate, PageViews pro Sitzung, Sitzungen pro Besucher) lassen sich die einzelnen Daten der Analysen zu sinnvollen Informationen verdichten und in einen Kontext der Vergleichbarkeit setzen: Verlauf des Umsatzes über das Jahr, Kosten pro Kampagne, Konversionsrate im Vergleich zu einem gesetzten Ziel etc.
2. Strategien zur Optimierung der Website
- Pfad-Analysen helfen bei der Suche nach besonders beliebten und unbeliebten Seiten in einer Website
- Segmentierungen helfen beim Auffinden und weiteren Unterscheiden von bestimmten Besuchergruppen (z. B. Besucher von Suchmaschine A im Vergleich zu Besuchern von Suchmaschine B)
- Konversionspfade (Funnel) helfen bei der Messung und Optimierung von definierten, wichtigen Seitenabfolgen in der Website
- Optimierungen von Startseiten oder Landing Pages durch schnelles Ausprobieren von kleinen Verbesserungen und Veränderungen (A/B-Tests)
Software
Eine Webstatistik bietet eine Auswertung zum Surfverhalten von Website-Besuchern. Dabei werden Seitenaufrufe und einzelne Besuche (engl. visit) ausgewertet, um das Verhalten der Besucher auf Webseiten zu analysieren. Im Wesentlichen beruhen Webstatistiken auf einer Auswertung von Logdateien (vgl. Logdateianalyse) des Servers, jedoch existieren auch andere Techniken (Erfassung per Zählpixel oder mit einem JavaScript-Code, der den Zählimpuls an einen Zählserver übergibt). Neben den oft graphisch aufbereiteten Statistiken über frei wählbare Auswertungszeiträume präsentieren Webstatistiken weitere Informationen (Technik der Besucher, Herkunft, spezielle Funktionen, Verhalten der Besucher auf der Webseite), die über den Inhalt der Logdateien hinaus gehen und z. B. unter dem Begriff Webtracking anzutreffen sind. Die Webstatistik stößt meist allerdings dann auf ihre Grenzen, wenn der User das Internet verlässt und einen Telefonkontakt herstellt. Diesen sogenannten „Medienbruch“ überwindet zwischenzeitlich das so genannte Telefontracking.
Freie oder OpenSource Software
- Dieser Abschnitt listet freie Software und Open Source Software.
Name Programmiersprache Unterstützte Datenbanken Letzte stabile Version Lizenz Online Demo Analog C Logfile-basierend 6.0 GPL Nein AWStats Perl Logfile-basierend 6.95 GPL Ja Piwik PHP MySQL 1.6 GPL Ja Open Web Analytics PHP MySQL 1.4 GPL Ja ChCounter PHP MySQL 3.1.3 GPL Ja Webalizer C Logfile-basierend 2.21–02 GPL Ja Proprietäre Software
Name Betriebssystem Unterstützte Datenbanken Methode Lizenz Online Demo Google Analytics Hosted Hosted Cookies via JavaScript N/A Nein clickmap Hosted Hosted JavaScript Pay-as-you-go Ja, kostenloses Schnupperabo Click Stream von Sweetlets Eigene Installation MS SQL, Oracle JavaScript Ja, Demo kostenlos Nein, aber Screenshots IVW Online
Genauso wie für den Print-Markt bietet der IVW (Informationsgemeinschaft zur Feststellung der Verbreitung von Werbeträgern) auch die Auswertung von Online-Nutzungsdaten registrierter Angebote. Dazu sind jedoch eine Reihe formaler und technischer Vorgaben des IVW zu erfüllen, um an diesem Verfahren teilnehmen zu können.
Gesetzliche Zulässigkeit in Deutschland
Gesetzliche Regelung
Die Rechtslage bei der Nutzung von Analytic-Tools ist gegenwärtig in Deutschland umstritten. Rechtlicher Anstoß für die Kritik ist häufig das Speichern der IP-Adresse und das Verwenden von Cookies. Das Bundesdatenschutzgesetz lässt die Erhebung und die Speicherung von personenbezogenen Daten nur dann zu, wenn dies von einer gesetzlichen Vorschrift explizit erlaubt wird oder eine eindeutige und vorherige Einwilligung des Nutzers vorliegt. Relevant ist dabei die Regelung in § 15 Telemediengesetz (TMG). Demnach dürfen personenbezogene Daten von Besuchern einer Internetseite ohne die Einwilligung des Nutzers nur erhoben und verwendet werden, soweit dies erforderlich ist, um die Inanspruchnahme von geschäftsmäßigen Angeboten im Internet zu ermöglichen und abzurechnen. Die Verwendung dieser Daten über das Ende des Nutzungsvorgangs ist nur erlaubt, soweit die Daten „für Zwecke der Abrechnung mit dem Nutzer erforderlich sind”. Nach § 13 Telemediengesetz (TMG) haben Anbieter von Internetportalen sicherzustellen, dass „die anfallenden personenbezogenen Daten über den Ablauf des Zugriffs oder der sonstigen Nutzung unmittelbar nach deren Beendigung gelöscht“ werden.
Personenbezug von IP-Adressen
Umstritten ist, ob die IP-Adresse eines Internetnutzers in Verbindung mit dem Nutzungszeitpunkt ein personenbezogenes Datum darstellt. Das Amtsgericht München lehnte den Personenbezug einer dynamischen IP-Adresse, die durch den Betreiber eines Internetdienstes gespeichert worden war, in einem ergänzenden Hinweis (obiter dictum) ab (Urt. v. 30. September 2008 – 133 C 5677/08, MMR 2008, 860[3]). Es folgte damit einigen juristischen Kommentatoren (Gola/Schomerus, § 3 Rn. 10), die IP-Adressen nur für „relativ“ personenbezogen halten, so dass die Speicherung von IP-Adressen bei Content-Anbietern zulässig und erst ihre Übermittlung unzulässig sei.[4]
Das Amtsgericht Berlin-Mitte hat demgegenüber einen Personenbezug angenommen und es dem Betreiber eines Internetportals verboten, die IP-Adressen seiner Nutzer über die Dauer des Nutzungsvorgangs hinaus aufzubewahren (Urt. v. 27. März 2007 – 5 C 314/06, DuD 2007, 856-858, bestätigt durch Landgericht Berlin, Urt. v. 6. September 2007 – 23 S 3/07, MMR 2007, 799-800[5]). Unter Zuhilfenahme weiterer Daten, wie sie etwa bei Internet-Zugangsanbietern gespeichert werden, sei die Ermittlung des genutzten Internetanschlusses und dessen Inhabers möglich. Dem schloss sich das Verwaltungsgericht Wiesbaden an (Beschl. v. 27. Februar 2009 – 6 K 1045/08, MMR 2009, 428-432[6]). Auch das Amtsgericht Wuppertal sieht die IP-Adresse als personenbezogenes Datum an.[7] Im europäischen Ausland haben das schweizerische Bundesverwaltungsgericht,[8] das oberste schwedische Verwaltungsgericht[9] und der französische Verfassungsgerichtshof[10] unter Bezugnahme auf die auch in Deutschland geltende europäische Datenschutzrichtlinie 95/46/EG den Personenbezug von IP-Adressen bejaht. Gleicher Meinung sind das Bundesjustizministerium,[11] der Bundesdatenschutzbeauftragte,[12] die Datenschutzbeauftragten des Bundes und der Länder[13] sowie die Datenschutzbeauftragten aller EU-Staaten[14]. Der deutsche Bundesgerichtshof hatte noch nicht über die Frage zu entscheiden, hat jedoch in einer Entscheidung aus dem Jahr 2009 ein „Recht des Internetnutzers auf Anonymität“ anerkannt.[15]
Abklärung der Einhaltung des Datenschutzes nötig
Wer als deutscher Anbieter eines Internetdienstes externe Dienste wie Webanalysedienste in sein Angebot einbindet, haftet für die Einhaltung des deutschen Datenschutzrechts (sog. Auftragsdatenverarbeitung). Insbesondere bei amerikanischen Unternehmen, die in Deutschland agieren, sollte der Verwender eines Analytic-Tools die Einhaltung des deutschen Datenschutzrechts durch das ausländische Unternehmen sicherstellen, da es in den USA keine dem deutschen Recht vergleichbaren Datenschutzregelungen gibt (vgl. §§ 11, 4b Absätze 2 und 3 BDSG). Die Speicherung oder Übermittlung personenbezogener Daten ist jenseits gesetzlicher Erlaubnisse nur mit Einwilligung der Internetnutzer zulässig (§§ 4, 4a BDSG). Eine Einwilligung muss „bewusst“ erfolgen (§ 13 II TMG) und darf nicht gegen § 307 II BGB verstoßen. Es wird die Auffassung vertreten, dass es ein wesentlicher Grundgedanke des Telemediengesetzes ist, den Nutzer vor einer verdachtslosen Protokollierung seines Nutzungsverhaltens zu schützen. Abweichende Einwilligungsklauseln seien deswegen unwirksam nach § 307 II BGB.[16]
Das Telemediengesetz in Deutschland lässt eine Verarbeitung von personenbezogenen Daten nach § 12 I TMG nur zu, wenn der Benutzer vorher zugestimmt hat oder eine gesetzliche Ermächtigung vorliegt. Durch den Einsatz eines externen Tools wird aber meist die vollständige IP-Adresse (ein personenbezogenes Datum) des Seitenbesuchers an einen Dritten (Dienstanbieter) übermittelt. Sofern der Benutzer nicht vorher eingewilligt hat, ist dies unzulässig, da keine Rechtsgrundlage ersichtlich ist, die dies erlauben soll.
Am 26./27. November 2009 haben die obersten Aufsichtsbehörden für den Datenschutz im nicht-öffentlichen Bereich (Düsseldorfer Kreis) einige Grundsätze für den Umgang mit Google Analytics und anderen Webtracking-Verfahren beschlossen.[17] Nach Auffassung der Aufsichtsbehörden dürften personenbezogene Daten eines Nutzers ohne Einwilligung nur erhoben und verwendet werden, soweit dies erforderlich ist, um die Inanspruchnahme von Telemedien zu ermöglichen und abzurechnen. Die Analyse des Nutzungsverhaltens unter Verwendung vollständiger IP-Adressen (einschließlich einer Geolokalisierung) sei aufgrund der Personenbeziehbarkeit dieser Daten nur mit bewusster, eindeutiger Einwilligung zulässig. Liegt eine solche Einwilligung nicht vor, sei die IP-Adresse vor jeglicher Auswertung so zu kürzen, dass eine Personenbeziehbarkeit ausgeschlossen ist.
Bußgelder
Gegen Anbieter, die gegen die oben genannten Datenschutzgesetze verstoßen, können die Datenschutz-Aufsichtsbehörden Bußgelder verhängen.
Der Berliner Datenschutzbeauftragte hat inzwischen eine besondere Bußgeldstelle in seiner Behörde eingerichtet, um in Zukunft verstärkt Sanktionen verhängen zu können. Bildblogger Stefan Niggemeier ist die Protokollierung der IP-Adressen der Nutzer seiner Website bereits verboten worden.[18]
Literatur
- Eric T. Peterson: Web Analytics Demystified. 2004, Englisch
- Avinash Kaushik: Web Analytics: An Hour a Day. 2007, Sybex, ISBN 0-470-13065-2, Englisch
- Jason Burby, Shane Atchison: Actionable Web Analytics: Using Data to Make Smart Business Decisions. 2007, Sybex, ISBN 0-470-12474-1, Englisch
- Jim Sterne: Web Metrics: Proven Methods for Measuring Web Site Success. 2002, Wiley & Sons, ISBN 0-471-22072-8, Englisch
- Frank Reese: Web Analytics – Damit aus Traffic Umsatz wird: Die besten Tools und Strategien. 2008, Verlag: Businessvillage, ISBN 978-3-938358-71-9
- Marco Hassler: Web Analytics – Metriken auswerten, Besucherverhalten verstehen, Website optimieren. 2008, Mitp-Verlag, ISBN 978-3-826659-31-7
Weblinks
- WAA – Web Analytics Association
- Web Analytics Buch Online
- Checkliste zum Einsatz von Web Analytics / Web Controlling
Einzelnachweise
- ↑ Ziele des Web-Controlling und weitere Informationen zum Online Handel
- ↑ Michel Rossier: Mausbewegungen tracken. 15. Juli 2007.
- ↑ http://www.telemedicus.info/urteile/Datenschutzrecht/Tracking-von-IP-Adressen/524-AG-Muenchen-Az-133-C-567708-IP-Adresse-ist-kein-personenbezogenes-Datum.html
- ↑ Näher http://www.daten-speicherung.de/?p=213
- ↑ http://www.daten-speicherung.de/?p=197
- ↑ http://www.vorratsdatenspeicherung.de/content/view/301/79/lang,de/
- ↑ http://www.jurpc.de/rechtspr/20080110.htm
- ↑ http://relevancy.bger.ch/pdf/azabvger/2009/a_03144_2008_2009_05_27_t.pdf
- ↑ http://www.daten-speicherung.de/?p=1218
- ↑ http://www.conseil-constitutionnel.fr/conseil-constitutionnel/francais/les-decisions/2009/decisions-par-date/2009/2009-580-dc/decision-n-2009-580-dc-du-10-juin-2009.42666.html, Abs. 27
- ↑ http://daten-speicherung.de/index.php/bundesjustizministerium-surfprotokollierung-durch-webseitenbetreiber-illegal/
- ↑ http://daten-speicherung.de/index.php/bundesjustizministerium-surfprotokollierung-durch-webseitenbetreiber-illegal/
- ↑ https://www.bsi.bund.de/cae/servlet/contentblob/476812/publicationFile/28294/2_Daten_pdf.pdf
- ↑ http://ec.europa.eu/justice_home/fsj/privacy/docs/wpdocs/2000/wp37de.pdf, http://ec.europa.eu/justice_home/fsj/privacy/docs/wpdocs/2002/wp58_de.pdf, http://ec.europa.eu/justice_home/fsj/privacy/docs/wpdocs/2007/wp136_de.pdf
- ↑ http://dejure.org/dienste/vernetzung/rechtsprechung?Text=VI%20ZR%20196/08
- ↑ http://www.wirspeichernnicht.de/content/view/4/21/
- ↑ http://www.datenschutz-mv.de/dschutz/beschlue/Analyse.pdf, siehe dazu http://www.daten-speicherung.de/?p=1870.
- ↑ http://www.daten-speicherung.de/?p=1736
Kategorien:- Marktforschung
- Wirtschafts- und Sozialstatistik
- Online-Marketing
Wikimedia Foundation.