- Googeln
-
Google URL http://www.google.de (Deutsche Version) http://www.google.ch (Schweizer Version)
http://www.google.at (Österreichische Version)
http://www.google.com/ (Ursprüngliche Version)
Kommerziell? ja Beschreibung Internet-Suchmaschine Registrierung? nicht erforderlich Sprachen 124 (inkl. Varianten und Kunstsprachen) Eigentümer Google Inc. Erschienen September 1998 (Ursprüngliche Version) Google ist der Name einer Suchmaschine des US-Unternehmens Google Inc.. Schätzungen sehen die Suchmaschine mit über 80 Prozent aller weltweiten Suchanfragen als Marktführer unter den Internet-Suchmaschinen.[1] Die Seite ging am 7. September 1998 als Testversion online, seitdem hat sich ihre Oberfläche nur geringfügig verändert. Durch den Erfolg der Suchmaschine in Kombination mit kontextsensitiver Werbung (siehe Google AdSense) konnte das Unternehmen Google Inc. eine Reihe weiterer Software-Lösungen finanzieren, die über die Google-Seite zu erreichen sind. Die Suche ist nach wie vor der Kernbereich des Google-Geschäftsfelds. Zeitweise verwendete Konkurrent Yahoo die Datenbanken für die eigene Suche.
Inhaltsverzeichnis
Der Begriff „Google“
Etymologie
Die Bezeichnung Google basiert auf einem Wortspiel (manche Quellen sprechen auch von einem Rechtschreibfehler) mit der amerikanischen Aussprache des Wortes googol.[2] Milton Sirotta, der Neffe des US-amerikanischen Mathematikers Edward Kasner, hatte den Ausdruck im Jahr 1938 erfunden, um der Zahl mit einer Eins und hundert Nullen (10100) einen Namen zu geben. Die Google-Gründer wiederum suchten eine treffende Bezeichnung für die Fülle an Informationen, die ihre Suchmaschine im Web finden sollte.[3]
Das Verb „googeln“
Der Rechtschreib-Duden nahm das Verb googeln (sprich: [ˈɡuːgl̩n] „guhg(e)ln“) 2004 in die 23. Auflage auf.[4]
Das Wort wird im allgemeinen Sprachgebrauch meist nicht nur für die Suche mit Google verwendet, sondern allgemein als Synonym für Websuche mit einer beliebigen Suchmaschine (vgl. Wiktionary,[5] LEO Dictionary[6]). Google geht gegen diese Verallgemeinerung vor, um zu verhindern, dass „googeln“ zum Gattungsbegriff wird und dadurch den Markenschutz verlieren könnte. 2006 forderte Google Zeitungs- und Wörterbuchredaktionen auf, „to google“ oder „googeln“ nicht mehr allgemein für die Suche im Internet zu verwenden. Auf eine „Bitte“ von Google wurde der Eintrag in der 24. Auflage des Duden genauer definiert („mit Google im Internet suchen“).[7]
Arbeitsweise der Google-Suche
Indexierung von Internetseiten
Die Google-Suchmaschine folgt mithilfe so genannter Webcrawler den gefundenen Links und versucht so, möglichst viele publizierte Seiten in ihren Suchindex aufzunehmen. (Zum Umfang dieser Datenbank siehe Indexgröße). Dabei werden die Seiten nach Suchbegriffen und Schlüsselworten aufgegliedert.
Sortierung der Suchergebnisse
Google zielt darauf ab, den Nutzern die Suchergebnisse nach Relevanz zu sortieren. Der Algorithmus wird von Google als Betriebsgeheimnis gehandhabt, stützt sich aber zur Sortierung der Suchergebnisse vor allem auf ein patentiertes Verfahren, das den so genannten PageRank-Wert errechnet. Er basiert auf einer Messung, wie gut ein Dokument verlinkt ist und von wem, was sich als brauchbare Annäherung an soziale Relevanzkriterien erwiesen hat.
Ermittelt wird der PageRank eines Dokuments rekursiv anhand von Verweisen auf dieses Dokument. Für jede Seite wird eine Punktzahl errechnet, die aus der Summe der gewichteten Punktzahlen aller Seiten bestehen, die auf die entsprechende Seite verlinken. Je häufiger eine Seite verlinkt ist und je höher die Punktzahl der verlinkenden Seiten ist, desto höher der PageRank der Seite. Der jeweilige Wert des PageRanks einer Seite lässt sich anhand des Browser-Plugins Google-Toolbar ermitteln. Allerdings ist der in der Toolbar angezeigte Wert meist einige Monate alt und steht in einem logarithmischen Verhältnis zum tatsächlichen Wert. Jedoch gibt es auch Onlinedienste, die zu einer bestimmten Domain einen aktuellen PageRank ermitteln können.
Neben dem PageRank werden weitere Faktoren in die Sortierung einbezogen, so wird etwa das Auftreten der Suchbegriffe im Dokumententitel oder in Überschriften gewertet. Des Weiteren spielt die Verwendung der Begriffe als Ankertext in verweisenden Dokumenten eine große Rolle. Letzteres wird bei Google-Bomben missbraucht.
Die exakte Funktionsweise der Seitensortierung ist Googles Betriebsgeheimnis, nicht zuletzt, um Manipulationen durch Website-Betreiber zu erschweren, die die eigene Site für gewisse Begriffe auf den Ergebnisseiten möglichst weit nach oben bringen möchten. Die Suchmaschinenoptimierung beschäftigt sich mit Methoden, dies zu erreichen.
Technik
Hardware-Architektur
Google Inc. betreibt weltweit eine Reihe von Rechenzentren, die jeweils die komplette Funktionalität der Suchmaschine enthalten. Eine Benutzeranfrage wird, durch das Domain Name System (welches Namen wie google.com in IP-Adressen übersetzt) gesteuert, im Idealfall an das netztopologisch nächste Rechenzentrum – nur manchmal mit dem geographisch nächstgelegenen identisch – geleitet und von diesem beantwortet. Fällt ein Rechenzentrum komplett aus, können die verbleibenden Rechenzentren die Last übernehmen.
Jedes Rechenzentrum besteht aus einem Computercluster. Die verwendeten Rechner sind IBM-kompatible Personal-Computer, bestehen also aus preiswerten Standardkomponenten. Hier kommt das selbstentwickelte Google File System zum Einsatz, eine verteilte Architektur, bei der alle Daten mehrfach redundant auf verschiedenen Geräten gespeichert sind. Ist einer der Rechner oder nur eine Festplatte eines Rechners ausgefallen, werden die entsprechenden Daten von einer anderen Stelle im Cluster auf einen Ersatzrechner umkopiert und die ausgefallene Hardware-Komponente kann im laufenden Betrieb ausgetauscht werden, ohne dass Ausfälle entstehen. Das Gesamtsystem ist auch leicht skalierbar, da nach Bedarf immer weitere Rechner und Festplatten hinzugefügt werden können.
Durch Ablage der einzelnen Datenstrukturen (Indizes, Dokumentenkopien, Verzeichnisse aller Art) auf verschiedenen Rechnern und die große Anzahl verfügbarer Einzelrechner lassen sich Anfragen sehr schnell beantworten, da durch die Parallelisierung der zu erledigenden Arbeit nur ein Bruchteil der Zeit benötigt wird, die ein einzelner Rechner benötigen würde – in der Tat beschäftigen sich bis zu 1000 Einzelrechner mit jeder Suchanfrage. Eine Antwortzeit von höchstens einer halben Sekunde wird als Richtwert angestrebt. Die schnelle Lieferung von Ergebnissen hatte auch frühzeitig zur Popularität von Google beigetragen. Die Konkurrenz ließ sich mit der Anfragebeantwortung oft mehr Zeit. Insbesondere bei inkrementellen Anfragen, also immer weiter verfeinerten Anfragen des Benutzers, der das jeweils vorige Suchergebnis berücksichtigt, ist die Zeitersparnis insgesamt deutlich spürbar.[8]
Software
Als Betriebssystem wird eine funktionsreduzierte Variante der Linux-Distribution Red Hat verwendet.[9] Die Programmiersprachen C, C++ und Python spielen essentielle Rollen bei der Implementierung der proprietären Suchmaschinensoftware.
MapReduce
Der zentrale Aspekt aller verteilten Google-Anwendungen, allen voran der Indizierung des Internets und die Suche darin, ist das von Google entwickelte Framework MapReduce für die automatisierte Parallelisierung von Arbeitsaufträgen in Clustern.[10] Der Entwickler muss bei diesem speziellen Programmierstil nur zwei Hooks implementieren, die, in Anlehnung an entsprechend benannte und ähnlich arbeitende Funktionen der LISP-Sprachfamilie, jeweils map und reduce genannt werden.
Die Map-Funktion erzeugt dabei in allen entsprechend entworfenen Anwendungen aus dem gesamten Input (zum Beispiel der Gesamtheit aller betrachteten Webseiten) eine Liste von Zwischenresultaten in Form von Wertepaaren, die einen Schlüssel mit einem symbolischen Wert kombinieren. Zum Beispiel wird so für jedes Vorkommen von „Wert“ in einem Text ein Paar ('Wert','1') erzeugt – jedes mal, wenn die Funktion auf das Wort trifft. Die Menge der Zwischenresultate wird dann durch die Reduce-Funktion derart reduziert, dass mit jedem Schlüssel nur noch ein symbolischer Wert assoziiert ist, der sich aus der Menge aller symbolischen Werte für diesen Schlüssel in den Zwischenergebnissen ergibt. Eine typische Aufgabe wäre, unter Rückgriff auf das Beispiel weiter oben, alle (beispielsweise 43) Paare ('Wert','1') je Schlüssel zu einem einzigen Paar pro Schlüssel zu kombinieren – etwa ('Wert','43').[11]
Die Leistung von MapReduce ist nun, dass alle anderen Aufgaben, die mit der Parallelisierung dieser Aufgaben zusammenhängen (und sich prinzipiell für alle solch parallelisierten Anwendungen wiederholen), vom Framework übernommen werden. Es kümmert sich sowohl um die Verteilung der Funktionalitäten, der Daten und Zwischenergebnisse, um das Einsammeln der Ergebnisse und beinhaltet zudem Maßnahmen zur Fehlerbehandlung (via redundanter oder wiederholter Ausführung)[12][13] – etwa wenn ein einzelner Arbeiter-Rechner ausfällt oder so schlechte Leistungen zeigt, dass er die Fertigstellung des Gesamtergebnisses übermäßig verzögert.
Google selbst setzt das Framework in steigendem Maße für seine eigene Arbeit ein – nach Einführung von MapReduce im Jahre 2003 hatte sich die Anzahl der Produktionsanwendungen in der Code-Bibliothek von Google binnen zwei Jahren auf fast 1000 Anwendungen exponentiell vervielfacht.[14] In der zentralen Anwendung, dem Aufbau des Dokumenten-Indexes für die Suchmaschine selbst, sind im Übrigen 24 Instanzen von MapReduce hintereinander geschaltet.[15]
Indexgröße
Die ungefähre Anzahl der Dokumente im Index der Websuche wurde die ersten sieben Jahre unten auf der Hauptseite eingeblendet.
- Unternehmensgründung Januar 1998: 25.000.000[16]
- August 2000: 1.060.000.000
- Januar 2002: 2.073.000.000
- Februar 2003: 3.083.000.000
- September 2004: 4.285.000.000
- November 2004: 8.058.044.651
Außerdem existierte im Juni 2005 nach eigener Aussage ein Index von 1.187.630.000 Bildern, einer Milliarde Usenet-Artikeln, 6.600 Katalogen und 4.500 Nachrichtenquellen.
Seit dem siebten Geburtstag der Firma Google im September 2005 wird die Größe des Index nicht mehr auf der Hauptseite angezeigt, da laut Eric Schmidt keine eindeutige Zählweise existiert.[17] Im Juli 2008 ermittelte Google nach eigenen Angaben[18] das Vorhandensein von mehr als einer Billion URLs im World Wide Web.
Suchdienstleistungen für Portale
Googles Suchtechnik wird auch an Internetportale lizenziert, um dort eine Websuche anbieten zu können, ohne dass Benutzer das Portal verlassen müssten.
Google Appliance
Mit der Google Appliance verkauft Google seine Suchtechnologie an Firmen, die sie im eigenen Intranet einsetzen möchten. Bei der Appliance handelt es sich um einen Server mit vorinstallierter Software, der im firmeneigenen Netz dieselbe Aufgabe übernimmt, die Google für das World Wide Web leistet. Dokumente werden im Index vorgehalten und Suchanfragen beantwortet.
Gebrauch der Suchmaschine
Benutzung
Neben der einfachen Suche steht noch eine weitere Suchmaske (erweiterte Suche) zur Verfügung, über welche bestimmte Filter angewendet werden können.
Die einfache Suche verwendet bei Eingaben standardmäßig den booleschen Operator „UND“ (Konjunktion: UND, wahlweise auch „+“) beim Eintrag mehrerer Begriffe. Es wird dabei nach allen Dokumenten gesucht, in denen diese Begriffe vorkommen. Gewichtet wird, neben dem Page Rank, meist danach, wo die Begriffe stehen – ob im Titel einer Seite, dem Dokumenten-Namen oder Verzeichnis, einer Überschrift etc. Die PageRank-Technologie fand zum ersten mal in der Suchmaschine BackRub Verwendung, die von Larry Page entwickelt wurde.[19]
Neben der booleschen Standardverknüpfung UND kann auch ein boolesches „ODER“ (Disjunktion OR, wahlweise auch „|“) verwendet werden. Suchbeispiel: „
Strand OR Beach
“. Google berücksichtigt dabei alle Wörter, die innerhalb einer OR-Kette vorkommen. Hat man mehr als zwei Wörter zur Auswahl, verknüpft man diese also zu „Wort1 OR Wort2 OR Wort3 …
“. Die Verknüpfung mit Klammern funktioniert bei Google nur, wenn die Suchanfrage gegebenenfalls in eine konjunktive Normalform umgeformt wird. Statt z. B. „(auto fahren) OR (flugzeug fliegen)
“ muss „(auto OR flugzeug) (auto OR fliegen) (flugzeug OR fahren) (fahren OR fliegen)
“ eingegeben werden.Um die Suche weiter einzugrenzen, kann man nach exakten Phrasen suchen. Die Suchbegriffe tauchen dann nicht wahllos im Dokument auf, sondern müssen in einer bestimmten Anordnung vorhanden sein. Exakte Suchphrasen werden mit Anführungszeichen „"…"“ kenntlich gemacht. Suchbeispiel: „
"Bearbeiten von Google"
“. Es werden keine Dokumente gesucht, in denen irgendwo das Wort „Bearbeiten“ und irgendwo das Wort „Google“ steht, sondern nur solche, in denen die Wörter in dieser Reihenfolge vorkommen. Wahlweise kann auch für ein Wort ein Platzhalter, kenntlich gemacht durch ein Sternchen „*“, gesetzt werden.Über ein Minuszeichen „-“ können Worte explizit von der Suchergebnissen ausgeschlossen werden.
Die oft übliche Suche mit Wildcards ist bei Google indes nicht möglich. So wird bei der Suche nach „
Googl
*“ nicht nach den Begriffen „Googlin“ oder „Googler“ gesucht, sondern nur nach „Googl“. Die Suche erlaubt eine Abfrage mit bis zu 32 Suchbegriffen (auch als Phrase). Diese Option ist hilfreich für das Suchen nach Dubletten oder Zweitverwertungen eines Textes. Anhand dieser Verknüpfungen (die kombiniert angewendet werden können), sind schon sehr präzise Abfragen möglich. Die Abfrageergebnisse werden umso besser, je intelligenter man Fragen an Google stellt. Fragen nach banalen Suchbegriffen ergeben meist ziemlich dürftige Ergebnisse.Weitere Funktionen:
- Taschenrechner
- Bei Eingabe einfacher mathematischer Schreibweisen wie z. B. „
2+5(4/5)^8
“ gibt Google standardmäßig keine Seiten aus, in denen diese Formulierung vorkommt, sondern gibt das Ergebnis der Rechnung (= 2.8388608) zurück. - Einheitenrechner
- Man kann auch Einheiten Umrechnen lassen: z. B. „
inch in cm
“, „usd in euro
“, oder auch komplizierter „l/100km in miles/gallon
“ - Rechtschreibprüfung
- Google liefert bei falsch geschriebenen Wörtern einen Vorschlag zur richtigen Schreibweise („Meinten Sie …“). Die Empfehlung beruht auf einem phonetischen, vollautomatisierten Vergleich, was teilweise zu abwegigen Vorschlägen führen kann.
Folgende Funktionen stehen nicht in allen landesspezifischen Versionen von Google zur Verfügung. Unter anderem können sie in den Google-Mutationen Deutschlands, Österreichs und der Schweiz verwendet werden:
- Zugauskunft
- Gibt man zwei Orte in die Suchleiste ein, schlägt Google einen aktuellen Fahrplan vor, der die nächsten Zugverbindungen zwischen den Orten anzeigt.
- Kinopläne
- Durch die Eingabe "Kino" und dem entsprechenden Ort erhält man aktuelle Kinopläne aller ortsansässigen Kinos. Es werden dabei Angaben zu Film, Uhrzeiten, FSK und Genre gemacht.
- Wetter
- Ebenso lässt sich auch eine kurze Übersicht zu den Wetterverhältnissen anzeigen. Durch Eingabe von "Wetter" und dem Namen der Stadt erscheint der Wetterbericht für die kommenden drei Tage.
Erweiterte Benutzung
Es kann zusätzlich zu dieser einfachen Such-Syntax eine erweiterte Syntax in die Suchmaske eingegeben, bzw. größtenteils auch über die „erweiterte Suche“ zusammengeklickt werden. Folgende, teils undokumentierte Schlüsselbegriffe sind derzeit bekannt. Diese Schlüsselbegriffe werden durch einen Doppelpunkt „:“ gekennzeichnet.
Google-Schlüsselbegriffe Schlüsselbegriff Funktionsweise cache: Gibt nur die von Google gespeicherten Seiten aus. Das kann zum Beispiel bei Portalen mit häufig wechselnden Inhalten nützlich sein. Der Link, den man bei Google findet, führt manchmal auf eine Seite, deren Inhalte sich inzwischen geändert haben oder gar gelöscht wurden. Die Inhalte sind aber über einen bestimmten Zeitraum noch bei Google gespeichert und können dort gelesen werden. define: Durchsucht Internet-Enzyklopädien wie Wikipedia und andere nach einer Definition des Suchbegriffes. filetype: oder ext: Sucht nach Dokumenten, mit bestimmten Dateiendungen. Beispiel: Geschäftsbericht filetype:xls . Möglich sind grundsätzlich alle Dateiendungen. Google kann derzeit aber nur in folgende Formate „reinschauen“: PS, PDF, AI, DOC, PPT, XLS, SWF, sowie alle textbasierten Dateien wie RTF, TXT, ASP, PHP, CGI, HTML, LOG, INI, JS usw. inanchor: Sucht nach den Begriffen nur in Links. Oftmals führt ein Link mit einer bestimmten Bezeichnung präziser zu einem Ziel, als wenn die Bezeichnung irgendwo im Text vorkommt. inurl: Gibt Seiten zurück, bei denen der Suchbegriff in der URL auftaucht. Beispiel: „Max Mustermann“ inurl:impressum intitle: Sucht nach Dokumenten, bei denen der oder die Suchbegriffe nur im Titel der Datei vorkommen. Beispiel: intitle:„Bearbeiten von Google“ intext: Sucht nach Dokumenten, bei denen der oder die Suchbegriffe nur im Text der Datei vorkommen. Beispiel: intext:„Bearbeiten von Google“ link: Gibt alle Seiten aus, die auf eine bestimmte Seite verlinken. Beispiel: link:wikipedia.org . Diese Ausgabe kann dazu verwendet werden, um den Page Rank zu optimieren oder verwandte Seiten zu finden. site: Mit diesem Schlüsselbegriff lässt sich die Suche auf eine bestimmte Domain eingrenzen, zum Beispiel falls eine Homepage keine eigene Suchfunktion hat (Beispiel: Desoxyribonukleinsäure site:de.wikipedia.org) oder zur Suche innerhalb einer Top Level Domain. related: Sucht nach ähnlichen Seiten (Beispiel: related:de.wikipedia.org) Die angewendeten Suchformeln lassen sich auch in Form der URL, die Google bei einer Suche ausgibt, speichern bzw. wiederholen und verlinken. Weitere Funktionen bieten die zusätzlichen Google-Funktionen.[20]
Ergebnisse
Google zeigt zehn Suchergebnisse je Seite an. Die Darstellungsform eines Treffers kann sich unterscheiden, normalerweise wird der Titel, die Zusammenfassung und der Link angezeigt. Google schränkt die Anzeige von Treffern auf maximal 1000 ein.
Einbettungen der Google-Suche
- Die Google-Suche lässt sich über vorgefertigte Code-Fragmente in eine Webseite einbinden.[21]
- Browser-Add-ons:
- Die Google-Toolbar ist für die Webbrowser Internet Explorer und Mozilla Firefox verfügbar.
- Für Mozilla, Opera und Konqueror stehen spezielle search-plugins für die Einbettung in vorhandene Suchleisten zur Verfügung, auch für die Kontext-sensitive Verwendung.
- Einbettungen gibt es auch für Textverarbeitungsprogramme wie StarOffice/OpenOffice.org.
- In dem Google-eigenen Browser Google Chrome ist die Suche in die Adressleiste bereits eingebettet.
- Viele andere Webdienste wie Toogle nutzen die Google-Suche.
Easter Eggs
Die Programmierer haben in den Suchalgorithmen Easter Eggs, also scherzhafte Überraschungen, versteckt. Einige Beispiele:
- sucht man nach „answer to life, the universe and everything“ wird das Resultat als mathematische Formel mit dem Ergebnis 42 angezeigt. Dies ist eine Anspielung auf Douglas Adams' Werk Per Anhalter durch die Galaxis, in dem 42 die Antwort auf die Frage „nach dem Leben, dem Universum und allem“ ist.
- sucht man nach „number of horns on a unicorn“ („Anzahl der Hörner eines Einhorns“) wird ebenfalls eine mathematische Berechnung angezeigt, natürlich mit dem Ergebnis 1.
Das Google-Logo
Zu besonderen Anlässen, wie dem Earth Day oder dem Jahrestag des ersten Fluges der Montgolfière, wird das Google-Logo manchmal verändert. Diese themenbasierenden Logos werden auch Google Doodle (engl. Gekritzel) genannt. Zusätzlich ist das Logo, statt mit der Google Homepage, mit einer Suchanfrage mit den entsprechenden Thema als Suchtitel verlinkt.
Zur EM 2008 veranstaltete Google in Deutschland einen Wettbewerb namens Doodle4Google, bei dem Kinder und Jugendliche im Alter von 5 bis 18 aufgerufen wurden ein Logo zur EM zu gestalten. Das Gewinnerlogo wurde am Tag des EM-Finales auf der deutschen Google-Startseite gezeigt. In anderen Ländern gab und gibt es ähnliche Wettbewerbe.
Da das Logo meist mit dem Suchbegriff in Google selbst verlinkt ist und weil Wikipedia in den Suchlisten – gerade bei Schlagwörtern zu besonderen Anlässen – oft ganz oben steht, kommt es an diesen Tagen zu vermehrten, teils mutwillig schlechten, Bearbeitungen an den Artikeln.
Manipulation der Suchergebnisse
Google-Bombing
Aufgrund seiner bedeutenden Marktposition ist Google Hauptziel von Suchmaschinen-Spamming, was speziell auch Google-Bombing genannt wird. Dabei wird versucht, gute Positionen bei möglichst vielen Suchbegriffen zu erzielen. Diese Suchbegriffe haben oft nichts mit dem eigentlichen Inhalt der Seite zu tun. Es werden Techniken wie Brückenseiten, Linkfarmen oder Page-Cloaking eingesetzt.
Erstmals im größeren Umfang öffentlich wahrgenommen wurde die Möglichkeit der Suchmaschinenmanipulation im Zusammenhang mit einer Google-Bombe, die sich auf den amerikanischen Präsidenten George W. Bush bezog. Der Suchbegriff „miserable failure“[22] (zu Deutsch: „klägliches Scheitern“ oder „jämmerlicher Versager“) wurde von Bush-Gegnern mit seiner offiziellen Biografie verknüpft. Im Gegenzug versuchten Bush-Unterstützer dasselbe mit Michael Moore. Die Plätze wechselten seither gelegentlich.
Manipulationen, die zum Zweck haben, das Ranking von Websites speziell bei Google zu verbessern, werden auch als Google-Spamming bezeichnet. Versuche, konkurrierende Internetseiten aus den Google-Ergebnissen herauszukegeln, bezeichnet man als Google Bowling.
Google ändert seine Algorithmen zur Bestimmung des Rankings regelmäßig ab, um Missbrauch zu erschweren. Die Spammer ziehen stets nach und passen ihre Seiten entsprechend an.
Unlautere Suchmaschinen-Optimierung
Im Januar 2006 wurde bekannt, dass Google stärker gegen unseriöse Methoden bei der Optimierung von internationalen Webseiten vorgehen will. Als erste Konsequenz, des von Google-Mitarbeiter Matt Cutts[23] angekündigten verschärften Kampfes gegen Spam in Deutschland und anderen nicht-angelsächsischen Ländern, entfernte die Suchmaschine die Online-Fahrzeugbörse Automobile.de und den Fahrzeughersteller BMW aus ihrem Index.[24] Ihnen wurde vorgeworfen, durch massiven Einsatz von Keywords (Spam), Doorway-Pages und JavaScript-Weiterleitungen Suchergebnisse zum eigenen Vorteil unlauter optimiert zu haben. Die Seite von BMW wurde bereits nach wenigen Tagen wieder in den Index aufgenommen, nachdem der Betreiber die strittigen Doorway-Pages entfernt hatte.[25]
Zensur in Deutschland
Bereits seit einigen Jahren sind Suchergebnisse der Suchmaschine Google von Websites von verbotenen Meinungsäußerungen hauptsächlich politischer Natur bereinigt. Anfangs wurden wegen Urheberrechtsverletzung auch Seiten der Church of Scientology herausgefiltert. Mittlerweile entfernt Google alle Inhalte, für die jemand bei Google eine infringement notification (engl.: etwa „Rechtsverletzungsbescheid“) gemäß dem US-amerikanischen Digital Millennium Copyright Act einreicht.[26] Um wieviele Seiten es sich handelt und inwieweit derzeit eine Ausweitung auf andere Inhalte wie z. B. kinderpornografische oder politisch extremistische Inhalte stattfindet, ist nicht bekannt.[27][28]
Der Benutzer wird über einen Hinweis auf die Filterung der Suchergebnisse „aus Rechtsgründen“ aufmerksam gemacht. Dabei wird auf eine Erläuterung verwiesen, dass „von einer zuständigen Stelle in Deutschland mitgeteilt wurde, dass die entsprechende URL unrechtmäßig ist“. Welche zuständige Stelle das ist oder aufgrund welcher gesetzlichen Grundlage die Entfernung erfolgte, wird nicht erläutert.[29]
Literatur
- Tara Calishain, Rael Dornfest: Google Hacks. 100 Insider-Tricks & Tools. O'Reilly, Beijing 2003, ISBN 978-3-8972-1362-3.
- Marcel Machill, Markus Beiler, Martin Zenker: Journalistische Recherche im Internet. In: Schriftenreihe Medienforschung der Landesanstalt für Medien Nordrhein-Westfalen. Bestandsaufnahme journalistischer Arbeitsweisen in Zeitungen, Hörfunk, Fernsehen und Online. 60, Vistas, 2008, ISBN 978-3-8915-8480-4 (http://www.lfm-nrw.de/downloads/veranstaltungen/zus-jourrech.pdf).
- Anja Sauerwald, Michael Weckerlin: Google-Suche & Google Earth. 2. Auflage. Knowware, 2007, ISBN 978-8-7913-6434-1.
- David A. Vise, Mark Malseed: The Google Story. Bantam Doubleday Dell, New York 2005, ISBN 978-0-5538-0457-7.
- Gerald Reischl: Die Google-Falle. Die unkontrollierte Weltmacht im Internet. 5. Auflage. Carl Ueberreuter Verlag, Wien 2008, ISBN 978-3-8000-7323-8.
- Lars Reppesgaard: Das Google-Imperium. Murmann-Verlag GmbH, Hamburg 2008, ISBN 978-3-8677-4046-3.
Weblinks
Offizielle Seiten
- Google, Google Deutschland, Google Österreich, Google Schweiz, Google Liechtenstein, Google Belgien, Google Luxemburg
- Google.org
- Offizielles Google-Blog (englisch)
Artikel über Google
- Artikel zu Google und Anwendungen bei Dr. Web
- Aktuelle Kritik
- Aktuelle Nachrichten bezüglich Google im Googlewatchblog
- Google Guide (deutsch)
- Google Watch (Kritik, engl.)
Presseberichte
- „Die Welt ist keineswegs alles, was Google auflistet“, Telepolis, 25. Oktober 2002
- „Google: Der alleswissende Gigant“, tagesschau, 26. Januar 2006
- „Weltmacht Google“ stern, 22. Mai 2006, Dossier
- „Internet: Die wachsende Macht der Suchmaschinen“, FAZ, 28. Juni 2006
- „Hermann Maurer vs. Google“, ORF, futurezone.ORF.at, 3. Dezember 2007
- „neues.Spezial: Die Welt ist eine Google!“, 3sat, 30. März 2008
- „Google, ein 100.000-Dollar-Missverständnis“, Heise online, 7. September 2008
Quellenangaben
- ↑ LEO D-E Ergebnisse für "google". ([2] ; Stand: 2008-02-08).
- ↑ Nie mehr "googeln? - NachrichtenWebwelt - WELT ONLINE. ([3] ; Stand: 2008-02-08).
- ↑ Web Search for a Planet: The Google Cluster Architecture
- ↑ Susan Kuchinskas: Peeking Into Google. Artikel, 2. März 2005, Internet News http://www.internetnews.com/xSP/article.php/3487041 Abgerufen am 7. Februar 2007.
- ↑ MapReduce: Simplified Data Processing on Large Clusters
- ↑ Datenflussgraph MapReduce
- ↑ Fault-Tolerance: Re-Execution in MapReduce
- ↑ Redundant Execution in MapReduce
- ↑ Anwendung von MapReduce im Google Source Tree
- ↑ 24 sequentielle Instanzen von MapReduce im Production Indexing System
- ↑ Internet Archive Wayback Machine: Eintrag http://google.com. ([4] ; Stand: 2008-02-08).
- ↑ Elinor Mills: Google to Yahoo: Ours is bigger. 26. September 2005. Englisch. http://news.com.com/Google+touts+size+of+its+search+index/2100-1038_3-5883345.html
- ↑ Official Google Blog: We knew the web was big...
- ↑ BackRub - Details über Googles Wurzeln
- ↑ Google-Funktionen: Übersicht http://www.google.at/intl/de/features.html
- ↑ Google-Link: http://www.google.at/intl/de/searchcode.html
- ↑ Google-Suche: miserable failure. ([5] ; Stand: 2008-02-08).
- ↑ Matt Cutts: SEO Mistakes: Spam in other languages. ([6] ; Stand: 2008-02-08).
- ↑ Google setzt BMW vor die Tür - Golem.de. ([7] ; Stand: 2008-02-08).
- ↑ Google findet bmw.de wieder - Golem.de. ([8] ; Stand: 2008-02-08).
- ↑ Google: Digital Millennium Copyright Act (DMCA) – Benachrichtigung über eine Urheberrechtsverletzung in der Websuche und allen anderen Produkten.. Abgerufen am 19. April 2009.
- ↑ Sascha Zäch: Google zensiert Suchresultate. PCtipp, 24. Oktober 2002. Abgerufen am 19. April 2009.
- ↑ Burkhard Schröder: Google filtert: Zensur bei Suchmaschinen und jugendschutz.net. Telepolis, 22. Juli 2002. Abgerufen am 19. April 2009.
- ↑ German regulatory body reported illegal material. 14. Dezember 2005. Abgerufen am 19. April 2009.
Suchen: (PageRank) • Books • Desktop • Produkte • Maps • Scholar • Groups • Web
Werbung: AdSense • AdWords • Analytics • DoubleClick
Kommunikation und Publishing: App Engine • Blogger • iGoogle • Kalender • Text & Tabellen • Knol • Gmail • Groups • Health • orkut • Panoramio • Reader • YouTube
Software: Browser Sync • Chrome • Desktop • Earth • Gears • Pack • Picasa • SketchUp • Talk • Toolbar • Updater
Wikimedia Foundation.