Google bot

Google bot

Googlebot ist der Webcrawler der Suchmaschine Google. Dabei handelt es sich um ein Computerprogramm, das Texte und Bilder im World Wide Web herunterlädt und diese über die Web- und die Bildsuche von Google auffindbar macht.

Inhaltsverzeichnis

Arbeitsweise

Zwischen dem Herunterladen einer Dateiversion und der Aktualisierung von Googles Index mit dem Inhalt dieser neuen Version im Fall einer Veränderung liegen üblicherweise einige Tage. Wie oft Googlebot eine Seite besucht, hängt unter anderem davon ab, wie viele externe Links auf diese Seite verweisen und wie hoch ihr PageRank-Wert ist.

Um die Zugriffe auf die zu indizierende Seite möglichst gering zu halten wird zunächst jeder Crawlvorgang in einem von allen Googlebots genutzten Cache abgelegt. Wird eine Seite von mehreren Bots innerhalb eines bestimmten Zeitraumes besucht, kann die Anfrage somit aus dem Cache bedient werden.[1]

Googlebot beachtet die Datei robots.txt und die Robots-Anweisungen in HTML-Meta-Tags.

Identifikation

Googlebot identifiziert sich, je nach Aufgabe, unter anderem mit den folgenden User-Agent-Kennungen:

Googlebot/2.1 (+http://www.google.com/bot.html)
Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
Googlebot-Image/1.0

Ein weiterer Google-Crawler dient dazu, Seiten herunterzuladen, um passende Werbung im Rahmen des Google-AdSense-Programms zu ermitteln. Er identifiziert sich wie folgt:

Mediapartners-Google/2.1

Verifikation

Manche Web-Benutzer und Crawler geben sich über diese Kennungen fälschlicherweise als Googlebot aus, in der Hoffnung, dass ein Site-Betreiber für Googlebot besonders gute oder werbefreie Inhalte bereitstellt.

Um festzustellen, ob es sich bei einem Besucher tatsächlich um Googles Crawler handelt, empfiehlt Google die Verwendung des Domain Name System. Zunächst wird die IP-Adresse des Besuchers mittels einer inversen Anfrage in einen Domain-Namen übersetzt, der auf googlebot.com enden sollte. Anschließend überprüft man mit einer regulären DNS-Anfrage (forward lookup), ob man wieder die ursprüngliche IP-Adresse des Besuchers erhält.[2]

Quellen

  1. Matt Cutts: Crawl caching proxy, 23. April 2006
  2. Matt Cutts: How to verify Googlebot. 20. September 2006. Official Google Webmaster Central Blog, http://googlewebmastercentral.blogspot.com/2006/09/how-to-verify-googlebot.html (abgerufen am 13. November 2006).

Weblinks


Wikimedia Foundation.

Игры ⚽ Поможем написать курсовую

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Google-Toolbar — Entwickler: Google Inc. Aktuelle Version: Firefox 3.1.20080605W Internet Explorer 5.0.2124.6042 …   Deutsch Wikipedia

  • Google Toolbar — Entwickler Google Inc. (mehr) Aktuelle Version 7 (15 April 2011) Betriebssystem …   Deutsch Wikipedia

  • Google Answers — war ein von April 2002 bis November 2006 von Google angebotener digitaler Auskunftsdienst. Die Google Dienstleistungen Google Answers bot personalisierte Forschungsdienste gegen eine Gebühr (zwischen 2,50 und 200 US Dollar). Die Recherche wurde… …   Deutsch Wikipedia

  • bot — spider, Also known as bot or crawler. A computer program or programs which seek out and collect information from publicly available websites. Such programs are used by search engines (such as Yahoo!, Google and AltaVista) to visit websites and… …   Law dictionary

  • Bot référenceur — Robot d indexation Pour les articles homonymes, voir Spider. Un robot d indexation (ou littéralement araignée du Web ; en anglais web crawler ou web spider) est un logiciel qui explore automatiquement le Web. Il est généralement conçu pour… …   Wikipédia en Français

  • Desktop bot — Desktop bots are small applications that run in the background on personal computers, performing a basic indexing or remote retrieval function. Taxonomy of desktop bots Desktop Bots are small applications that act as a background service to… …   Wikipedia

  • Web Bot — Web Bot, or the Web Bot Project, refers to an Internet bot software program that is claimed to be able to predict future events by tracking keywords entered on the Internet. It was created in 1997, originally to predict stock market trends.[1]… …   Wikipedia

  • Liste von Google-Produkten — Die Search Appliance auf der RSA Conference 2008 in San Francisco Google bietet eine Vielzahl kostenloser Dienstleistungen im World Wide Web an. Nach eigenen Angaben werden diese über das AdWords Programm finanziert, in dem Werbeflächen auf… …   Deutsch Wikipedia

  • Internet bot — Web bot redirects here. For the prediction software, see Web Bot. For bot operation on Wikipedia, see Wikipedia:Bots. For other uses, see Bot (disambiguation). Internet bots, also known as web robots, WWW robots or simply bots, are software… …   Wikipedia

  • S-bot mobile robot — The s bot is a small (15 cm) differential wheeled (with additional tracks) mobile robot developed at the LIS (Laboratory of Intelligent Systems [http://lis.epfl.ch/] ) at the EPFL in Lausanne, Switzerland between 2001 and 2004. Targeted to swarm… …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”