Google bot

Googlebot ist der Webcrawler der Suchmaschine Google. Dabei handelt es sich um ein Computerprogramm, das Texte und Bilder im World Wide Web herunterlädt und diese über die Web- und die Bildsuche von Google auffindbar macht.

Inhaltsverzeichnis

1 Arbeitsweise
2 Identifikation
3 Verifikation
4 Quellen
5 Weblinks

Arbeitsweise

Zwischen dem Herunterladen einer Dateiversion und der Aktualisierung von Googles Index mit dem Inhalt dieser neuen Version im Fall einer Veränderung liegen üblicherweise einige Tage. Wie oft Googlebot eine Seite besucht, hängt unter anderem davon ab, wie viele externe Links auf diese Seite verweisen und wie hoch ihr PageRank-Wert ist.

Um die Zugriffe auf die zu indizierende Seite möglichst gering zu halten wird zunächst jeder Crawlvorgang in einem von allen Googlebots genutzten Cache abgelegt. Wird eine Seite von mehreren Bots innerhalb eines bestimmten Zeitraumes besucht, kann die Anfrage somit aus dem Cache bedient werden.^[1]

Googlebot beachtet die Datei robots.txt und die Robots-Anweisungen in HTML-Meta-Tags.

Identifikation

Googlebot identifiziert sich, je nach Aufgabe, unter anderem mit den folgenden User-Agent-Kennungen:

Googlebot/2.1 (+http://www.google.com/bot.html)
Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
Googlebot-Image/1.0

Ein weiterer Google-Crawler dient dazu, Seiten herunterzuladen, um passende Werbung im Rahmen des Google-AdSense-Programms zu ermitteln. Er identifiziert sich wie folgt:

Mediapartners-Google/2.1

Verifikation

Manche Web-Benutzer und Crawler geben sich über diese Kennungen fälschlicherweise als Googlebot aus, in der Hoffnung, dass ein Site-Betreiber für Googlebot besonders gute oder werbefreie Inhalte bereitstellt.

Um festzustellen, ob es sich bei einem Besucher tatsächlich um Googles Crawler handelt, empfiehlt Google die Verwendung des Domain Name System. Zunächst wird die IP-Adresse des Besuchers mittels einer inversen Anfrage in einen Domain-Namen übersetzt, der auf googlebot.com enden sollte. Anschließend überprüft man mit einer regulären DNS-Anfrage (forward lookup), ob man wieder die ursprüngliche IP-Adresse des Besuchers erhält.^[2]

Quellen

↑ Matt Cutts: Crawl caching proxy, 23. April 2006
↑ Matt Cutts: How to verify Googlebot. 20. September 2006. Official Google Webmaster Central Blog, http://googlewebmastercentral.blogspot.com/2006/09/how-to-verify-googlebot.html (abgerufen am 13. November 2006).

Weblinks

Fragen und Antworten zum Googlebot

Wikimedia Foundation.

Игры ⚽ Поможем решить контрольную работу

Schlagen Sie auch in anderen Wörterbüchern nach:

Google-Toolbar — Entwickler: Google Inc. Aktuelle Version: Firefox 3.1.20080605W Internet Explorer 5.0.2124.6042 … Deutsch Wikipedia
Google Toolbar — Entwickler Google Inc. (mehr) Aktuelle Version 7 (15 April 2011) Betriebssystem … Deutsch Wikipedia
Google Answers — war ein von April 2002 bis November 2006 von Google angebotener digitaler Auskunftsdienst. Die Google Dienstleistungen Google Answers bot personalisierte Forschungsdienste gegen eine Gebühr (zwischen 2,50 und 200 US Dollar). Die Recherche wurde… … Deutsch Wikipedia
bot — spider, Also known as bot or crawler. A computer program or programs which seek out and collect information from publicly available websites. Such programs are used by search engines (such as Yahoo!, Google and AltaVista) to visit websites and… … Law dictionary
Bot référenceur — Robot d indexation Pour les articles homonymes, voir Spider. Un robot d indexation (ou littéralement araignée du Web ; en anglais web crawler ou web spider) est un logiciel qui explore automatiquement le Web. Il est généralement conçu pour… … Wikipédia en Français
Desktop bot — Desktop bots are small applications that run in the background on personal computers, performing a basic indexing or remote retrieval function. Taxonomy of desktop bots Desktop Bots are small applications that act as a background service to… … Wikipedia
Web Bot — Web Bot, or the Web Bot Project, refers to an Internet bot software program that is claimed to be able to predict future events by tracking keywords entered on the Internet. It was created in 1997, originally to predict stock market trends.[1]… … Wikipedia
Liste von Google-Produkten — Die Search Appliance auf der RSA Conference 2008 in San Francisco Google bietet eine Vielzahl kostenloser Dienstleistungen im World Wide Web an. Nach eigenen Angaben werden diese über das AdWords Programm finanziert, in dem Werbeflächen auf… … Deutsch Wikipedia
Internet bot — Web bot redirects here. For the prediction software, see Web Bot. For bot operation on Wikipedia, see Wikipedia:Bots. For other uses, see Bot (disambiguation). Internet bots, also known as web robots, WWW robots or simply bots, are software… … Wikipedia
S-bot mobile robot — The s bot is a small (15 cm) differential wheeled (with additional tracks) mobile robot developed at the LIS (Laboratory of Intelligent Systems [http://lis.epfl.ch/] ) at the EPFL in Lausanne, Switzerland between 2001 and 2004. Targeted to swarm… … Wikipedia

Academic dictionaries and encyclopedias

Google bot

Inhaltsverzeichnis

Arbeitsweise

Identifikation

Verifikation

Quellen

Weblinks

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Academic dictionaries and encyclopedias

Deutsch Wikipedia

Google bot

Inhaltsverzeichnis

Arbeitsweise

Identifikation

Verifikation

Quellen

Weblinks

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Direct link