Sitemaps

Sitemaps

Das Sitemaps-Protokoll ermöglicht einem Webmaster, Suchmaschinen über Seiten seiner Website zu informieren, die von dieser ausgelesen werden sollen. Der Standard wurde am 16. November 2006 von Google, Yahoo! und Microsoft beschlossen. Es handelt sich um einen auf XML basierenden Standard.

Ziel des Sitemaps-Protokolls ist eine Verbesserung der Suchresultate. Der einheitliche Standard hilft bei der Etablierung dieser Art von „Etikettierung“ eines Webauftritts, da nicht, wie vor der Standardisierung, für jede Suchmaschine eine eigene Sitemap-Datei erstellt werden muss.

Inhaltsverzeichnis

Geschichte

Das Sitemaps-Protokoll basiert auf der Idee von Crawler-freundlichen Web-Servern.[1]

Google veröffentlichte im Juni 2005 die Technologie Sitemaps 0.84.[2] Mit dieser Technik konnten Webmaster eine Liste von Links auf ihre Seite veröffentlichen.

Im November 2006 machten MSN und Yahoo bekannt, dem Sitemaps-Protokoll zuzustimmen.[3] Die Revisionskennung wurde zu Sitemaps 0.90 verändert, aber das Protokoll blieb unverändert.

Im April 2007 schlossen sich Ask.com und IBM dem Standard an.[4] Zur gleichen Zeit kündigten Google, Yahoo und Microsoft Unterstützung zur Erkennung von Sitemap-Dateien durch den Robots Exclusion Standard an.

XML-Sitemap-Format

Vorlage:Infobox Dateiformat/Wartung/MagischeZahl fehltVorlage:Infobox Dateiformat/Wartung/Entwickler fehltVorlage:Infobox Dateiformat/Wartung/Art fehltVorlage:Infobox Dateiformat/Wartung/Website fehlt

Sitemaps-Datei
Dateiendung: .xml, .gz, diverse
MIME-Type: application/xml, text/xml
Erweitert von: XML
Standard(s): [1]

Sitemap-Dateien sind gewöhnliche Textdateien, die sich der Extensible Markup Language bedienen. Sitemap-Dateien müssen die Zeichenkodierung UTF-8 verwenden.

Alternativ zu der umfangreichen XML-Notation können Sitemap-Dateien auch gewöhnliche Textdateien sein, die lediglich eine Liste von URLs enthalten, etwa in der Form

http://example.com/seite1.html
http://example.com/verzeichnis/seite2.html
http://example.com/bild3.png

Zudem sieht der Standard vor, dass Sitemap-Dateien, egal welcher Form, auch gzip-komprimiert werden können.

Der Dateiname von Sitemap-Dateien ist, anders als bei robots.txt-Dateien, grundsätzlich irrelevant. Auch Dateiendungen spielen, selbst bei GZIP-Kompression, keine Rolle.

Beschränkungen

Sitemap-Dateien dürfen nach Protokoll im Gesamten nicht mehr als 50.000 URLs beinhalten und höchstens 10 MB (10.485.760 Byte) umfassen. Bei Verwendung von komprimierten Sitemap-Dateien darf die nicht komprimierte Sitemap-Datei ebenfalls nicht größer als 10 MB sein. Diese Beschränkung kann umgangen werden, indem mehrere Sitemap-Dateien verwendet werden, zu der man eine „Haupt“-Sitemap anlegt, die auf maximal 50.000 Sitemaps verweist. [5] Auf diese Weise sind theoretisch 50.000 × 50.000 = 2.500.000.000 (2,5 Milliarden) URLs beschreibbar.

Beispiel

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
 xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
 xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9
 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd">
 <url>
 <loc>http://example.com/</loc>
 <lastmod>2006-11-18</lastmod>
 <changefreq>daily</changefreq>
 <priority>0.8</priority>
 </url>
</urlset>

Einsendung von Sitemaps-Dateien bei Suchmaschinen

Anders als robots.txt-Dateien werden Sitemaps-Dateien nicht zwangsläufig an einem besonderen Ort auf der Webpräsenz veröffentlicht, sondern einer beliebigen Suchmaschine direkt zugesendet (in einer einem Pingback ähnlichen Methode). Diese gibt daraufhin Statusausgaben bzw. Fehler beim Verarbeiten der Sitemaps-Datei zurück. Die bei dieser Einsendung übergebenen Daten, d. h., die Anfragemaske und das Ausgabeformat hängen stark von der verwendeten Suchmaschinen ab, der Sitemaps-Standard macht darüber keine Aussage.

Alternativ kann die Adresse einer Sitemap-Datei auch in die robots.txt aufgenommen werden, indem man an beliebiger Position die Zeile

Sitemap: sitemap_url

einfügt, wobei sitemap_url die komplette URL zu der Sitemap darstellt.[6] Diese Information wird unabhängig von dem User-Agent-Kontext ausgewertet, daher spielt die Position der Zeile keine Rolle. Verfügt eine Webpräsenz über mehrere Sitemaps, dann sollte diese URL zur Haupt-Sitemap-Datei verweisen.

Weblinks

Einzelnachweise

  1. M. L. Nelson, J. A. Smith, del Campo, H. Van de Sompel, X. Liu: Efficient, Automated Web Resource Harvesting. 2006 (http://public.lanl.gov/herbertv/papers/f140-nelson.pdf)
    O. Brandman, J. Cho, Hector Garcia-Molina und Narayanan Shivakumar: Crawler-friendly web servers, Proceedings of ACM SIGMETRICS Performance Evaluation Review, Volume 28, Issue 2, erschienen 2000
  2. Google-Blog
  3. http://www.google.com/press/pressrel/sitemapsorg.html
  4. Ask.com and IBM announced support
  5. http://sitemaps.org/de/protocol.php
  6. Wie: http://www.example.org/sitemap.xml

Wikimedia Foundation.

Игры ⚽ Поможем написать курсовую

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Sitemaps — Sitemaps  XML файл с информацией для поисковых систем (таких как Яндекс, Google, Yahoo, Ask.com, Bing) о страницах веб сайта, которые подлежат индексации. Sitemaps может помочь поисковикам определить местонахождение страниц сайта, время их… …   Википедия

  • Sitemaps — The Sitemaps protocol allows a webmaster to inform search engines about URLs on a website that are available for crawling. A Sitemap is an XML file that lists the URLs for a site. It allows webmasters to include additional information about each… …   Wikipedia

  • Sitemaps — Le protocole Sitemaps permet à un webmestre d informer les moteurs de recherche quelles adresses d un site web sont disponibles pour l indexation automatique. Proposé initialement par Google, cette technologie a ensuite été adoptée par Live… …   Wikipédia en Français

  • sitemaps — n. listing or diagram on a World Wide Web site that shows the site s structure (Computers); map of a location, diagram of a place …   English contemporary dictionary

  • Google Sitemaps — es una herramienta que la compañía Google pone a disposición de los webmaster registrados para una mejor búsqueda y posicionamiento en su buscador. Al crear un Sitemap, Google puede rastrear más fácilmente los contenidos, además de proporcionar… …   Wikipedia Español

  • Video Sitemaps — VP Files that inform search engines what particular web page on a website an Internet video can be found …   Audio and video glossary

  • Site map — A site map (or sitemap) is a representation of the architecture of a web site. [Peter Morville, Information Architecture on the World Wide Web , Feb 1998, pp:58] It can be either a document in any form used as a planning tool for web design, or a …   Wikipedia

  • Sitemap index — A Sitemap index is an XML file that lists the multiple XML sitemap files. Sitemap index is an XML sitemap for multiple XML sitemaps. The XML format of a Sitemap index file is very similar to the XML format of a Sitemap file [ [http://www.sitemaps …   Wikipedia

  • Mapa de sitio web — Un mapa de sitio web (o mapa de sitio o mapa web) es una lista de las páginas de un sitio web accesibles por parte de los buscadores y los usuarios. Puede ser tanto un documento en cualquier formato usado como herramienta de planificación para el …   Wikipedia Español

  • Search engine submission — is how a webmaster submits a web site directly to a search engine. While Search Engine Submission is often seen as a way to promote a web site, it generally is not necessary. Because the major search engines like Google, Yahoo, and MSN use… …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”