- Duplicate Content
-
Der Begriff Duplicate Content (engl. für „doppelter Inhalt“) kommt aus der Suchmaschinenoptimierung und bezeichnet gleichen Inhalt auf verschiedenen Webseiten. Dies gilt sowohl für Webseiten der gleichen als auch unterschiedlichen Domains.
Duplicate Content kann entstehen, wenn mehrere URLs auf den gleichen Inhalt zeigen. Dies kann beispielsweise so sein, wenn an eine URL noch Parameter angehängt werden und der Inhalt der Seiten trotzdem (nahezu) gleich bleibt. Ein anderes Beispiel ist eine andere Reihenfolge von Parametern in der URL: www.example.com/index.php?a=1&b=2 und www.example.com/index.php?b=2&a=1 liefern normalerweise identische Seiten, sind aber verschiedene URLs. Suchmaschinen sehen also zwei Adressen, die ähnliche oder gleiche Inhalte haben und werden bei entsprechenden Suchanfragen nur eine dieser Seiten anzeigen.
Mit dem Canonical Link kann man für die Suchmaschine angeben, unter welcher URL die "Original"-Seite liegt. Die Verwendung dieses Tags bietet sich immer dann an, wenn die Erreichbarkeit über verschiedene URLs zwingend nötig ist. Ein konkretes Beispiel dafür sind spezielle Druckversionen einer Webseite.
Eine weitere, häufig anzutreffende Form von Duplicate Content entsteht bei der Verfügbarkeit einer Webseite unter Angabe der www-Subdomain, wenn diese gleichzeitig auch ohne diese Angabe erreichbar ist (also zum Beispiel http://www.example.com/ und http://example.com/). Dieses Problem tritt dabei in der Regel auf jeder einzelnen Unterseite einer Domain automatisch auf. Als Lösung bietet sich die Einrichtung einer Weiterleitung an, so dass zum Beispiel der Aufruf von http://www.example.com/ zu http//example.com/ weiterleitet. Dazu sollte http://www.example.com/ den HTTP-Statuscode 301 ausliefern, so dass auch die Crawler einer Suchmaschine die Weiterleitung erkennen.
Weblinks
Wikimedia Foundation.