Dienstag, 17. Februar 2009

Google, Microsoft und Yahoo! gehen gegen Duplicate Content vor

Von Stefan Benaburger, Teamleader Editorial
17. Februar 2009


„rel=canonical“ heißt der neue HTML-Tag, auf das sich Google, Microsoft und Yahoo! gemeinsam im Kampf gegen Duplicate Content verständigt und als neuen Standard etabliert haben. Dieser Tag soll Webmastern und CMS-Administratoren helfen, doppelte Webseiteninhalte in Zukunft zu vermeiden.

Der HTML-Code lautet wie folgt: <link rel='canonical' href='...' />

Der Canonical-Tag wird in den Header von Webseiten eingebunden. So wird der Ursprung von Seiteninhalten festgelegt und das Originaldokument verlinkt. Die Suchmaschinen-Branche hat auf dieses Hilfsmittel schon lange gewartet.

Duplicate Content bereitet nämlich in zweierlei Hinsicht Probleme:

1. Duplicate Content wird als Spam identifiziert.

Google, LiveSearch und Yahoo! sind ja stets bemüht Ihren Usern möglichst passende Suchergebnisse zu liefern. Findet nun der Webcrawler wiederholt denselben Inhalt nur unter verschiedenen URLs, so stuft er ihn als Spam ein und indiziert ihn in Zukunft nicht mehr oder zeigt die Seite nicht unter den ersten 50 Ergebnisseiten an.

2. Duplicate Content reduziert die Crawling-Frequenz.

Webcrawler besuchen Webseiten nicht willkürlich, sondern in einem bestimmten Rhythmus und mit einer maximalen Obergrenze an Besuchen. Gelangt der Bot nun über verschiedene URLs immer wieder zu demselben Inhalt, so ist das Crawling-Kontingent damit bereits teilweise aufgebraucht, obwohl der Bot im Prinzip immer nur denselben Inhalt gescannt hat. Tritt dieses Phänomen auf der gesamten Website auf, so reduziert sich die Crawling-Tiefe erheblich und viele wertvolle Unique-Content-Seiten werden nicht mehr indiziert, weil der Suchmaschinen-Bot seine Arbeit getan hat und weitergezogen ist.

Die Folgen aus beiden Problemen sind eine sinkende Platzierung im organischen Suchindex und demzufolge auch weniger Traffic auf der Seite.

Matt Cutts, Head of Google's Webspam Team , bezeichnet den Canonical-Tag als eine Art „wichtige Empfehlung“ für die betreffende Seite. Es hält die Suchmaschinen davon ab, identischen Inhalt unter einer anderen URL weiter zu indizieren. So durchsucht der Suchmaschinen-Bot nach weiterem Unique Content, anstatt die gleichen Inhalte immer wieder in seinen Index zu kopieren. Eine Einschränkung besteht allerdings: Der Tag ist nur für die eigene Website sowie deren Subdomains gültig und ist nicht domainübergreifend. Für solche Konstellationen bieten sich eher permanente Umleitungen (301-Redirects) an.

Es gibt bereits Plug-Ins für Blogsysteme wie Wordpress und für Content Management Systeme wie Drupal und weitere CMS.
Home | Karriere | RSS | Kontakt | Newsletter
Internationale Websites: