Eine XML-Sitemap ist eine strukturierte XML-Datei, die alle wichtigen URLs einer Website auflistet und Suchmaschinen wie Google dabei hilft, Seiten effizient zu crawlen und in den Index aufzunehmen.
Was bedeutet das?
Das Sitemaps-Protokoll wurde 2005 ursprünglich von Google entwickelt und 2006 gemeinsam mit Yahoo und Microsoft als offener Standard veröffentlicht. Es definiert ein XML-Format, in dem Website-Betreiber alle für die Indexierung relevanten URLs ihrer Domain mit optionalen Zusatzangaben auflisten: <lastmod> (Datum der letzten Änderung), <changefreq> (erwartete Aktualisierungshäufigkeit) und <priority> (relative Wichtigkeit zwischen 0.0 und 1.0). Google behandelt diese Zusatzfelder als unverbindliche Hinweise; ausschlaggebend für das Crawling-Verhalten bleibt das tatsächliche Verhalten der Seite.
Eine typische XML-Sitemap beginnt mit der XML-Deklaration und einem <urlset>-Wurzelelement mit Namespace-Angabe. Jeder Eintrag besteht mindestens aus dem Pflichtfeld <loc>, das die vollständige absolute URL enthält. Große Websites verwenden Sitemap-Index-Dateien, die auf mehrere Teilsitemaps verweisen, da eine einzelne Sitemap-Datei maximal 50.000 URLs und 50 MB umfassen darf.
WordPress generiert seit Version 5.5 (August 2020) automatisch eine Kernsitemap unter /wp-sitemap.xml. Diese enthält Beiträge, Seiten, benutzerdefinierte Beitragstypen und Autoren-Archivseiten. SEO-Plugins wie Rank Math oder Yoast SEO ersetzen diese Core-Sitemap durch erweiterte Varianten mit Bildangaben, Newssitemaps und konfigurierbaren Filteroptionen.
Beispiel aus der Praxis
Eine WordPress-Website mit 200 Unterseiten wird auf eine neue Domain migriert. Der Webmaster aktualisiert nach dem Umzug die XML-Sitemap, sodass alle neuen URLs korrekt verzeichnet sind, und reicht sie anschließend in der Google Search Console unter dem Bereich „Sitemaps“ ein. Google crawlt daraufhin die neuen URLs systematisch, ohne auf interne Verlinkungen angewiesen zu sein. Gleichzeitig werden die alten URLs durch 301-Weiterleitungen aus dem Index abgelöst.
Tipp aus der Praxis
Eine XML-Sitemap verbessert das Crawling, ersetzt aber keine sorgfältige interne Verlinkung und ist kein Schnellweg zu besseren Rankings. Prüfen Sie vor der Einreichung, ob alle gelisteten URLs öffentlich erreichbar sind, korrekte kanonische Tags tragen und für die Indexierung freigegeben sind. Seiten mit einem noindex-Meta-Tag haben in der Sitemap nichts zu suchen, da dies widersprüchliche Signale an den Crawler sendet. Umgekehrt sollte jede strategisch wichtige Seite in der Sitemap erscheinen und auch intern verlinkt sein. Viele SEO-Plugins bieten eine Vorschau der generierten Sitemap sowie eine Whitelist- und Blacklist-Funktion, mit der sich einzelne Post-Typen oder Taxonomien gezielt ein- oder ausschließen lassen.