Sitemaps – das muss man darüber wissen!
Eine Landkarte der Website: Sitemaps stellen die Struktur von Webauftritten dar, inklusive aller Verzeichnisse und Unterseiten. Dabei sind sie heute nicht mehr unbedingt für die Besucher der Website gedacht. Für diese gibt es meist eine sehr viel übersichtlichere Navigation. Das heißt aber nicht, dass Website-Betreiber ihre Sitemap vernachlässigen können. Doch wozu genau braucht man diese Übersicht und was für Varianten gibt es?
Was ist eine Sitemap?
Innerhalb einer Sitemap (auf Deutsch: „Seitenkarte“) sind alle Dokumente – soll heißen: Webseiten – einer Website hierarchisch aufgeführt. Das bedeutet, dass die Struktur des kompletten Webauftritts in dieser Übersicht wiedergegeben wird. Um das zu verstehen, sollte man sich kurz den Aufbau einer Website vergegenwärtigen: Eine einfache Website besteht aus einzelnen HTML-Dokumenten, die in unterschiedlichen Ordnern liegen und untereinander durch Hyperlinks verknüpft sind. Alle zusammen liegen auf dem Webspace. In der Sitemap sind die Seiten zusammen mit den dazugehörigen URLs erfasst.
In den Anfangstagen des World Wide Web hat man eine Sitemap in erster Linie angelegt, um Besuchern die Navigation zu erleichtern. Oftmals als Extra-Frame neben dem Hauptinhalt eingeblendet, gaben die zusätzlichen Sitemap-Dokumente den Besuchern die Möglichkeit, jederzeit von einer Seite auf eine andere zu gelangen, ohne sich über einzelne Hyperlinks durchklicken zu müssen. Inzwischen wird die Navigation in den meisten Fällen sehr viel eleganter gelöst, doch die Sitemap hat immer noch ihre Berechtigung: Zum einen kann die zusätzliche Navigation die Benutzerfreundlichkeit steigern, zum anderen greifen Suchmaschinen auf diese Dateien zu.
XML vs. HTML: Sitemaps im Vergleich
Man unterscheidet generell zwischen zwei Varianten der Sitemap: Zum einen gibt es die Navigation im XML-Format und zum anderen gibt es HTML-Sitemaps. Wenn man die Sitemap auch den Besuchern einer Website zur Verfügung stellen möchte, erstellt man eine HTML-Sitemap. Diese ist somit ein weiteres Dokument der Website und kann genauso wie alle anderen HTML-Seiten in die Struktur des Online-Auftritts eingegliedert werden. Eine Sitemap, die im XML-Format verfasst ist, richtet sich hingegen vornehmlich an Suchmaschinen. XML ist, genau wie HTML, eine Auszeichnungssprache, bietet allerdings mehr Funktionen.
Daraus ergeben sich Vor- und Nachteile von XML- und HTML-Sitemaps: Eine Navigationsdatei im HTML-Format ist ohne weiteres für Besucher der Website nutzbar. User können sich mit den Verlinkungen einfach auf der Seite zurechtfinden, wenn sie etwas suchen. Damit steht die Sitemap parallel zur Suchfunktion und einer Navigationsleiste. Die Sitemap ist somit ein zusätzliches Angebot an die Besucher und erhöht die Benutzerfreundlichkeit. Heutzutage blendet man die Sitemap allerdings für gewöhnlich nicht mehr als Frame ein. Stattdessen stellt man z. B. über Kopf- oder Fußzeile jederzeit einen Link auf das übersichtliche Dokument bereit.
Verfasst man eine Sitemap im XML-Format, kann man diese etwa in der Google Search Console einreichen. So erhält die Suchmaschine ein besseres Verständnis von der kompletten Website. Über XML lässt sich zudem eine sogenannte Video-Sitemap erstellen. Für Google und andere Suchmaschinen ist es schwierig, den Inhalt einer Videodatei auszulesen. Deshalb sind sie auf zusätzliche Informationen angewiesen, sogenannte Metadaten. Wenn man Videos auf der eigenen Website eingebaut hat und möchte, dass Google diese in die Videosuche integriert, sollte man eine Video-Sitemap anbieten.
Dafür erstellt man eine XML-Datei, die Informationen zu den einzelnen Clips auf der Seite liefert. Zu den Informationen gehören Titel und Beschreibung der Videodatei, die URL zu der Unterseite, auf der der Clip gezeigt wird, ein Link zu einem Thumbnail-Bild und der Speicherort des verwendeten Videoplayers. Gleiches funktioniert übrigens auch für Bilder, damit diese in der Bildersuche auftauchen.
Als Webmaster muss man sich aber gar nicht entscheiden, ob man lieber auf eine XML- oder eine HTML-Sitemap setzt. Denn beides zusammen ist ebenfalls möglich: Dies liefert das beste Ergebnis, sowohl für die Besucher der Website als auch für die Webcrawler von Google und anderen Suchmaschinen. Zwar richtet sich die XML-Variante direkt an die Suchmaschine, aber auch HTML-Sitemaps werden von Webcrawlern beim Durchsuchen der Website als einfache Möglichkeit genutzt, um alle Seiten zu berücksichtigen.
Noch mehr Informationen darüber, was eine gute XML-Sitemap ausmacht und wie sie eine sitemap.xml-Datei erstellen, erhalten Sie in unserem ausführlichen Artikel zu dem Thema.
Sitemaps & SEO
Sitemaps spielen eine große Rolle bei der Search Engine Optimization (SEO = Suchmaschinenoptimierung). Warum ist das so? Suchmaschinen lassen Programme – die bekannten Webcrawler bzw. Searchbots – das Internet durchforsten, um dieses möglichst gut erfassen und indexieren zu können. Gelangt ein solches Programm auf eine Website, folgt es den Hyperlinks, um deren Inhalte festzustellen. Dabei kann aber nicht garantiert werden, dass das Programm auch wirklich alle Unterseiten erfasst. Das gilt umso mehr, wenn es sich um eine sehr umfangreiche Website handelt. Eine Sitemap – und zwar sowohl im XML- als auch im HTML-Format – stellt dem Suchmaschinen-Bot einen Index aller Seiten zur Verfügung und vereinfacht die Indexierung.
Auch bei Seiten, die nicht besonders gut mit anderen Seiten verknüpft sind, ist eine Sitemap mehr als hilfreich. Webcrawler folgen immer Hyperlinks, um sich durch das World Wide Web zu bewegen. In einer Sitemap sollte daher auf jede einzelne Seite verlinkt werden. Google gibt zwar auch dann keine Garantie, dass der Bot wirklich jede Seite berücksichtigt, die Wahrscheinlichkeit ist aber in jedem Fall höher. Das gilt auch dann, wenn die Website noch ziemlich neu ist und bisher nur wenige oder gar keine externen Links auf die Seiten des neuen Webauftritts verweisen.
Eine gut geführte Sitemap im XML-Format liefert der Suchmaschine außerdem weitere Informationen zur entsprechenden Webseite: Wann wurde diese erstellt? Wie häufig wird sie bearbeitet? In welcher Beziehung steht diese Seite zu den anderen der Website? Wie wichtig ist der Inhalt im Kontext des kompletten Auftritts?
Auch wenn man generell sagen kann, dass sich eine HTML-Sitemap eher an Nutzer richtet und das Pendant in XML eher an Webcrawler, sind beide im SEO-Kontext wichtig. Sitemaps im HTML-Format können nämlich ebenso Einfluss auf das Ranking haben, denn auch diese Dokumente werden beim Durchsuchen der Seite berücksichtigt. Google achtet bei der Festlegung der Reihenfolge in den Suchergebnissen zudem auf die Benutzerfreundlichkeit von Websites. Mit einer übersichtlichen Sitemap steigert man die Usability und kann dadurch u. U. auch sein Ranking verbessern.
Erstellen einer Sitemap – an Beispielen erklärt
Eine Sitemap zu erstellen, ist nicht schwer, und mit einem Sitemap-Generator fällt es sogar noch leichter. Abhängig vom Format, das man erzeugen will, muss man dabei unterschiedlich vorgehen. Die HTML-Sitemap ist grundsätzlich leichter zu erstellen. Hierfür muss man nur ein paar HTML-Grundlagen kennen, vor allem, wie man Links korrekt markiert. Unter Verwendung des href-Attributs lässt sich eine Liste mit Links anlegen. In der Praxis werden Webmaster aber mehr Energie beim Sitemap-Erstellen aufwenden und z. B. das Design des Navigationsdokuments an den Rest der Website anpassen.
<li class="lpage"><a href="http://one-test.website/" title="Theme Preview – Previewing Another WordPress Blog">Theme Preview – Previewing Another WordPress Blog</a></li>
Theme Preview – Previewing Another WordPress Blog
<li class="lpage"><a href="http://one-test.website/about-us" title="About us – Theme Preview">About us – Theme Preview</a></li>
<li class="lpage"><a href="http://one-test.website/our-projects" title="Our Projects – Theme Preview">Our Projects – Theme Preview</a></li>
<li class="lpage"><a href="http://one-test.website/sample-page" title="Sample Page – Theme Preview">Sample Page – Theme Preview</a></li>
<li class="lpage"><a href="http://one-test.website/shop" title="Products – Theme Preview">Products – Theme Preview</a></li>
Das Erstellen der Datei im XML-Format ist schon um einiges umfangreicher: Hierbei beginnt die Sitemap mit einem <urlset>-Tag. Innerhalb dieser Klammer werden die einzelnen URLs eingetragen. Diese liegen wiederum eingebettet in ein <url>-Tag, wobei der eigentliche Link auf die Unterseite im <loc>-Tag steht. Während diese Angaben immer enthalten sein müssen, sind die zusätzlichen Informationen zur Änderungsfrequenz (<changefreq>), zum Datum der letzten Änderung (<lastmode>) und der Wichtigkeit der Seite (<priority>) optional.
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"></urlset>
<url></url>
<loc>http://one-test.website/</loc>
<lastmod>2018-03-23T14:32:21+00:00</lastmod>
<priority>1.00</priority>
<url></url>
<loc>http://one-test.website/about-us</loc>
<lastmod>2018-03-23T14:32:21+00:00</lastmod>
<priority>0.80</priority>
Wer es sich einfacher machen möchte und nicht die komplette Sitemap per Hand schreiben will, kann auf einen Sitemap-Generator zurückgreifen. Bei diesen Webdiensten trägt man einfach nur die Haupt-URL der eigenen Webpräsenz ein – der Sitemap-Generator durchsucht daraufhin die komplette Website und erstellt so einen Index aller Seiten. Die praktischen Online-Hilfsmittel gibt es sowohl für XML- als auch für HTML-Sitemaps. Manche Generatoren erstellen gleich mehrere Varianten für die Nutzer. Für einige Content-Management-Systeme wie WordPress sind Plug-ins verfügbar, die das Erstellen von Sitemaps übernehmen.
Google-Empfehlungen für Sitemaps
Auch wenn man relativ frei entscheiden kann, wie das Navigationsdokument aussehen soll, stellt Google für Sitemaps ein paar Bedingungen, an die man sich halten sollte, wenn man sein Suchmaschinenranking verbessern möchte. So muss die Sitemap in UTF-8 codiert sein, darf nicht mehr als 50.000 URLs beinhalten und sollte nicht größer als 50 MB sein. Die Größenbegrenzung gilt für die unkomprimierte Datei. Zwar kann man Sitemaps bei Google auch in einer gepackten Variante einreichen, doch dies erhöht nicht die maximale Dateigröße.
Google schlägt vor, bei sehr umfangreichen Webauftritten mehrere Sitemaps zu erstellen. Anschließend erzeugt man eine Index-Datei, die Bezüge zu allen anderen Sitemaps enthält, und reicht diese bei der Suchmaschine ein.
Man muss nicht zwingend alle Seiten einer Website in die Sitemap aufnehmen. Auch bei Seiten, die durch verschiedene URLs aufgerufen werden können, wählt man nur die bevorzugte Adresse. Das Gleiche gilt für Webseiten, die sich sehr stark ähneln (wenn sie z. B. mit dem gleichen Inhalt, aber für verschiedene Geräte erstellt wurden): Man gibt nur die sogenannte kanonische Seite an, mit der Google arbeiten soll.
Um die Sitemap schließlich bei Google bekannt zu machen, gibt es zwei Möglichkeiten: Zum einen lässt sich die Datei direkt in der Search Console hochladen, zum anderen kann in der robots.txt ein Verweis auf die Datei eingefügt werden. Diese Textdatei ist speziell für Suchmaschinen konzipiert und wird beim Crawlen zuerst aufgerufen. Mit einer Verlinkung auf die Sitemap, die auf dem Server liegt, weiß der Suchbot, wo er als nächstes gucken muss.