XML-Sitemap-Dateien im UTF-8- oder ASCII-Zeichenformat
Das Sitemaps-Protokoll definiert, dass XML-Sitemap-Dokumente UTF-8 sein müssen und keine Zeichen außerhalb des ASCII-Bereichs enthalten müssen.
Einige UTF-8-Dateien beginnen möglicherweise mit einer sogenannten
BOM (Byte Order Mark), um sie als Unicode-UTF-8-Dokumentdatei zu identifizieren.
Für XML- oder UTF-8-Dokumente ist die Stückliste nicht erforderlich. Es hilft lediglich den meisten Unicode-Tools dabei, den Unicode-Text korrekt zu verarbeiten. (Obwohl nur ASCII-kompatible Dokumentparser daran ersticken könnten.)
Die Stückliste für UTF-8 sieht hexadezimal wie folgt aus:
$EF $BB $BF. Um die Stückliste in XML-Dokumentdateien wie Sitemaps anzuzeigen, müssen Sie Tools wie
Hex-Editoren verwenden.
Sie können konfigurieren, wie die Sitemap-Generator-Software XML-Sitemaps erstellt.
Unter
Sitemap erstellen | Dokumentoptionen | Zeichensatz und Typ finden Sie Optionen:
- Speichern Sie Sitemap-Dateien immer im UTF-8-Format.
- Speichern Sie UTF-8-Sitemap-Dateien mit BOM.
Das Sitemaps-Protokoll definiert, dass alle Nicht-ASCII-Zeichen URL-codiert werden müssen, auch wenn die XML-Sitemap-Datei als UTF-8 definiert ist. Das ist kein Problem, da ASCII eine Teilmenge von UTF-8 ist. Weitere Informationen finden Sie in unserem Artikel über
die URL-Kodierung von XML-Sitemaps.