XML Sitemap-filer i UTF-8- eller ASCII-tegnformat
Sitemaps-protokollen definerer, at XML-sitemapdokumenter skal være UTF-8 og ikke indeholde tegn uden for ASCII-området.
Nogle UTF-8-filer starter muligvis med en såkaldt
BOM (byteordremarkering) for at identificere den som en unicode UTF-8-dokumentfil.
Styklisten er ikke påkrævet for XML- eller UTF-8-dokumenter. Det hjælper bare de fleste unicode-værktøjer til at håndtere unicode-teksten korrekt. (Selvom kun ASCII-kompatible dokumentparsere kan kvæle ved det.)
Styklisten for UTF-8 ser sådan ud i hexadecimal:
$EF $BB $BF. For at se styklisten i XML-dokumentfiler, såsom sitemaps, skal du bruge værktøjer såsom
hex-editorer.
Du kan konfigurere, hvordan sitemapgeneratorsoftwaren opretter XML-sitemaps.
I
Opret sitemap | Dokumentindstillinger | Tegnsæt og type du finder muligheder:
- Gem altid sitemapfiler som UTF-8.
- Gem UTF-8 sitemapfiler med BOM.
Sitemaps-protokollen definerer, at alle ikke-ASCII-tegn skal URL-kodes, selvom XML-sitemapfilen er defineret som UTF-8. Det er ikke et problem, da ASCII er en delmængde af UTF-8. For at læse mere, se vores artikel om
XML-sitemaps URL-kodning.