URL-indkodning af tegn med procentkodning
Lær om URL-kodning i sitemaps, og hvilken procentdel kodning gør. Forstå hvorfor genererede XML-sitemaps og søgemaskiner ofte konverterer til URL-kodede tegn i URL'er.
Tegn i URL'er er normalt URL-kodet, når:
- Tegn vises i en kontekst, hvor dets brug er forbeholdt. Dette kan ofte ses i GET parameterværdier.
- Tegn er ikke ASCII, dvs. inden for 7bit. I sådanne tilfælde konverteres tegnet til UTF-8, og alle bytes i hvert tegn kodes derefter ind i URL'en.
Med URL-kodning konverteres hvert ASCII-tegn / hver byte i hvert UTF-8-tegn til
HEX- talsystemnotation. hexadecimalt talsystem er i URL'er præsenteret med
% efterfulgt af to symboler, der hver er enten i
0-9 eller
AF- området.
Eksempler:
- ASCII mellemrumstegn har byteværdi 32, som når URL-kodet bliver %20 :
- I decimaler: 32 = 3*10 + 2*1.
- I hexadecimal: 20 = 2*16 + 2*0.
Hvis du er usikker på, om du bruger URL-kodning, måske endda unødvendig URL-kodning, bør du først tjekke
outputsidekilden. De fleste browsere understøtter en
visningskildeindstilling.
Med linkkontrol- og sitemapværktøjer såsom
TechSEO360 kan det diskuteres, om links med ulovlig eller ikke-standard URL-kodning skal ignoreres eller konverteres, før de vises i webstedsscanningsresultaterne. Derfor kan du bruge følgende muligheder til at kontrollere, om URL'er er procentkodede under scanning af websteder:
- Scan hjemmeside | Crawler muligheder | Sørg for, at URL-"sti"-komponenten er procentkodet.
- Scan hjemmeside | Crawler muligheder | Sørg for, at URL-komponenten "forespørgsel" er procentkodet.
Bemærk: Hvis du retter tilknytningsfejl på dit websted, skal du huske, at du kan se oplysninger om alle
interne links og omdirigeringer.
Hvis du har URL'er, der skal URL-kodes, er det en fejl ikke at URL-kode dem. Nogle søgemaskiner, webcrawlere, browsere, servere osv. er i stand til korrekt at forstå URL'er, der ikke er korrekt kodet, men det er altid sikrere at få dine URL'er korrekt URL-kodet / URL-escaped med procentkodning.
Citat fra
den officielle sitemaps protokol hjemmeside:
Derudover skal alle URL'er (inklusive URL'en på dit sitemap) være URL-escaped og kodet for at kunne læses af den webserver, de er placeret på.
Bemærk: Vi har set nogle værktøjer, der fejlagtigt ikke korrekt URL-procentkode med
UTF-8 byteværdier, men i stedet bruger byteværdier fra et andet dokumenttegnsæt eller datarepræsentation, de bruger internt.
Før du begynder at læse:
- Regler for URL-kodning varierer afhængigt af stedet og konteksten i URL'en.
- Der er nogle få uoverensstemmelser i RFC- standarder på grund af opdateringer og revisioner.
Ressourcer om procentkodning i webadresser:
- RFC 1738 - Funktionelle anbefalinger til internetressourcelokalisatorer. RFC 1738 er fra februar 1995.
- RFC 2396 - Uniform Resource Identifiers (URI): Generisk syntaks. RFC 2396 er fra august 1998.
- RFC 3986 - Uniform Resource Identifier (URI): Generisk syntaks. RFC 3986 er fra januar 2005.
- Procentkodning - Wikipedia om procentkodning / hexadecimal % URL-kodning.