Ekskluder URL'er ved oprettelse af XML-sitemaps
Du kan ekskludere URL'er på forskellige måder, f.eks. svarkode. Dette fungerer med alle slags sitemaps inklusive HTML og XML sitemaps.
Normalt udføres filtrering af URL'er af webstedscrawleren under scanning af websteder, fx gennem
outputfiltre,
filtrering af sessions-id'er i URL'er og
robots.txt-fil, nofollow og noindex.
Afhængigt af programkonfigurationen vil ikke alle URL'er vist i webstedets
trævisning blive inkluderet i genererede sitemaps.
Du kan kontrollere, om ekskluderingsrelaterede filtre er, efter at en webstedsscanning er afsluttet, eller når du bygger sitemaps:
- Ældre versioner:
- Scan hjemmeside | Crawler muligheder | Anvend "webmaster"- og "output"-filtre, efter at webstedsscanningen stopper
- Nyere versioner:
- Scan hjemmeside | Udgangsfiltre | Når webstedsscanningen stopper: Fjern ekskluderede webadresser
- Scan hjemmeside | Webmaster filtre | Efter at webstedsscanningen stopper: Fjern URL'er med noindex/disallow
- Og så:
- Tjek Opret sitemap | Dokumentindstillinger | Fjern webadresser, der er ekskluderet af "webmaster"- og "output"-filtre
Bemærk: Du kan også redigere tilstandsflag for URL'er, som f.eks
. ikke udlæses, efter at en webstedsgennemgang er afsluttet:
Ud over generel filtrering kan du også ekskludere URL'er, når du bygger sitemapfiler (inklusive HTML-sitemaps og XML-sitemaps) baseret på HTTP-svarkoder.
Generelt, når du bruger standardkonfigurationen, er det kun URL'er med en gyldig svarkode, der inkluderes, når du bygger sitemaps. Der er nogle få specifikke undtagelser, når du opretter HTML-sitemaps, men ellers
er alle uønskede URL'er udeladt.
Eksempel: URL'er, der omdirigerer med f.eks. svar
301 : Flyttet Permanent, er ikke inkluderet ved opbygning af XML-sitemaps.
Hvilke svarkoder sitemapbyggeren vil acceptere, kan indstilles i indstillingen
Opret sitemap | Dokumentmuligheder.