Website Download outputfiltre i Website Scan
Udgangsfiltre til webstedsscanning (også kendt som listefiltre) giver dig mulighed for at definere, hvilke sider du vil have anført i sitemapsektionen, efter at webstedet er gennemgået i vores webstedsdownloadsoftware.
Bemærk: Vi har en video tutorial:
Selvom videodemonstrationen bruger
TechSEO360, er noget af det også relevant for brugere af
A1 Website Download.
Outputfiltre anvendes normalt
lige efter, at webstedsgennemgangen er afsluttet. Dette betyder, at du kan få webstedsscanner til at crawle sider, der ikke nødvendigvis er inkluderet i det endelige output. Du kan bruge
outputfiltre i stedet for eller sammen med
webmasterfiltre (
robots.txt,
noindex,
nofollow osv.) og
analysefiltre.
- Skift adfærd for, hvordan og hvornår disse filtre anvendes ved at ændre:
- Ældre versioner: Scan hjemmeside | Crawler muligheder | Anvend webmaster- og outputfiltre efter webstedsscanning.
- Nyere versioner: Scan hjemmeside | Udgangsfiltre | Når webstedsscanningen stopper: Fjern URL'er, der er ekskluderet af "outputfiltre".
- Ekskluder URL'er i både outputfiltre og analysefiltre for at minimere gennemgangstid, HTTP-anmodninger og hukommelsesbrug.
- Bemærk: For at ændringer i outputfiltre skal træde i kraft, skal du scanne dit websted igen. Årsagen er, at det er webstedscrawleren, der tagger alle fundne URL'er med flag som f.eks. ekskluderet af outputfilter.
URL'er med filtypenavne, der
ikke findes på listen, vil
ikke blive inkluderet i webstedsscanningsresultaterne.
Hvis du fjerner alle filtypenavne på listen, accepterer filtypenavnslistefiltreringen alle filer.
At ekskludere URL'er, der helt eller delvist matcher en
tekststreng,
sti eller
regulært udtryksmønster fra
output, er en måde at få de returnerede data indsnævret, når værktøjet er færdig med at crawle webstedet scannet.
- Strenge:
- blogs matcher relative stier, der indeholder " blogs ".
- @ matcher relative stier, der indeholder " @ ".
- ? matcher relative stier, der indeholder " ? ".
- Stier:
- : s matcher relative stier, der starter med " s " såsom http://www.microsystools.com/services/ og http://www.microsystools.com/shop/.
- : blogs/ matcher relative stier, der starter med " blogs/ ", såsom http://www.microsystools.com/ blogs/.
- Understier:
- : blogs/ * matcher relative stier , der ekskluderer sig selv, der starter med " blogs/ ", såsom http://www.microsystools.com/ blogs/sitemap-generator/.
- Regulært udtryk :
- :: blog (s?) / matcher relative stier med regex såsom http://www.microsystools.com/ blogs/ og http://www.microsystools.com/ blog/.
- :: blogs/ (2007|2008) / matcher relative stier med regex såsom http://www.microsystools.com/blogs/ 2007/ og http://www.microsystools.com/blogs/ 2008/.
- :: blogs/ .*? søgeord matcher relative stier med regex såsom http://www.microsystools.com/blogs/categorie/products/a1- keyword-research/.
- :: ^$ matcher den tomme relative sti (dvs. roden) med regex såsom http://www.microsystools.com/.
Du kan downloade en
projektfil, der viser forskellige outputfiltre.
Fra ovenstående eksempler kan det ses, at:
- : alene = speciel kamp.
- : ved start = stier matcher.
- : ved start og * ved slutning = får stier til understier til at matche.
- :: ved start = match med regulære udtryk.
- Ingen af ovenstående, normal strengtekst matcher.
Sådan tilføjer du listefilterelement i rullemenuen: Indtast det og brug knappen
[+].
Sådan fjernes listefilterelementet i rullemenuen: Vælg det, og brug knappen
[-].
Du kan se flere oplysninger om
brugergrænsefladekontrollerne, der bruges af
A1 Website Download.
Hvis du ikke har brug for nogen af de avancerede muligheder for
Scan hjemmeside | Outputfiltre, kan du finde nogle bekvemmelighedsfunktioner i
tabelmenuen, der giver dig mulighed for nemt at ekskludere URL'er. osysDette er nyttigt i tilfælde, hvor du har brug for at crawle en hjemmeside flere gange.