Microsys
  

Website Download outputfiltre i Website Scan

Udgangsfiltre til webstedsscanning (også kendt som listefiltre) giver dig mulighed for at definere, hvilke sider du vil have anført i sitemapsektionen, efter at webstedet er gennemgået i vores webstedsdownloadsoftware.

Bemærk: Vi har en video tutorial:



Selvom videodemonstrationen bruger TechSEO360, er noget af det også relevant for brugere af A1 Website Download.



Websted Download Oversigt over webstedsoutputfiltre

Outputfiltre anvendes normalt lige efter, at webstedsgennemgangen er afsluttet. Dette betyder, at du kan få webstedsscanner til at crawle sider, der ikke nødvendigvis er inkluderet i det endelige output. Du kan bruge outputfiltre i stedet for eller sammen med webmasterfiltre ( robots.txt, noindex, nofollow osv.) og analysefiltre.

  • Skift adfærd for, hvordan og hvornår disse filtre anvendes ved at ændre:
    • Ældre versioner: Scan hjemmeside | Crawler muligheder | Anvend webmaster- og outputfiltre efter webstedsscanning.
    • Nyere versioner: Scan hjemmeside | Udgangsfiltre | Når webstedsscanningen stopper: Fjern URL'er, der er ekskluderet af "outputfiltre".

  • Ekskluder URL'er i både outputfiltre og analysefiltre for at minimere gennemgangstid, HTTP-anmodninger og hukommelsesbrug.

  • Bemærk: For at ændringer i outputfiltre skal træde i kraft, skal du scanne dit websted igen. Årsagen er, at det er webstedscrawleren, der tagger alle fundne URL'er med flag som f.eks. ekskluderet af outputfilter.


Begræns interne URL'er til dem i disse mapper

  • Links, som crawleren støder på, er normalt grupperet i kategorier internt og eksternt.
  • Med denne mulighed kan du bestemme, hvilke sider der hører til i den interne kategori.

Webstedscrawler-listekategorier


Liste filer med filtypenavn i output

URL'er med filtypenavne, der ikke findes på listen, vil ikke blive inkluderet i webstedsscanningsresultaterne.
Hvis du fjerner alle filtypenavne på listen, accepterer filtypenavnslistefiltreringen alle filer.

Webstedscrawlerlisteudvidelser


Angiv ikke URL'er, der matcher stier/strenge/regex

At ekskludere URL'er, der helt eller delvist matcher en tekststreng, sti eller regulært udtryksmønster fra output, er en måde at få de returnerede data indsnævret, når værktøjet er færdig med at crawle webstedet scannet.

Webstedscrawler-listekategorier

  • Strenge:
    • blogs matcher relative stier, der indeholder " blogs ".
    • @ matcher relative stier, der indeholder " @ ".
    • ? matcher relative stier, der indeholder " ? ".
  • Stier:
    • : s matcher relative stier, der starter med " s " såsom http://www.microsystools.com/services/ og http://www.microsystools.com/shop/.
    • : blogs/ matcher relative stier, der starter med " blogs/ ", såsom http://www.microsystools.com/ blogs/.
  • Understier:
    • : blogs/ * matcher relative stier , der ekskluderer sig selv, der starter med " blogs/ ", såsom http://www.microsystools.com/ blogs/sitemap-generator/.
  • Regulært udtryk :
    • :: blog (s?) / matcher relative stier med regex såsom http://www.microsystools.com/ blogs/ og http://www.microsystools.com/ blog/.
    • :: blogs/ (2007|2008) / matcher relative stier med regex såsom http://www.microsystools.com/blogs/ 2007/ og http://www.microsystools.com/blogs/ 2008/.
    • :: blogs/ .*? søgeord matcher relative stier med regex såsom http://www.microsystools.com/blogs/categorie/products/a1- keyword-research/.
    • :: ^$ matcher den tomme relative sti (dvs. roden) med regex såsom http://www.microsystools.com/.

Du kan downloade en projektfil, der viser forskellige outputfiltre.
Fra ovenstående eksempler kan det ses, at:
  • : alene = speciel kamp.
  • : ved start = stier matcher.
  • : ved start og * ved slutning = får stier til understier til at matche.
  • :: ved start = match med regulære udtryk.
  • Ingen af ovenstående, normal strengtekst matcher.

Sådan tilføjer du listefilterelement i rullemenuen: Indtast det og brug knappen [+].
Sådan fjernes listefilterelementet i rullemenuen: Vælg det, og brug knappen [-].
Du kan se flere oplysninger om brugergrænsefladekontrollerne, der bruges af A1 Website Download.


Føj URL'er til outputfiltre på den nemme måde

Hvis du ikke har brug for nogen af de avancerede muligheder for Scan hjemmeside | Outputfiltre, kan du finde nogle bekvemmelighedsfunktioner i tabelmenuen, der giver dig mulighed for nemt at ekskludere URL'er. osysDette er nyttigt i tilfælde, hvor du har brug for at crawle en hjemmeside flere gange.

Webstedscrawler-listekategorier
A1 Website Download
A1 Website Download | hjælp | forrige | Næste
Download og tag komplette websteder med dig for at browse på offline medier. Kopier og gem hele websteder til sikkerhedskopiering, arkivering og dokumentationsformål. Gå aldrig glip af et websted igen.
Denne hjælpeside vedligeholdes af
Som en af de ledende udviklere har hans hænder rørt det meste af koden i softwaren fra Microsys. Hvis du e-mailer spørgsmål, er chancerne for, at han vil være den, der svarer.
Del denne side med dine venner   LinkedIn   Twitter   Facebook   Pinterest   YouTube  
 © Copyright 1997-2024 Microsys

 Brug af denne side inkluderer accept af vores juridisk, privatliv og cookie information.

Se vores prisrobot indenfor emner: Maling | Stiger | Stilladser | Vinduespudsning | Robotstøvsuger | Støvsuger | Maskiner | Køkken | Kaffe | Bad | Mobil | Bærbar | Printer