Microsys
  

Analyser intern link med A1-websideskraber

Hvis du vil se, hvorfra en side eller fil er linket/brugt/omdirigeret til af, kan du gøre det med vores webstedsskrabersoftware.

Bemærk: Vi har en video tutorial:



Selvom videodemonstrationen bruger A1 Website Analyzer, er noget af det også anvendeligt for brugere af A1 Website Scraper.



Analyse af links og omdirigeringer

Du skal scanne dit websted, før du kan se alle de URL'er, der findes på webstedet! Hvis du oplever webstedscrawl-problemer, f.eks. får færre end forventet fundne URL'er under webstedsscanning, se vores artikel om løsning af webstedscrawl-problemer.

Hvis du er interesseret i at se, hvordan sider linkes sammen, giver A1 Website Scraper dig fuld adgang til at se , der er linket til af, omdirigeret til af, brugt af og masser af andre relaterede data. Dette er nyttigt til at finde brudte links, der giver f.eks. svarkode 404 Ikke fundet eller svarkode 301 Flyttet Permanent fejl. Du kan skifte mellem oplysningerne vist i Udvidede data ved at bruge fanerne nederst.

Bemærk: Hvis selve rodbiblioteket eller startsøgestierne giver et fejlsvar, skal du huske, at disse stier blev leveret til webstedsskraberprogrammet i dets projektindstillinger. Derfor kan det være, at der ikke er knækkede links eller lignende, der peger på disse URL'er.

Bemærk: A1 Website Analyzer kan også vise linjenumre og follow/nofollow-oplysninger for interne links.

analyse af links til webstedsscanning

Hvad A1 Website Scraper fortolker som links øges med muligheder som:
  • Hjemmesidescanning | Crawler muligheder | Søg i alle link tag typer.
  • Hjemmesidescanning | Crawler muligheder | Overvej <iframe>-tags til links.
  • Hjemmesidescanning | Crawler muligheder | prøv at søge i Javascript og CSS .

Forklaringer på, hvad de forskellige faner under Udvidede data betyder:
  • Links [interne] : Links fra den valgte URL til andre URL'er på samme domæne.
  • Links [eksterne] : Links fra den valgte URL til andre URL'er på et andet domæne.
  • Linket af : Hvorfra den valgte URL linkes internt.
  • Bruger [intern] : Ressourcer (f.eks. billeder) på det samme domæne, som den valgte URL bruger.
  • Bruger [ekstern] : Ressourcer (f.eks. billeder) fra et andet domæne, som den valgte URL bruger.
  • Brugt af : Hvorfra den valgte URL (f.eks. et billede) bruges internt.
  • Omdirigeret af : Hvilke interne URL'er omdirigerer til den valgte URL.
  • Katalogoversigt : Oversigt over de typer URL'er, der er placeret under den valgte URL.

Du kan ændre, hvordan du ser webadresser fundet i under scanningen af webstedet. Skift mellem trækontur og flad liste. Dette er især nyttigt, når du sorterer URL'er baseret på HTTP-svarkode for at finde alle ødelagte links. Du kan sortere URL'erne på listen ved at klikke på en af datakolonnerne, f.eks. R.Code, som er en forkortelse for response code.

visning af links til webstedsscanning

Ødelagte links kan ofte findes ved at lede efter URL'er, der returnerer svarkode 404: Not Found og 301: Moved Permanently. Bare tjek deres linket af, brugt af og omdirigeret af information.

Du skal også være opmærksom på, hvordan nofollow, noindex og robots.txt kan påvirke webcrawling. Hvis du vil have A1 Website Scraper til at vise alle webadresser, der er fundet, inklusive dem, der er markeret noindex, kan du gøre det gennem muligheder:
  • For webstedsscanningsresultater: Fjern markeringen i: Scan websted | Webmaster filtre | Når webstedsscanningen stopper: Fjern URL'er med noindex/disallow.


Katalog og sideroversigt

Du kan altid hurtigt vælge og se oversigtsoplysninger for mapper på et websted:

webstedskatalog og sideoversigt


Problemer med avanceret link og omdirigering

  • Har du aktiveret indstillingen Brug specielle svarkoder til, når side-URL'er bruger kanoniske, men er forvirrede over URL'er med svarkode -9 : RedirectIndexFileDirRoot eller -11 : MetaRefreshRedirect i scanningsresultater? Hvis ja, så sørg for at læse om duplikerede URL'er og hvordan du aktiverer/deaktiverer automatisk registrering af dem.

  • Har du mapper med svarkode 0: VirtualItem i scanningsresultater? Disse URL'er er ikke blevet analyseret, fordi de ikke er direkte linket fra nogen steder. Du kan tvinge webstedsskraber til at inkludere sådanne URL'er i webstedsscanninger ved at aktivere Scan websted | Crawler muligheder | Scan altid mapper, der indeholder linkede URL'er.

    websted crawl alle mapper.png



Interne links og "anvendelser" viser kun nogle gange eller er forkerte

Nogle websteder genererer forskellig HTML-kode og links tilfældigt eller baseret på f.eks
  • Crawler/ browserbrugeragent. (Ændring i Generelle muligheder og værktøjer | Internet-crawler ).
  • Session cookies. (Ændring i Scan hjemmeside | Crawlerindstillinger | Tillad cookies ).
  • Sessions-URL'er. (Anvendes ofte af websteder, hvis sessionscookies ikke accepteres.)
  • Henviser.
  • Sidst set side.

En måde at bevise, at dette er årsagen på, er ved at bruge A1 Website Download. Da alle sider downloades til disk under crawl, er det muligt at inspicere HTML-kildekoden for dem efterfølgende.

Hvis du beslutter dig for at bruge dette program, skal du sørge for at aktivere indstillingen Scan hjemmeside > Dataindsamling > Gem omdirigeringer, links fra og til alle sider osv. og muligvis også konfigurere Download-indstillinger, så det ikke konverterer links til offline browsing.

Hvis du har aktiveret nogen af de udvidede linksøgningsmuligheder, kan du også nogle gange have anvendelser, der er svære at få øje på. Nogle eksempler:
  • Mulighed: Hjemmesidescanning | Crawler muligheder | Søg i alle link-tagtyper
    Kode: <param name="movie" value="">


Intern Linking og Link Juice

Vores hjemmesideskraberværktøj beregner score for alle sider baseret på interne links på hjemmesiden. Du kan læse mere om sidevigtighedsberegningerne i onlinehjælpen til vores søskendeværktøj A1 Website Analyzer.
A1 Website Scraper
A1 Website Scraper | hjælp | forrige | Næste
Udtræk data fra websteder til CSV-filer. Ved at skrabe hjemmesider kan du få fat i data på hjemmesider og omdanne dem til CSV-filer, der er klar til at blive importeret overalt, f.eks. SQL-databaser
Denne hjælpeside vedligeholdes af
Som en af de ledende udviklere har hans hænder rørt det meste af koden i softwaren fra Microsys. Hvis du e-mailer spørgsmål, er chancerne for, at han vil være den, der svarer.
Del denne side med dine venner   LinkedIn   Twitter   Facebook   Pinterest   YouTube  
 © Copyright 1997-2024 Microsys

 Brug af denne side inkluderer accept af vores juridisk, privatliv og cookie information.

Se vores prisrobot indenfor emner: Maling | Stiger | Stilladser | Vinduespudsning | Robotstøvsuger | Støvsuger | Maskiner | Køkken | Kaffe | Bad | Mobil | Bærbar | Printer