Hinweis: Wir haben ein Video-Tutorial:
Obwohl die Videodemonstration den
A1 Website Analyzer verwendet, ist ein Teil davon auch für Benutzer des
A1 Sitemap Generators anwendbar.
Sie
müssen Ihre Website scannen, bevor Sie alle auf der Website gefundenen URLs sehen können! Wenn beim Website-Crawling Probleme auftreten, z. B. beim Website-Scan weniger als erwartet gefundene URLs angezeigt werden, lesen Sie unseren Artikel über
die Lösung von Website-Crawling-Problemen.
Wenn Sie daran interessiert sind, zu sehen, wie Seiten miteinander verknüpft sind, bietet Ihnen
der A1 Sitemap Generator vollständigen Zugriff auf die Ansicht von „
verlinkt von“,
„weitergeleitet von“, „
verwendet von “ und vielen anderen verwandten Daten. Dies ist nützlich, um fehlerhafte Links zu finden, die z. B. den Fehler
„Antwortcode 404 Nicht gefunden“ oder
„Antwortcode 301 Permanent verschoben“ auslösen. Über die Registerkarten unten können Sie zwischen den in
den Erweiterten Daten angezeigten Informationen wechseln.
Hinweis: Wenn das
Stammverzeichnis oder
die Startsuchpfade selbst eine Fehlerantwort auslösen,
denken Sie bitte daran, dass diese Pfade dem Sitemap-Generator-Programm in seinen Projekteinstellungen bereitgestellt wurden. Daher kann es sein, dass keine defekten Links o.ä. auf diese URLs verweisen.
Hinweis: A1 Website Analyzer kann auch die Zeilennummern und Follow/Nofollow-Informationen interner Links anzeigen.
Was der
A1 Sitemap Generator als
Links interpretiert, erhöht sich mit Optionen wie:
- Website-Scan | Crawler-Optionen | Durchsuchen Sie alle Link-Tag-Typen.
- Website-Scan | Crawler-Optionen | Erwägen Sie <iframe>-Tags für Links.
- Website-Scan | Crawler-Optionen | Versuchen Sie, in Javascript und CSS zu suchen .
Erläuterungen zur Bedeutung der verschiedenen Registerkarten unter
Erweiterte Daten:
- Links [intern]: Links von der ausgewählten URL zu anderen URLs in derselben Domain.
- Links [extern]: Links von der ausgewählten URL zu anderen URLs in einer anderen Domain.
- Verlinkt von: Von dort aus wird die ausgewählte URL intern verlinkt.
- Verwendet [intern]: Ressourcen (z. B. Bilder) auf derselben Domäne, die die ausgewählte URL verwendet.
- Verwendet [extern]: Ressourcen (z. B. Bilder) von einer anderen Domain, die die ausgewählte URL verwendet.
- Verwendet von: Von dort aus wird die ausgewählte URL (z. B. ein Bild) intern verwendet.
- Umgeleitet von: Welche internen URLs führen zur ausgewählten URL weiter?
- Verzeichniszusammenfassung: Übersicht über die Arten von URLs, die sich unter der ausgewählten URL befinden.
Sie können ändern, wie Sie die während des Website-Scans gefundenen URLs anzeigen. Wechseln Sie zwischen
Baumumriss und
flacher Liste. Dies ist besonders nützlich, wenn Sie URLs anhand
des HTTP-Antwortcodes sortieren, um alle defekten Links zu finden. Sie können die aufgelisteten URLs sortieren, indem Sie auf eine der Datenspalten klicken, z. B.
R.Code, die Abkürzung für
Antwortcode.
Defekte Links können häufig gefunden werden, indem nach URLs gesucht wird, die die Antwortcodes
404: Nicht gefunden und
301: Permanent verschoben zurückgeben. Überprüfen Sie einfach die Informationen
zu „Verlinkt von“,
„Verwendet von“ und
„Umgeleitet von“.
Sie sollten sich auch darüber im Klaren sein, wie
nofollow, noindex und robots.txt das Website-Crawling beeinflussen können. Wenn Sie möchten, dass der A1 Sitemap Generator alle gefundenen URLs anzeigt, einschließlich der
mit noindex gekennzeichneten, können Sie dies über folgende Optionen tun:
- Für Website-Scan-Ergebnisse: Deaktivieren Sie: Website scannen | Webmaster-Filter | Nachdem der Website-Scan beendet wurde: URLs mit noindex/disallow entfernen.
- Zum Erstellen von Sitemaps: Aktivieren Sie: Sitemap erstellen | Dokumentoptionen | Entfernen Sie URLs, die von den Filtern „Webmaster“ und „Ausgabe“ ausgeschlossen wurden.
Sie können Zusammenfassungsinformationen für Verzeichnisse auf einer Website jederzeit schnell auswählen und anzeigen:
Einige Websites generieren unterschiedliche HTML-Codes und Links nach dem Zufallsprinzip oder basierend auf z. B
- Crawler/Browser -Benutzeragent. (Änderung in Allgemeine Optionen und Tools | Internet-Crawler ).
- Sitzungscookies. (Änderung in Website scannen | Crawler-Optionen | Cookies zulassen ).
- Sitzungs-URLs. (Wird häufig von Websites verwendet, wenn Sitzungscookies nicht akzeptiert werden.)
- Referrer.
- Zuletzt angesehene Seite.
Eine Möglichkeit, dies
nachzuweisen, ist die Verwendung von
A1 Website Download. Da alle Seiten beim Crawlen auf die Festplatte heruntergeladen werden, ist es möglich, den HTML-Quellcode dieser Seiten anschließend zu überprüfen.
Wenn Sie sich für die Verwendung dieses Programms entscheiden, stellen Sie sicher, dass die Option
Website scannen > Datenerfassung > Weiterleitungen, Links von und zu allen Seiten usw. speichern aktiviert ist und möglicherweise auch
die Download-Optionen konfiguriert sind, damit die Links nicht für das Offline-Browsen konvertiert werden.
Wenn Sie eine der erweiterten Linksuchoptionen aktiviert haben, kann es sein, dass Sie manchmal auch
Verwendungszwecke finden, die schwer zu erkennen sind. Einige Beispiele:
- Option: Website-Scan | Crawler-Optionen | Durchsuchen Sie alle Link-Tag-Typen
Code: <param name="movie" value="">
Unser Sitemap-Generator-Tool berechnet die Bewertungen für alle Seiten basierend auf der internen Verlinkung der Website. Sie können auch über die Berechnung
der XML-Sitemap-Prioritäten in XML-Sitemaps lesen.