Microsys
  

Website-Download-Ausgabefilter im Website-Scan

Mit Website-Scan-Ausgabefiltern (auch als Listenfilter bezeichnet) können Sie definieren, welche Seiten nach dem Website-Crawling in unserer Website-Download-Software im Sitemap-Bereich aufgelistet werden sollen.

Hinweis: Wir haben ein Video-Tutorial:



Obwohl die Videodemonstration TechSEO360 verwendet, ist ein Teil davon auch für Benutzer von A1 Website Download anwendbar.



Übersicht über Website-Ausgabefilter zum Herunterladen

Ausgabefilter werden normalerweise unmittelbar nach Abschluss des Website-Crawlings angewendet. Dies bedeutet, dass der Website-Scanner Seiten crawlen kann, die nicht unbedingt in der endgültigen Ausgabe enthalten sind. Sie können stattdessen oder in Verbindung mit Webmaster-Filtern ( robots.txt, noindex, nofollow usw.) und Analysefiltern Ausgabefilter verwenden.

  • Ändern Sie das Verhalten, wie und wann diese Filter angewendet werden, indem Sie Folgendes ändern:
    • Ältere Versionen: Website scannen | Crawler-Optionen | Wenden Sie Webmaster- und Ausgabefilter nach dem Website-Scan an.
    • Neuere Versionen: Website scannen | Ausgabefilter | Nachdem der Website-Scan beendet wurde: Entfernen Sie die durch „Ausgabefilter“ ausgeschlossenen URLs.

  • Schließen Sie URLs sowohl in Ausgabefiltern als auch in Analysefiltern aus, um Crawlzeit, HTTP-Anfragen und Speichernutzung zu minimieren.

  • Hinweis: Damit Änderungen an den Ausgabefiltern wirksam werden, müssen Sie Ihre Website erneut scannen. Der Grund dafür ist, dass es der Website-Crawler ist, der alle gefundenen URLs mit Flags wie „ vom Ausgabefilter ausgeschlossen“ markiert.


Beschränken Sie interne URLs auf diejenigen in diesen Verzeichnissen

  • Vom Crawler gefundene Links werden normalerweise in die Kategorien „intern“ und „extern“ gruppiert.
  • Mit dieser Option können Sie entscheiden, welche Seiten in die interne Kategorie gehören.

Kategorien der Website-Crawler-Liste


Listen Sie Dateien mit Dateierweiterung in der Ausgabe auf

URLs mit Dateierweiterungen, die nicht in der Liste gefunden werden, werden nicht in die Ergebnisse des Website-Scans einbezogen.
Wenn Sie alle Dateierweiterungen in der Liste entfernen, akzeptiert die Filterung der Dateierweiterungsliste alle Dateien.

Erweiterungen für Website-Crawler-Listen


Listen Sie keine URLs auf, die mit Pfaden/Strings/Regex übereinstimmen

Das Ausschließen von URLs, die ganz oder teilweise mit einer Textzeichenfolge, einem Pfad oder einem regulären Ausdrucksmuster übereinstimmen, aus der Ausgabe ist eine Möglichkeit, die zurückgegebenen Daten einzuschränken, wenn das Tool das Crawlen der gescannten Website abgeschlossen hat.

Kategorien der Website-Crawler-Liste

  • Saiten:
    • blogs stimmt mit relativen Pfaden überein, die „ blogsenthalten.
    • @ stimmt mit relativen Pfaden überein, die „ @enthalten.
    • ? Entspricht relativen Pfaden, die „ ?enthalten.
  • Pfade:
    • : s stimmt mit relativen Pfaden überein, die mit „ sbeginnen, z. B. http://www.microsystools.com/services/ und http://www.microsystools.com/shop/.
    • : blogs/ stimmt mit relativen Pfaden überein, die mit „ blogs/beginnen, wie z. B. http://www.microsystools.com/ blogs/.
  • Unterpfade:
    • : blogs/ * stimmt mit relativen Pfaden überein, die mit „ blogs/beginnen, mit Ausnahme von sich selbst, wie z. B. http://www.microsystools.com/blogs/sitemap-generator/.
  • Regulärer Ausdruck:
    • :: blog (s?) / gleicht relative Pfade mit Regex ab, z. B. http://www.microsystools.com/ blogs/ und http://www.microsystools.com/ blog/.
    • :: blogs/ (2007|2008) / gleicht relative Pfade mit Regex ab, z. B. http://www.microsystools.com/blogs/ 2007/ und http://www.microsystools.com/blogs/ 2008/.
    • :: blogs/ .*? Das Schlüsselwort stimmt mit relativen Pfaden mit Regex überein, z. B. http://www.microsystools.com/blogs/category/products/a1-keyword-research/.
    • :: ^$ gleicht den leeren relativen Pfad (dh das Stammverzeichnis) mit einem regulären Ausdruck wie http://www.microsystools.com/ ab.

Sie können eine Projektdatei herunterladen, die verschiedene Ausgabefilter demonstriert.
Aus den obigen Beispielen ist Folgendes ersichtlich:
  • : allein = besondere Übereinstimmung.
  • : beim Start = Pfade stimmen überein.
  • : am Anfang und * am Ende = sorgt dafür, dass Pfade in Unterpfade übereinstimmen.
  • :: beim Start = Übereinstimmung mit regulären Ausdrücken.
  • Keine der oben genannten, normale Zeichenfolgentextübereinstimmung.

So fügen Sie ein Listenfilterelement im Dropdown-Menü hinzu: Geben Sie es ein und verwenden Sie die Schaltfläche [+].
So entfernen Sie ein Listenfilterelement im Dropdown: Wählen Sie es aus und verwenden Sie die Schaltfläche [-].
Weitere Informationen zu den von A1 Website Download verwendeten Benutzeroberflächen-Steuerelementen finden Sie hier.


Fügen Sie ganz einfach URLs zu Ausgabefiltern hinzu

Wenn Sie keine der erweiterten Optionen für Website scannen | benötigen Ausgabefilter: Im Tabellenmenü finden Sie einige praktische Funktionen, mit denen Sie URLs einfach ausschließen können. osysDies ist nützlich, wenn Sie eine Website mehrmals crawlen müssen.

Kategorien der Website-Crawler-Liste
A1 Website Download
A1 Website herunterladen | Hilfe | vorherige | nächste
Laden Sie vollständige Websites herunter und nehmen Sie sie mit, um sie in Offline-Medien zu durchsuchen. Kopieren und speichern Sie ganze Websites für Sicherungs-, Archivierungs- und Dokumentationszwecke. Verlieren Sie nie wieder eine Website.
Diese Hilfeseite wird von betreut
Als einer der Hauptentwickler haben seine Hände den größten Teil des Codes in der Software von Microsys berührt. Wenn Sie Fragen per E-Mail senden, ist die Wahrscheinlichkeit groß, dass er derjenige ist, der antwortet.
Teile diese Seite mit Freunden   LinkedIn   Twitter   Facebook   Pinterest   YouTube  
 © Copyright 1997-2024 Microsys

 Mit der Nutzung dieser Website erklären Sie sich mit unseren Rechtlichen, Datenschutzrichtlinien und Cookie Informationen einverstanden.