Website-Download-Ausgabefilter im Website-Scan
Mit Website-Scan-Ausgabefiltern (auch als Listenfilter bezeichnet) können Sie definieren, welche Seiten nach dem Website-Crawling in unserer Website-Download-Software im Sitemap-Bereich aufgelistet werden sollen.
Hinweis: Wir haben ein Video-Tutorial:
Obwohl die Videodemonstration
TechSEO360 verwendet, ist ein Teil davon auch für Benutzer von
A1 Website Download anwendbar.
Ausgabefilter werden normalerweise
unmittelbar nach Abschluss des Website-Crawlings angewendet. Dies bedeutet, dass der Website-Scanner Seiten crawlen kann, die nicht unbedingt in der endgültigen Ausgabe enthalten sind. Sie können stattdessen oder in Verbindung mit
Webmaster-Filtern ( robots.txt,
noindex,
nofollow usw.) und
Analysefiltern Ausgabefilter verwenden.
- Ändern Sie das Verhalten, wie und wann diese Filter angewendet werden, indem Sie Folgendes ändern:
- Ältere Versionen: Website scannen | Crawler-Optionen | Wenden Sie Webmaster- und Ausgabefilter nach dem Website-Scan an.
- Neuere Versionen: Website scannen | Ausgabefilter | Nachdem der Website-Scan beendet wurde: Entfernen Sie die durch „Ausgabefilter“ ausgeschlossenen URLs.
- Schließen Sie URLs sowohl in Ausgabefiltern als auch in Analysefiltern aus, um Crawlzeit, HTTP-Anfragen und Speichernutzung zu minimieren.
- Hinweis: Damit Änderungen an den Ausgabefiltern wirksam werden, müssen Sie Ihre Website erneut scannen. Der Grund dafür ist, dass es der Website-Crawler ist, der alle gefundenen URLs mit Flags wie „ vom Ausgabefilter ausgeschlossen“ markiert.
URLs mit Dateierweiterungen, die
nicht in der Liste gefunden werden, werden
nicht in die Ergebnisse des Website-Scans einbezogen.
Wenn Sie alle Dateierweiterungen in der Liste entfernen, akzeptiert die Filterung der Dateierweiterungsliste alle Dateien.
Das Ausschließen von URLs, die ganz oder teilweise mit einer
Textzeichenfolge,
einem Pfad oder
einem regulären Ausdrucksmuster übereinstimmen, aus
der Ausgabe ist eine Möglichkeit, die zurückgegebenen Daten einzuschränken, wenn das Tool das Crawlen der gescannten Website abgeschlossen hat.
- Saiten:
- blogs stimmt mit relativen Pfaden überein, die „ blogs “ enthalten.
- @ stimmt mit relativen Pfaden überein, die „ @ “ enthalten.
- ? Entspricht relativen Pfaden, die „ ? “ enthalten.
- Pfade:
- : s stimmt mit relativen Pfaden überein, die mit „ s “ beginnen, z. B. http://www.microsystools.com/services/ und http://www.microsystools.com/shop/.
- : blogs/ stimmt mit relativen Pfaden überein, die mit „ blogs/ “ beginnen, wie z. B. http://www.microsystools.com/ blogs/.
- Unterpfade:
- : blogs/ * stimmt mit relativen Pfaden überein, die mit „ blogs/ “ beginnen, mit Ausnahme von sich selbst, wie z. B. http://www.microsystools.com/blogs/sitemap-generator/.
- Regulärer Ausdruck:
- :: blog (s?) / gleicht relative Pfade mit Regex ab, z. B. http://www.microsystools.com/ blogs/ und http://www.microsystools.com/ blog/.
- :: blogs/ (2007|2008) / gleicht relative Pfade mit Regex ab, z. B. http://www.microsystools.com/blogs/ 2007/ und http://www.microsystools.com/blogs/ 2008/.
- :: blogs/ .*? Das Schlüsselwort stimmt mit relativen Pfaden mit Regex überein, z. B. http://www.microsystools.com/blogs/category/products/a1-keyword-research/.
- :: ^$ gleicht den leeren relativen Pfad (dh das Stammverzeichnis) mit einem regulären Ausdruck wie http://www.microsystools.com/ ab.
Sie können eine
Projektdatei herunterladen, die verschiedene Ausgabefilter demonstriert.
Aus den obigen Beispielen ist Folgendes ersichtlich:
- : allein = besondere Übereinstimmung.
- : beim Start = Pfade stimmen überein.
- : am Anfang und * am Ende = sorgt dafür, dass Pfade in Unterpfade übereinstimmen.
- :: beim Start = Übereinstimmung mit regulären Ausdrücken.
- Keine der oben genannten, normale Zeichenfolgentextübereinstimmung.
So fügen Sie ein Listenfilterelement im Dropdown-Menü hinzu: Geben Sie es ein und verwenden Sie die Schaltfläche
[+].
So entfernen Sie ein Listenfilterelement im Dropdown: Wählen Sie es aus und verwenden Sie die Schaltfläche
[-].
Weitere Informationen zu den von
A1 Website Download verwendeten
Benutzeroberflächen-Steuerelementen finden Sie hier.
Wenn Sie keine der erweiterten Optionen für
Website scannen | benötigen
Ausgabefilter: Im
Tabellenmenü finden Sie einige praktische Funktionen, mit denen Sie URLs einfach ausschließen können. osysDies ist nützlich, wenn Sie eine Website mehrmals crawlen müssen.