Hinweis: Wir haben ein Video-Tutorial:

Obwohl die Videodemonstration den
A1 Website Analyzer verwendet, ist sie auch für Benutzer von
TechSEO360 anwendbar.
Sie können TechSEO360 unter „
Website scannen |“ so konfigurieren, dass auf Ihrer Website nach Textzeichenfolgen und Mustern gesucht wird
Datenerfassung.
Die erste Aufgabe besteht darin, die
Muster zu definieren oder auszuwählen, die Sie auf Ihrer Website finden möchten.
Beachten Sie, dass die gesamte Quelle aller gescannten Website-Seiten überprüft wird, sodass Sie nach allem suchen können, einschließlich
Code und
Text.

Im obigen Beispiel suchen wir nach:
- Wenn der Google Analytics-Tracker auf allen Seiten installiert wurde. Wir tun dies, indem wir nach Google Analytics-Javascript-Code suchen.
- Wenn Seiten unserer Website E-Mail-Adressen enthalten, die von einem Website-Crawler gefunden werden können.
Hinweis: TechSEO360 verfügt zwar über einige vordefinierte
reguläre Ausdrücke zum Suchen allgemeiner Texte und Codes, Sie können jedoch ganz einfach Ihre eigenen benutzerdefinierten Website-Text- und Codesuchen hinzufügen.
Hinweis: Sie müssen das Format
searchvar=searchstring
verwenden und es über die Schaltfläche
[+] zur Dropdown-Liste der durchgeführten Suchvorgänge hinzufügen.
Tipp: Wenn Sie eine Website haben, die
weiche 404- Fehlerseiten für URLs zurückgibt, die
404: Nicht gefunden zurückgeben sollten, können Sie die benutzerdefinierte Suchfunktion verwenden, um nach Text und Code zu suchen, der für solche Seiten spezifisch ist.
Wenn Sie nach
Textmustern anstelle von
Rohzeichenfolgen suchen müssen, profitieren Sie von einem grundlegenden Verständnis regulärer Ausdrücke:
-
.+
stimmt ein oder mehrere Male mit einem beliebigen Zeichen im Inhalt überein. -
.*
stimmt null oder mehrmals mit einem beliebigen Zeichen im Inhalt überein. (Selten nützlich. Siehe Alternative unten.) -
.*?
stimmt mit jedem Zeichen im Inhalt überein , bis der folgende Regex- Code mit dem Inhalt übereinstimmen kann. -
\s*
stimmt mit allen Leerzeichen im Inhalt null oder mehrmals überein. (Das bedeutet, dass alle Leerzeichen, falls vorhanden, übereinstimmen.) -
[0-9a-zA-Z]
entspricht einmal einem englischen Buchstaben oder einer englischen Ziffer im Inhalt. -
[^<]*
entspricht null oder mehrmals jedem Zeichen außer „<“ im Inhalt. -
(this|that|the)
entspricht „this“ oder „that“ oder „the“. -
(this|that|the)?
Übereinstimmungen wie oben , wenn eine Übereinstimmung möglich ist, wird aber unter allen Umständen mit dem folgenden regulären Ausdruck fortgesetzt.
Wenn Sie sich oben beworben und Ihre Suchzeichenfolgen konfiguriert haben, müssen Sie nur noch mit dem Crawlen der Website-Suche beginnen. Wenn der Website-Scan und die Suche abgeschlossen sind, können Sie sehen, wie oft jedes Suchmuster auf jeder Seite gefunden wurde.
Hinweis: Um die Datenspalte mit den Suchergebnissen anzuzeigen, aktivieren Sie ihre Sichtbarkeit unter
Ansicht | Datenspalten | Extrahierter Inhalt | Benutzerdefinierte Seitensuche.
Hinweis: Die Überschrift der Suchergebnisdatenspalte lautet je nach Produktversion entweder
S.Content oder
Page.Search.Results.