Website-Download und e107 CMS-Websites
Wenn Ihre Website das Content-Management-System e107 verwendet, müssen Sie die Optionen für den Website-Download-Crawler anpassen, um die CMS-basierte Website e107 erfolgreich zu crawlen.
e107 CMS-Websites und Website-Download-Tool
Einige Websites verwenden ein Content-Management-System. Solche Systeme enthalten manchmal Code, der das Crawlen der Website durch unbekannte Roboter verhindert. Aus Berichten von Benutzern von A1 Website Download geht hervor, dass e107 CMS ein solches System ist.
Programm-Website-Scan-Einstellungen für e107 CMS
- Website scannen | Crawler-Engine: Stellen Sie die maximale Anzahl gleichzeitiger Verbindungen/Threads auf eins ein.
- Raupenmotor | Erweiterte Engine-Einstellungen: Legen Sie GET als Standard für Seitenanfragen fest.
- Maskieren Sie die Identität des Crawlers in unserer Website-Download-Software:
- Imitieren Sie „Benutzer, der auf einer Website surft“:
- Unter Allgemeine Optionen und Tools | Der Internet-Crawler hat den Benutzeragenten auf Mozilla/4.0 (kompatibel; MSIE 7.0; Win32) eingestellt.
- In Website scannen | Webmaster-Filter deaktivieren/deaktivieren „Robots.txt“ herunterladen und Datei „robots.txt“ befolgen, falls gefunden.
A1 Website herunterladen |
Hilfe |
vorherige |
nächste Laden Sie vollständige Websites herunter und nehmen Sie sie mit, um sie in Offline-Medien zu durchsuchen. Kopieren und speichern Sie ganze Websites für Sicherungs-, Archivierungs- und Dokumentationszwecke. Verlieren Sie nie wieder eine Website.
Diese Hilfeseite wird von
Thomas Schulz betreut
Als einer der Hauptentwickler haben seine Hände den größten Teil des Codes in der Software von Microsys berührt. Wenn Sie Fragen per E-Mail senden, ist die Wahrscheinlichkeit groß, dass er derjenige ist, der antwortet.