Microsys
  

Eksporter XML- og CSV-datafiler i webstedssøgemaskine

A1 Website Search Engine - Eksporter webstedsdata til XML- og CSV-filer

Eksporter webstedsdata til CSV- og Excel XML-filer

Du kan aktivere Fil | Eksporter menupunkt ved at klikke / vælge / fokusere kontrolelementet, som indeholder de data, du ønsker at eksportere.
  • De fleste lister, tekstbokse, træ-, gittervisninger og lignende kan have de data, de indeholder, eksporteres som de er til tekst- eller CSV-filer.
  • Kontrolelementerne, der indeholder alle fundne URL'er under webstedscrawl, kan også eksportere til Excel XML-regnearksformat.

Sådan eksporteres webstedsdata til CSV, tekst og lignende filformater:
  1. Vælg kontrolelementet, f.eks. ved at klikke med musemarkøren på det.
  2. Juster kontrollen, fx ved at aktivere/deaktivere synlighed af datakolonner.
  3. Filen | Eksporter menupunktet er nu aktiveret, hvis det er relevant. (Der er også en tilsvarende knap på værktøjslinjen.)
  4. Vælg mellem at gemme som kommaværdisepareret .csv, tabulatorværdisepareret .tsv, .html og mere.

På skærmbilledet nedenfor kan du se:
  • Vi har valgt trævisningskontrollen i venstre side.
  • Vi har konfigureret synlige datakolonner og filtreret synlige URL'er for at kontrollere, hvad der eksporteres.

websted data eksport xml csv

Bemærk: Skærmbilledet er fra A1 Website Analyzer, som har flere datakolonner og filtreringsmuligheder end A1 Website Search Engine.


Formatindstillinger for CSV-dataeksport

Se muligheder for webstedsøgemaskineeksport af CSV-filer i menuen Filer - Eksportindstillinger :
  • Data inkluderet:
    • Eksporter CSV-data med overskrifter
    • Eksporter CSV-data med URL
    • Ombryd celler med linjeskift i "" (i stedet for at konvertere linjeskift til mellemrum)
  • Tegnformat og kodning:
    • UTF-8 med valgfri stykliste. (ASCII er en delmængde af UTF-8. Ideel til engelske dokumenter.)
    • UTF-16 LE (UCS-2) med valgfri stykliste. (Bruges internt i nuværende Windows-systemer.)
    • Lokal ANSI kodetabel. (Er muligvis ikke altid bærbar til andre platforme og sprog.)

A1 eksporter csv-datafiler som Unicode eller tegntabel
(Valg af ANSI til CSV-eksport i webstedets søgemaskine)


Unicode CSV-filer og OpenOffice- eller Microsoft Office-import

Nogle versioner af Open Office, Libre Office og Microsoft Office kan have problemer med at importere CSV-data, da de ikke automatisk registrerer tegnkodningsformat. Hvis du oplever problemer (ikke sandsynligt for f.eks. engelsk webstedsdataeksport), kan du bruge importdialogen i Office-værktøjerne:

kontor import csv unicode utf8
(Valg af UTF-8 til CSV-import i dialogboksen Open Office/Libre Office)

MS office import csv ansi
(Valg af ANSI til CSV-import i Microsoft Office-dialogen)


Projektwebstedsdata gemmes som XML

Strukturdata udtrukket fra en ressource kaldes ofte META-data eller "data om data". Når du gemmer projekter i A1 Website Search Engine, gemmes en stor mængde af sådanne data i XML-filerne.

Fordi det er XML, kan du nemt udføre dataanalyse og dataminering (mine dataene for mere information). Der findes wrappers til dette på næsten alle sprog, fx Java, PHP, C#, Visual Basic, Delphi osv.

websted data eksport xml csv
  • Websiteprojektets metadata gemmes i XML-dokumenter, der er perfekte til data mining. Nogle eksempler:
    • Samlede data:
      • Samlet antal links på et websted
      • Samlet antal sider, der linker på et websted
      • Minimum antal links enhver side har til det
      • Det maksimale antal links, som enhver side har til den
      • Minimum antal sider, som enhver side har, der linker til den
      • Det maksimale antal sider, som enhver side har, der linker til den

    • Vareindsamlingsdata:
      • Antal genstande fundet. Det kan være sider, billeder osv.
      • Varedata:
        • Sidetitel
        • Svaroverskrifter
        • Svarkode
        • Svartekst
        • Responstid
        • Download tid
        • Fuld vej
        • Relativ sti (inden for webstedet)
        • Filtypenavn
        • Filtype
        • Filstørrelse
        • Tegnsæt
        • Sidst ændret (HTTP-header)
        • Links fundet liste
        • Linket til fra liste (inkluderer en liste og antal af alle sider og links)
        • Bruges som kilde fra liste (f.eks. hvorfra et billede eller javascript er brugt)
        • Omdirigeret til fra liste (se alle og fulde omdirigeringskæder)
        • Oversigtsdata om, hvad der blev fundet i en mappe; filtyper, hvor mange af disse ikke fundet osv.
        • Beregnet sidevigtighed. Råværdi og 0-10 skaleret. For detaljer, se afsnittet "websteddata".

Hvis du har gemt dit projekt til c:\projects\myproject.ini, kan du finde XML-filerne på c:\projects\myproject\.

Hvis du foretrækker at have letlæselige felter og indrykket XML, bør du fjerne markeringen i Options - Favor save/load XML speed. Men hvis du har enorme websteder og bruger software til at udføre yderligere dataaminering, kan du måske lade denne indstilling være markeret, da den reducerer XML-dokumentstørrelserne med op til 30 %.


XML-filstruktur og dokumentation

Feltnavn Hastighed konfig Beskrivelse
<data>
----<meta>
-----<version>
--------<hurtigt>
--------<dataexrefs>
----</meta>
----<struktur>
--------<rodsti>
--------<checkedlevel>
----</struktur>
----<totaler>
--------<linket>
------------<allpagesto>
------------<minpagesto>
------------<maxpagesto>
--------------<alle henviser>
------------<minhenviser>
------------<maxrefersto>
--------<linket>
----</totals>
----<emner>
----<vare> *
------------<imb> informations metadata
----------------<fs_ar> analyse påkrævet
----------------<fs_as> analysen startede
----------------<fs_ac> analyse afsluttet
------------</imb>
------------<titel>
------------<allheaderstext> <allht>
------------<svarkode> <omkode>
------------<responstimeouter> <reto>
------------<downloadtimeouter> <doto>
------------<pathroot>
------------<pathrela>
------------<realext>
------------<kindext>
------------<valerrs>
------------<tegnsæt>
------------<sizeexpected> <sizeex>
------------<størrelse bekræftet> <sizeco>
------------<sidst ændret> <lastmo>
------------<revisitaftermins> <revmins>
------------<linkstotalall> <lksta>
------------<linkstotalto> <lkstt>
------------<linkstolist> <lkstl>
----------------<linkstoitem> * <lksti>
------------</linkstolist> </lkstl>
------------<linkedtotalall> <lnkta>
------------<linkedtotalfrom> <lnktf>
------------<linkedfromlist> <lnkfl>
----------------<linkedfromitem> * <lnkfi>
------------</linkedfromlist> </lnkfl>
------------<sourcedtotalall> <srcta>
------------<sourcedtotalfrom> <srctf>
------------<sourcedfromlist> <srcfl>
----------------<sourcedfromitem> * <srcfi>
------------</sourcedfromlist> </srcfl>
------------<omdirigerettotalall> <redta>
------------<omdirigerettotalfra> <redtf>
------------<omdirigeret fra liste> <redfl>
----------------<omdirigeret framitem> * <redfi>
--------------------<omdirigeretframitemfra> <redfif>
--------------------<omdirigeretframitemtype> <redfit>
--------------------<omdirigeret fra kæden> <redfic>
------------------------<omdirigeret framitemring> * <redfir>
--------------------</redirectedfromitemchain> </redfic>
----------------</redirectedfromitem> </redfi>
------------</redirectedfromlist> </redfl>
------------<importancescore>
------------<importancescorescaled>
------------<changefreqscorescaled>
------------<resumaryfundall>
------------<resuméfundneliste>
----------------<summaryfounditem> *
--------------------<summaryfounditemisdir>
--------------------<summaryfounditemextreal>
--------------------<summaryfounditemextkind>
--------------------<resuméfundetitemsvarkode>
--------------------<sammendragfunditemcount>
----------------</summaryfounditem>
------------</summaryfoundlist>
--------</item>
----</items>
</data>
A1 Website Search Engine
A1 Website Search Engine | hjælp | forrige | Næste
Ved at have en søgemaskine på en online eller offline hjemmeside kan du sikre, at flere af dine besøgende bliver på dit websted. At have et søgefelt hjælper besøgende med at finde det, de søger efter.
Denne hjælpeside vedligeholdes af
Som en af de ledende udviklere har hans hænder rørt det meste af koden i softwaren fra Microsys. Hvis du e-mailer spørgsmål, er chancerne for, at han vil være den, der svarer.
Del denne side med dine venner   LinkedIn   Twitter   Facebook   Pinterest   YouTube  
 © Copyright 1997-2024 Microsys

 Brug af denne side inkluderer accept af vores juridisk, privatliv og cookie information.

Se vores prisrobot indenfor emner: Maling | Stiger | Vinduespudsning | Robotstøvsuger | Støvsuger | Maskiner | Køkken | Bad | Computer | Printer | Mobil