|
Felt (=) | Værdi (demonstrationsværdier angivet her) | Beskrivelse |
meta__navn_kort | navneeksempel | kort navn vist i programmet |
meta__navn_langt | eksempel på et langt navn | langt navn vist i programmet |
søg__art | generisk_parser | bruger HTTP GET-anmodninger til onlinetjenester og API'er |
søg__url | http://search.example.com/results.aspx | Enkel stil : Genererer URL'er ved at tilføje forespørgselsnavne og værdier baseret på indstillingerne. |
http://search.example.com/results/q=@search__q_var_f@/ | Skabelonstil : Genererer URL'er ved hjælp af search__q_var_ ? for at indsætte og erstatte forespørgselsværdier. | |
Skabelonstilgenererede URL'er | ||
search__url_tmpl_var | @ | Symbol, der skal bruges, hvis du vælger at konstruere forespørgsels-URL'er ved at lade forespørgselsværktøj erstatte @search__q_var_ ? @ med passende værdier. |
@search__q_var_f@ = forespørgselstekst @search__q_var_c@ = resultater tæller @search__q_var_s@ = resultater starter | Bruger du @search__q_var_ ? @ system kan nogle gange gøre det lettere at konstruere forespørgsels-URL'erne. Et typisk tilfælde er, hvis søge-URL'erne ikke indeholder nogen forespørgselskomponent, dvs. ?. | |
Simple stilgenererede URL'er | ||
søg__q_var_f | q | "query" (alias søg/find) parameter |
søg__q_var_c | c | resultater "tæller" pr. sideparameter |
søg__q_var_s | s | start forespørgselsresultater fra "start" parameter |
Bemærk: Ovenstående er sjældent nyttigt, hvis du bruger skabelonkonstruktionen search__url_tmpl_var | ||
Simple stilgenererede URL'er | ||
søg__q_input_before | datacenter=da& | indsæt før "forespørgsel" relaterede parametre |
søg__q_input_after | tilføje efter "forespørgsel" relaterede parametre | |
Bemærk: Ovenstående er sjældent nyttigt, hvis du bruger skabelonkonstruktionen search__url_tmpl_var | ||
Indstillinger, der styrer forespørgselsværktøj | ||
search__q_start | 1 | det tal, som denne motor betragter som det første "start" resultat |
search__q_start_default | 1 | det tal, som denne motor betragter som standard "start" resultat |
søg__q_pp_sa | 100 | med (næste) resultatside, tilføje værdi til "start" |
søg__q_items | 100 | søgeresultater på hver side |
søg__q_sider | 2 | søgeresultatsider at tjekke |
search__limit_depth_total | 1000 | max antal stillinger, der anmodes om data for |
search__limit_connect_timeout | 10.000 | maks. millisekunder før timeout for forbindelsesforsøg |
search__limit_read_timeout | 10.000 | maks. millisekunder før timeout for læst download |
search__limit_connect_tries | 1 | max antal forbindelsesforsøg |
søg__idle_lo_s | 0800 | minimum tid før næste resultatside (milisekunder) |
søg__idle_lo_e | 1600 | maksimal tid før næste resultatside (milisekunder) |
søg__idle_hi_s | 1200 | minimum tid før næste søgeforespørgsel (milisekunder) |
søg__idle_hi_e | 2000 | maksimal tid før næste søgeforespørgsel (milisekunder) |
config__include_file | myConfigInclude.inc | fil, der indeholder konfiguration, normalt delt |
extract__rex_file | myEngineRegex.rex | fil, der indeholder regulære udtryk, der bruges til at udtrække data |
søg__ua_fil | myUserAgents.txt | fil, der indeholder brugeragentstreng(e), der skal bruges |
extract__match_url | 2 | match parentes i regulært udtryk for "url" |
extract__match_title | 3 | match parentes i regulært udtryk for "titel" |
extract__match_desc | -1 | match parentes i regulært udtryk for "beskrivelse" |
udtræk__match_antal_søgninger | -1 | match parentes i regulært udtryk for "søgninger tæller" |
udtrække__match_count_scores | -1 | match parentes i regulært udtryk for "score tæller" |
clean__decode__match_url | 1 | 0 = ingen afkodning. 1 = normal afkodning. |
foreslå__ren__match_titel | falsk | ren "titeldel" (bruges kun når der foreslås sætninger) |
<li([\s]class="fromsite")?><h3>
<a href="([^"]*)">(.*?)</a>
</h3><p>
|