scraper vertimas

Linas T. l.tamasauskas at gmail.com
Fri Dec 23 17:50:08 EET 2016


Sveiki,

Gal net sudurtinis čia visai idomiai žiūrėtųsi, pvz. duomtrauklys.

Pagarbiai,
Linas T.

On Dec 13, 2016 14:53, "Mantas via Komp_LT" <komp_lt at konferencijos.lt>
wrote:

> crawler nėra tas pats kas scraper.
>
> crawler tik atsisiunčia turinį iš interneto vaikščiodamas per nuorodas,
> tačiau pačio turinio neanalizuoja (išskyrus nuorodas).
> scraper iš nestruktūruotų duomenų, tokių kaip HTML, PDF ir pan. ištraukia
> struktūruotus duomenis.
>
> Dažnai duomenų ištraukimui scraperis naudoja turinį, kurį surinko
> crawleris.
>
>
>
> 2016 m. gruodžio 13 d. 14:36, Vladas Palubinskas via Komp_LT <
> komp_lt at konferencijos.lt> rašė:
>
>> Scraper yra jau senas „tarptautinis“ žodis lietuvių kalboje — skreperis.
>>
>> Toks panašus į buldozerį prikabinamas arba savaeigis žemės, dažniausiai
>> kelio gremžtuvas.
>>
>> O indeksavimo robotą webcrawler žmonės versdavo sekliu, kurmiu (nes aklas
>> — paveikslų nemato, supranta tik tekstą).
>>
>> prietaisams naudotinos priesagos: -tuvas, -iklis, -tas, -tukas.
>>>
>>
>> Trūksta priesagos -lys. Kuri tiktų bene geriausiai: (meta duomenų)
>> knyslys, siurblys, trauklys.
>>
>> Vladas
>>
>> _______________________________________________
>> Konferencija Komp_LT
>> Norėdami atsisakyti, rašykite adresu komp_lt-unsubscribe at konferencijos.lt
>> https://www.konferencijos.lt/mailman/listinfo/komp_lt
>>
>
>
>
> --
>                  Mantas aka sirex
>       __o                                   /\
>     _ \<,_   -- launchpad.net/~sirex --  /\/  \
> ___(_)/_(_)_____________________________/_/    \
> ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
>
> _______________________________________________
> Konferencija Komp_LT
> Norėdami atsisakyti, rašykite adresu komp_lt-unsubscribe at konferencijos.lt
> https://www.konferencijos.lt/mailman/listinfo/komp_lt
>
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <https://www.konferencijos.lt/mailman/private/komp_lt/attachments/20161223/b9e9e18e/attachment.html>


More information about the Komp_LT mailing list