scraper vertimas
Mantas
sirexas at gmail.com
Tue Dec 13 14:53:35 EET 2016
crawler nėra tas pats kas scraper.
crawler tik atsisiunčia turinį iš interneto vaikščiodamas per nuorodas,
tačiau pačio turinio neanalizuoja (išskyrus nuorodas).
scraper iš nestruktūruotų duomenų, tokių kaip HTML, PDF ir pan. ištraukia
struktūruotus duomenis.
Dažnai duomenų ištraukimui scraperis naudoja turinį, kurį surinko crawleris.
2016 m. gruodžio 13 d. 14:36, Vladas Palubinskas via Komp_LT <
komp_lt at konferencijos.lt> rašė:
> Scraper yra jau senas „tarptautinis“ žodis lietuvių kalboje — skreperis.
>
> Toks panašus į buldozerį prikabinamas arba savaeigis žemės, dažniausiai
> kelio gremžtuvas.
>
> O indeksavimo robotą webcrawler žmonės versdavo sekliu, kurmiu (nes aklas
> — paveikslų nemato, supranta tik tekstą).
>
> prietaisams naudotinos priesagos: -tuvas, -iklis, -tas, -tukas.
>>
>
> Trūksta priesagos -lys. Kuri tiktų bene geriausiai: (meta duomenų)
> knyslys, siurblys, trauklys.
>
> Vladas
>
> _______________________________________________
> Konferencija Komp_LT
> Norėdami atsisakyti, rašykite adresu komp_lt-unsubscribe at konferencijos.lt
> https://www.konferencijos.lt/mailman/listinfo/komp_lt
>
--
Mantas aka sirex
__o /\
_ \<,_ -- launchpad.net/~sirex -- /\/ \
___(_)/_(_)_____________________________/_/ \
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://www.konferencijos.lt/pipermail/komp_lt/attachments/20161213/2fc8b486/attachment-0002.html>
More information about the Komp_LT
mailing list