<div dir="auto">Sveiki,<div dir="auto"><br></div><div dir="auto">Gal net sudurtinis čia visai idomiai žiūrėtųsi, pvz. duomtrauklys.<br><br><div data-smartmail="gmail_signature" dir="auto">Pagarbiai,<br>Linas T.</div></div></div><div class="gmail_extra"><br><div class="gmail_quote">On Dec 13, 2016 14:53, "Mantas via Komp_LT" <<a href="mailto:komp_lt@konferencijos.lt">komp_lt@konferencijos.lt</a>> wrote:<br type="attribution"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div><div>crawler nėra tas pats kas scraper.<br><br></div>crawler tik atsisiunčia turinį iš interneto vaikščiodamas per nuorodas, tačiau pačio turinio neanalizuoja (išskyrus nuorodas).<br></div>scraper iš nestruktūruotų duomenų, tokių kaip HTML, PDF ir pan. ištraukia struktūruotus duomenis.<br><div><div><br></div><div>Dažnai duomenų ištraukimui scraperis naudoja turinį, kurį surinko crawleris.<br></div><div><br><br></div></div></div><div class="gmail_extra"><br><div class="gmail_quote">2016 m. gruodžio 13 d. 14:36, Vladas Palubinskas via Komp_LT <span dir="ltr"><<a href="mailto:komp_lt@konferencijos.lt" target="_blank">komp_lt@konferencijos.lt</a>></span> rašė:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Scraper yra jau senas „tarptautinis“ žodis lietuvių kalboje — skreperis.<br>
<br>
Toks panašus į buldozerį prikabinamas arba savaeigis žemės, dažniausiai kelio gremžtuvas.<br>
<br>
O indeksavimo robotą webcrawler žmonės versdavo sekliu, kurmiu (nes aklas — paveikslų nemato, supranta tik tekstą).<span><br>
<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
prietaisams naudotinos priesagos: -tuvas, -iklis, -tas, -tukas.<br>
</blockquote>
<br></span>
Trūksta priesagos -lys. Kuri tiktų bene geriausiai: (meta duomenų) knyslys, siurblys, trauklys.<br>
<br>
Vladas<div class="m_-4067804053678508416HOEnZb"><div class="m_-4067804053678508416h5"><br>
______________________________<wbr>_________________<br>
Konferencija Komp_LT<br>
Norėdami atsisakyti, rašykite adresu <a href="mailto:komp_lt-unsubscribe@konferencijos.lt" target="_blank">komp_lt-unsubscribe@konferenci<wbr>jos.lt</a><br>
<a href="https://www.konferencijos.lt/mailman/listinfo/komp_lt" rel="noreferrer" target="_blank">https://www.konferencijos.lt/m<wbr>ailman/listinfo/komp_lt</a><br>
</div></div></blockquote></div><br><br clear="all"><br>-- <br><div class="m_-4067804053678508416gmail_signature" data-smartmail="gmail_signature">                 Mantas aka sirex<br>      __o                                   /\<br>    _ \<,_   -- <a href="http://launchpad.net/~sirex" target="_blank">launchpad.net/~sirex</a> --  /\/  \<br>___(_)/_(_)___________________<wbr>__________/_/    \<br>^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^<wbr>^^^^^^^^^^^^^^^^^^^</div>
</div>
<br>______________________________<wbr>_________________<br>
Konferencija Komp_LT<br>
Norėdami atsisakyti, rašykite adresu <a href="mailto:komp_lt-unsubscribe@konferencijos.lt">komp_lt-unsubscribe@<wbr>konferencijos.lt</a><br>
<a href="https://www.konferencijos.lt/mailman/listinfo/komp_lt" rel="noreferrer" target="_blank">https://www.konferencijos.lt/<wbr>mailman/listinfo/komp_lt</a><br>
<br></blockquote></div></div>