Irakurketa-galderak

4

Click here to load reader

description

Hementxe dituzue interneteko informazioen errekuperaketak nola egiten diren eta zein arazo planteatzen diren jakiteko egin dugun ariketa

Transcript of Irakurketa-galderak

Page 1: Irakurketa-galderak

Informazio-Konpetentziak ikasgaiaIkus-Entzunezko Komunikazioa Gradua

Irakurketa-galderakMateos Sánchez, M.; García_figuerola, C. (2009). Recuperación de información en la web. Gijón: Trea

Lehenengo artikulu osoa irakurri eta gero erantzun galdera hauek. Erantzun batzuetarako komeni da Interneten bilaketa batzuk egitea. Bukatzean Interneten Issun igo. Gero zuen blogean ekarpena egin

eta esteka txertatu.

1. Zein dira aipatzen diren bi arazo nagusienak informazioa bilatzerakoan?

Lehenengo aipatzen den arazoak, erabiltzailearekin zerikusia du. Honek

bilatzaileari bilatu nahi duena adierazterakoaz izaten da gehienbat; zehaztasun

falta ohikoa izaten da kasu honetan.

Bigarren arazoa sistemarekin zerikusia du. Erabiltzaileak jarritakoarekin milaka

emaitz lortzen ditu. Horrela berarentzat zaila izaten da topatu nahi duena

aurkitzea.

2. Bilatzaileen Crawler-rak Robot ere deitzen dira. Azaldu zure hitzetan zer egiten

duten. Bilatu Interneten nola izena duen Googlen Robotak.

Crawlerra, webguneak bilatu eta hauek ordenatzeko erabiltzen den software bat

da. Honek irakurritako web orrialdeak datu basean gordetzen ditu.

Bilatzerakoan, softwareak informazioa zerbitzare batera bidaliko du eta

ondoren honek, beste zerbitzari nagusiago batera. Bukatzeko azken honek

bilaketa egingo du.

Googleren Robotak Googlebot izena du.

1

IZENA: Ainhoa Zabarte

Page 2: Irakurketa-galderak

Informazio-Konpetentziak ikasgaiaIkus-Entzunezko Komunikazioa Gradua

3. Zer esan nahi du “búsqueda sintáctica”?

“Busqueda sintácticak” bilatzerakoan guk jartzen ditugun hitz gakoei deritze.

Gerta daiteke hitz gakoak bat ez etortzea, edo egokiak ez izatea; orduan

emaitza ez zen oso ona izango baina gehienetan oso erabilgarria izaten da.

4. Googlen algoritmoa Page Rank da. Zein da bere eginkizun nagusia ?

Page Rank algoritmoa web orrialdeen garrantzia neurtzen duen sistema bat

dela esan daiteke. Honek link-ak analizatu eta orrialdearen loturak ere aztertzen

ditu, horrela puntuazio bat ematen die. Gero Googlen bilaketa egiterakoan

honek garrantsiaren arabera sailkatzen du.

5. Googlen bilaketa bat egiten duzunean zer gertatzen da? Azaldu zer gertatzen den

“Googlen” barruan

Googlen bilaketa egiterakoan prozezu luze bat garatzen da, prozezu hau zat

txikitan banatuta dago horrela prozezu hau konplexu bihurtzen da.

Lehenik eta behin, Crawlerek webguneak bilatzen ditu. Gero store server batera

bidaltzen da informazioa, bertan konprimitu eta repository deintzen den toki

baten biltegiratzen da, gordetako orrialde bakoitzari docID bat ematen zaio,

hots, identifikazio klabe bat. Ondoren bildutako orrialde baoitzaren indizazio

prozezua hasten da, indixer eta sorteraren bitartez. Prozezu honekin jarraituz,

URL resorver-ek, fitxategia irakurri eta URL bakoitzari docID bat gehitzen dio.

Hau guztiaren ondoren sorter-ak docID-ak WordID bilakatzen ditu, eta

amaitzeko DumpLexicon-ek llista hau jaso eta lexicon lista berria egiten du.

Horrela lexicon eta Page Rank-ekin bilaketako emaitzak eskuratzen ditugu.

2

Page 3: Irakurketa-galderak

Informazio-Konpetentziak ikasgaiaIkus-Entzunezko Komunikazioa Gradua

3