Motores de Búsqueda y Sistemas de Información en la Web Primera Parte: Google Lluís Codina UPF...

24
Motores de Búsqueda y Sistemas de Información en la Web Primera Parte: Google Lluís Codina UPF IDEC Barcelona, Abril 2008

Transcript of Motores de Búsqueda y Sistemas de Información en la Web Primera Parte: Google Lluís Codina UPF...

Page 1: Motores de Búsqueda y Sistemas de Información en la Web Primera Parte: Google Lluís Codina UPF IDEC Barcelona, Abril 2008.

Motores de Búsqueda y Sistemas de Información

en la WebPrimera Parte: Google

Lluís CodinaUPF

IDECBarcelona, Abril 2008

Page 2: Motores de Búsqueda y Sistemas de Información en la Web Primera Parte: Google Lluís Codina UPF IDEC Barcelona, Abril 2008.

Abril 2008 L. Codina - IDEC/UPF

El modelo actual

El paradigma Google

¿Es el motor de búsqueda más usado?

¿Es el mejor?

¿A qué debe su supremacía?

¿Tiene puntos débiles?

¿Hay alternativas?

Page 3: Motores de Búsqueda y Sistemas de Información en la Web Primera Parte: Google Lluís Codina UPF IDEC Barcelona, Abril 2008.

Abril 2008 L. Codina - IDEC/UPF

Google – I

Puntos fuertes: Mayor índice de cobertura de la Web (entre el 40

y el 80 por ciento de la web) Ordenación de resultados (ranking)

Componente principal: análisis de enlaces (PageRank)

Sencillez de uso + Uso avanzado… en segundo plano

Page 4: Motores de Búsqueda y Sistemas de Información en la Web Primera Parte: Google Lluís Codina UPF IDEC Barcelona, Abril 2008.

Abril 2008 L. Codina - IDEC/UPF

Google – II

Puntos débiles: Ranking vulnerable (Spaming, Google bombing,

…) Alta prioridad a parecer eficientes antes que serlo

(no se pueden consultar todos los resultados, no aplican álgebra booleana, etc.)

El comercio electrónico como background unificador de su estrategia

Page 5: Motores de Búsqueda y Sistemas de Información en la Web Primera Parte: Google Lluís Codina UPF IDEC Barcelona, Abril 2008.

Abril 2008 L. Codina - IDEC/UPF

Google – III

Algunos mitos sobre Google: Google “lo sabe todo” Si no está en Google es que no está en la Web Si no está en su primera página de resultados, es

que no me interesa No hay otras fuentes de información en la Web

(que merezcan la pena)

Page 6: Motores de Búsqueda y Sistemas de Información en la Web Primera Parte: Google Lluís Codina UPF IDEC Barcelona, Abril 2008.

Abril 2008 L. Codina - IDEC/UPF

¿Hay vida más allá de Google?

Sí, y muy recomendable: Yahoo Search > La mejor competencia

search.yahoo.com Live > La competencia más peligrosa

www.live.com Alexa > La información añadida

www.alexa.com A9 > La búsqueda más completa

a9.com

Page 7: Motores de Búsqueda y Sistemas de Información en la Web Primera Parte: Google Lluís Codina UPF IDEC Barcelona, Abril 2008.

Características de un buscador

Cálculo de Relevancia: ¿Los primeros resultados son los más

relevantes? Página de resultados:

¿Cómo presenta los resultados? Búsqueda avanzada

¿Qué opciones adicionales presenta?

Abril 2008 L. Codina - IDEC/UPF

Page 8: Motores de Búsqueda y Sistemas de Información en la Web Primera Parte: Google Lluís Codina UPF IDEC Barcelona, Abril 2008.

Análisis comparativo

Buscador Relevancia Pag. Resultados Búsqueda Avan.

Google

Yahoo

Live

a9

Total

Abril 2008 L. Codina - IDEC/UPF

Page 9: Motores de Búsqueda y Sistemas de Información en la Web Primera Parte: Google Lluís Codina UPF IDEC Barcelona, Abril 2008.

Práctica - 11. Entrar en Ranking Thumbshots:

http://ranking.thumbshots.com/ Comparar Google con Yahoo usando una misma frase o palabra clave

2. Buscar una misma frase o palabra clave, p.e. “marketing”, en Google.es y en Google.com y comparar resultados

3. Seleccionar una frase o palabra clave y realizar búsquedas en: Windows Live > www.live.com Google > www.google.com Yahoo > www.yahoo.com Comparar: (1) relevancia, (2) página de resultados, (3) búsqueda

avanzada Otorgar un máximo de 3 puntos a cada uno de los tres apartados

4. Entrar en Metacrawler y realizar pruebas comparativas entre buscadores activando las columnas de los tres principales buscadores

Abril 2008 L. Codina - IDEC/UPF

Page 10: Motores de Búsqueda y Sistemas de Información en la Web Primera Parte: Google Lluís Codina UPF IDEC Barcelona, Abril 2008.

Abril 2008 L. Codina - IDEC/UPF

Búsqueda Multimedia (I) Dimensiones del fenómeno

Cuantitativa - I: ¿Cuántas imágenes?75 mil millones de fotografías en un año en todo el mundo900 mil millones de fotografías almacenadas en total en todo el mundo31 millones de horas de programas de televisión al año y 71 millones de programas de radioFuente: How Much Information 2003 www.sims.berkeley.edu/research/projects/how-much-info-2003

Page 11: Motores de Búsqueda y Sistemas de Información en la Web Primera Parte: Google Lluís Codina UPF IDEC Barcelona, Abril 2008.

Abril 2008 L. Codina - IDEC/UPF

Búsqueda Multimedia (II) Dimensiones…

Cuantitativa – II: ¿Qué dimensión económica? Mercado en EE.UU. de bancos de imágenes calculado en unos

3000 millones de dólares (2005). Tres datos concretos: Facturación de Corbis: 228 millones de dólares en 2005 (unos

100 millones en 2004) y 70 millones de imágenes Facturación de Getty: 733 millones de dólares en 2005 (unos

400 millones en 2004) y 70 millones de imágenes y 30.000 horas de metraje (video)

Facturación de JupiterImages (2005): 124 millones de dólares (7 millones de imágenes)

Fuente: Hoovers (www.hoovers.com)

Page 12: Motores de Búsqueda y Sistemas de Información en la Web Primera Parte: Google Lluís Codina UPF IDEC Barcelona, Abril 2008.

Abril 2008 L. Codina - IDEC/UPF

Dimensiones…

Cualitativa: segmentación del mercado Editorial (revistas, libros) Prensa (diarios) Publicidad y relaciones públicas Packaging Multimedia (dvd, internet) Televisión, vídeo y cine Corporaciones (folletos y memorias de empresas) Investigación: arte, historia, sociología,

antropología, etc. Uso personal (invitaciones, tarjetas, webs, etc.)

Page 13: Motores de Búsqueda y Sistemas de Información en la Web Primera Parte: Google Lluís Codina UPF IDEC Barcelona, Abril 2008.

Abril 2008 L. Codina - IDEC/UPF

Búsqueda multimedia – (III)

Motores de búsqueda convencionales El problema esencial

Derechos de autor Problemas añadidos

Baja calidad imágenes, limitaciones en las opciones de búsqueda y ausencia de metadatos

La alternativa profesional Bases de datos Repositorios Buscadores especializados “open access”

Page 14: Motores de Búsqueda y Sistemas de Información en la Web Primera Parte: Google Lluís Codina UPF IDEC Barcelona, Abril 2008.

Abril 2008 L. Codina - IDEC/UPF

Búsqueda multimedia – (IV)

Bases de datos GettyImages > www.gettyimages.es Corbis > www.corbis.com AGE Fotostock > www.agefotostock.com

Repositorios Internet Archive > www.archive.org MorgueFile > www.morguefile.com

Buscadores especializados Creative Commons > es.creativecommons.org/ YotoPhoto > www.yotophoto.com

Page 15: Motores de Búsqueda y Sistemas de Información en la Web Primera Parte: Google Lluís Codina UPF IDEC Barcelona, Abril 2008.

Abril 2008 L. Codina - IDEC/UPF

Fuenteswww.tasi.ac.uk

Page 16: Motores de Búsqueda y Sistemas de Información en la Web Primera Parte: Google Lluís Codina UPF IDEC Barcelona, Abril 2008.

Abril 2008 L. Codina - IDEC/UPF

Alexawww.alexa.com

Page 17: Motores de Búsqueda y Sistemas de Información en la Web Primera Parte: Google Lluís Codina UPF IDEC Barcelona, Abril 2008.

Abril 2008 L. Codina - IDEC/UPF

StockIndex Online

Page 18: Motores de Búsqueda y Sistemas de Información en la Web Primera Parte: Google Lluís Codina UPF IDEC Barcelona, Abril 2008.

Práctica - 2

Seleccione tres frases o palabras clave que consistan en: Un elemento icónico Un concepto Un nombre propio (nombre de persona, empresa,

topónimo, etc.) Haga búsquedas con estas frases o palabras clave en

Getty y en Corbis para poder preparar un breve informe comparativo que incluya: (1) relevancia de los resultados, (2) presentación y (3) opciones de búsqueda.

Abril 2008 L. Codina - IDEC/UPF

Page 19: Motores de Búsqueda y Sistemas de Información en la Web Primera Parte: Google Lluís Codina UPF IDEC Barcelona, Abril 2008.

Abril 2008 L. Codina - IDEC/UPF

Segunda Parte: Motores de búsqueda para usos académicos

Las dudas de la Web ante “misiones críticas”: ¿Es fiable? ¿Quién controla la calidad de la información? ¿Cómo filtrar la desinformación? ¿Sirven los modelos anteriores de control

editorial? ¿Cuál es la respuesta de los motores de

búsqueda?

Page 20: Motores de Búsqueda y Sistemas de Información en la Web Primera Parte: Google Lluís Codina UPF IDEC Barcelona, Abril 2008.

Abril 2008 L. Codina - IDEC/UPF

La respuesta de los motores

Google Google Books

books.google.com Google Scholar

scholar.google.com MS

Live Academicacademic.live.com

Page 21: Motores de Búsqueda y Sistemas de Información en la Web Primera Parte: Google Lluís Codina UPF IDEC Barcelona, Abril 2008.

Abril 2008 L. Codina - IDEC/UPF

Google Books Inputs

Digitalizaciones de colecciones libres de derechos (Bibliotecas) Contratos con editoriales

Consulta Búsqueda simple y avanzada

Navegación Sumario e Índice temático

Acceso Libro completo Número limitado de página

Opciones específicas Adquisición Localización en bibliotecas

Page 22: Motores de Búsqueda y Sistemas de Información en la Web Primera Parte: Google Lluís Codina UPF IDEC Barcelona, Abril 2008.

Abril 2008 L. Codina - IDEC/UPF

Google Scholar vs. Academic Live

Inputs La Web (Google Scholar) Editoriales científicas (ambos) Acuerdos con Bibliotecas (Google Scholar)

Consultas Búsqueda avanzada (Google Scholar)

Acceso Resolución de enlaces (ambos)

Exportación de resultados Formatos bibliográficos (ambos)

Page 23: Motores de Búsqueda y Sistemas de Información en la Web Primera Parte: Google Lluís Codina UPF IDEC Barcelona, Abril 2008.

Abril 2008 L. Codina - IDEC/UPF

Alternativas

Amazon www.amazon.com > Search Inside A9

www.a9.com > books

Page 24: Motores de Búsqueda y Sistemas de Información en la Web Primera Parte: Google Lluís Codina UPF IDEC Barcelona, Abril 2008.

Abril 2008 L. Codina - IDEC/UPF

Práctica - 3 Seleccione una frase o una palabra clave de su interés y

compare resultados y prestaciones de: Scirus Google Scholar Windows Live

Prepare un breve informe sobre los siguientes aspectos. Relevancia Página de resultados Tipología de los documentos Opciones de búsqueda Utilidades