Sistemas de recomendación: tipos y evaluación

47
Sistemas de Recomendación: tipos y evaluación Blanca A. Vargas Govea Grupo de Servicios de Recomendación Dirigido por: Dr. Juan Gabriel González Serna CENIDET 29/Sep/2010

Transcript of Sistemas de recomendación: tipos y evaluación

Page 1: Sistemas de recomendación: tipos y evaluación

Sistemas de Recomendación:

tipos y evaluación

Blanca A. Vargas GoveaGrupo de Servicios de Recomendación

Dirigido por: Dr. Juan Gabriel González SernaCENIDET 29/Sep/2010

Page 2: Sistemas de recomendación: tipos y evaluación

1.Sistemas de recomendación- Tipos: filtrado de contenido, colaborativo e híbrido- Problemas

2. Evaluación - Dificultades - Importancia de los datos - Diversos enfoques

Page 3: Sistemas de recomendación: tipos y evaluación

Encontrar ítems/servicios del agrado del usuario

Objetivo

Page 4: Sistemas de recomendación: tipos y evaluación

Tipos

Filtrado basado en contenido

Filtrado colaborativo

Filtrado híbrido

Page 5: Sistemas de recomendación: tipos y evaluación

Filtrado basado en contenido

Correspondencia ítem - usuario

Descripción - ítem

Descripción - perfil

Vectores de atributos

Implícita

Explícita

Page 6: Sistemas de recomendación: tipos y evaluación

Filtrado basado en contenido

Aprendizaje automático

Entrada: descripción - ítem

Salida: rating del usuario sobre el ítem

Árboles, reglas

Page 7: Sistemas de recomendación: tipos y evaluación

Filtrado basado en contenido: ventajas

El usuario puede conocer el efecto de sus preferencias

Puede generar recomendaciones sin necesidad de ratings

Page 8: Sistemas de recomendación: tipos y evaluación

Filtrado basado en contenido: desventajas

Descripciones ricas, completas

Recomiendan ítems muy parecidos

Contenido en te minos de ŕatributos

Page 9: Sistemas de recomendación: tipos y evaluación

Filtrado colaborativo

Favorece los juicios humanos

Opiniones expresadas por una comunidad

Basado en el modelo

Basado en la memoria

Page 10: Sistemas de recomendación: tipos y evaluación

Filtrado colaborativo: basado en memoria

Supone que usuarios que han compartido intereses en el pasado lo seguirán haciendo en el futuro

Es el que domina

Page 11: Sistemas de recomendación: tipos y evaluación

Filtrado Colaborativo: basado en memoria

1. Formación de vecindario

2. Agregación de opinión

3. Generación de recomendaciones

Métricas de similaridad

Correlación de Pearson

Manhattan

Jaccard

Euclidiana

Se calculan las predicciones de rating (k-vecinos más cercanos)

Page 12: Sistemas de recomendación: tipos y evaluación

Filtrado colaborativo: generación de recomendaciones

Retroalimentación

Los perfiles crecen

Se repite el ciclo

Page 13: Sistemas de recomendación: tipos y evaluación

Filtrado colaborativo: basado en el modelo

Técnicas de aprendizaje automático

Clasificación: a qué rating pertenecenlos ítems no calificados

Regresión: relación de variables (usuario-otros perfiles)

clase 2

clase 1

clase 3

clase 4

Page 14: Sistemas de recomendación: tipos y evaluación

Filtrado colaborativo: basado en el modelo

Inferir reglas o patrones

Agrupar usuarios en clusters

Ejemplo:

Los vecinos son los usuarios del mismo cluster

Page 15: Sistemas de recomendación: tipos y evaluación

Filtrado colaborativo: basado en el modelo

Predicción eficiente

Basados en memoria: igual de eficientes, ¿más simples?

Se entrena un modelo por usuario

Noción de comunidad

Interpretación

Page 16: Sistemas de recomendación: tipos y evaluación

Filtrado híbrido

Filtrado basado en memoria y modelo (e.g.,clusters+vecinos cercanos)

Filtrado colaborativo y de contenido (e.g., correr independientemente y combinar con esquema de votación)

Page 17: Sistemas de recomendación: tipos y evaluación

Problemas generales

Datos faltantes

Cold Start

Espera de nuevas recomendaciones

Usuarios maliciosos

Page 18: Sistemas de recomendación: tipos y evaluación

1. Sistemas de recomendación- Tipos: filtrado de contenido, colaborativo e híbrido- Problemas

2. Evaluación - Dificultades - Importancia de los datos - Diversos enfoques

Page 19: Sistemas de recomendación: tipos y evaluación

Evaluación

Gran cantidad de algoritmos

Todos dicen ser el mejor

No hay una metodología estándar para determinar qué hace a un algoritmo mejor que otro

Page 20: Sistemas de recomendación: tipos y evaluación

Evaluación: dificultades

Algoritmos diseñados para conjuntos de datosespecíficos

Distintos objetivos

Cuestionamiento en decidir qué métricas usar

Page 21: Sistemas de recomendación: tipos y evaluación

Evaluación: tareas del sistema (las más evaluadas)

Depende de los objetivos y tareas del sistema

Predicción de preferencias

Desplegar artículos (e.g., lista rankeada)

Page 22: Sistemas de recomendación: tipos y evaluación

Evaluación: tareas del sistema (menos evaluadas)

Todos los ítems buscados (e.g., documentos legales)

Sólo navegar, sin comprar

Recomendador confiable

Mejora del perfil

Deseo de expresarse

Ayudar a otros

Page 23: Sistemas de recomendación: tipos y evaluación

Evaluación: ¿qué se evalúa?

Objetivo del sistema Objetivo del usuario

Pueden ser muy diferentes

Page 24: Sistemas de recomendación: tipos y evaluación

Evaluación: los datos

¿Offline?

¿Simulados?

¿Online?

Page 25: Sistemas de recomendación: tipos y evaluación

Evaluación: los datos

Propiedades de los datos para modelar mejor la tarea

Atributos de dominio

Atributos inherentes

Atributos de muestreo

Page 26: Sistemas de recomendación: tipos y evaluación

Evaluación: los datos, atributos de dominio

Naturaleza del contenido a recomendar/contexto

Tareas soportadas por el sistema

Page 27: Sistemas de recomendación: tipos y evaluación

Evaluación: los datos, atributos de dominio

Novedad y calidad

Costo/Beneficio

Granularidad de la preferencia

Page 28: Sistemas de recomendación: tipos y evaluación

Evaluación: los datos, atributos inherentes

Ratings implícitos, explícitos o ambos

Escala del rating

Page 29: Sistemas de recomendación: tipos y evaluación

Evaluación: los datos, atributos inherentes

Dimensiones del rating

Presencia/ausencia de registro de tiempo

Page 30: Sistemas de recomendación: tipos y evaluación

Evaluación: los datos, atributos inherentes

Registro de las recomendaciones

Sesgo de la colección de datos

Disponibilidad de información demográfica del usuario

Page 31: Sistemas de recomendación: tipos y evaluación

Evaluación: los datos, atributos de muestreo

Densidad de los ratings de ítems

Densidad de los ratings de usuarios que generan recomendaciones

Ítems: 999

Calif: 3

Ítems: 1122Calif:3127

Page 32: Sistemas de recomendación: tipos y evaluación

Evaluación: los datos, atributos de muestreo

Tamaño y distribución: ítems > usuarios, usuario > ítems

Escasez de datos

Page 33: Sistemas de recomendación: tipos y evaluación

Evaluación:métricas de precisión

Mide qué tan cerca el sistema puede predecir el rating para un ítem en comparación con el rating real

¿Qué rating le dará un usuario a un ítem?

¿Seleccionará el usuario un ítem?

¿Qué orden de utilidad tendrán los ítems?

Page 34: Sistemas de recomendación: tipos y evaluación

Evaluación: categorías de métricas de precisión

1. Precisión predictiva

2. Clasificación

3. Precisión y recuerdo

Page 35: Sistemas de recomendación: tipos y evaluación

Evaluación: precisión predictiva

Error Absoluto Medio (MAE)

Raíz cuadrada del error cuadrático medio (RMSE)

Miden qué tan cerca están las predicciones de los ratings del sistema de recomendación a los del usuario real.

No es muy útil cuando la granularidad de las preferencias es pequeña.

La diferencia radica en el grado en el cual los errores son penalizados. RMSE penaliza errores grandes.

Page 36: Sistemas de recomendación: tipos y evaluación

Evaluación: clasificación

Miden la frecuencia con la que el sistema toma decisiones correctas o incorrectas sobre si un ítem es bueno.

Son apropiadas para tareas como encontrar buenos ítems donde los usuarios tienen preferencias binarias.

Page 37: Sistemas de recomendación: tipos y evaluación

Evaluación: precisión y recuerdo

Precisión:Capacidad del sistema de mostrar ítems relevantes. Representa la probabilidad de que un ítem seleccionado sea relevante.

Recuerdo:Cobertura de ítems útiles que el sistema puede obtener. Representa la probabilidad de que un ítem relevante sea seleccionado.

Relevante Norelevante

Seleccionado a b

No seleccionado

c d

P=aa+b

R=aa+c

Miden la capacidad del sistema de obtener los ítems relevantes disponibles.

Page 38: Sistemas de recomendación: tipos y evaluación

Evaluación: curvas ROC

Receiver Operating Characteristic

Mide la capacidad del sistema de distinguir entre ítems relevantes y no relevantes.

Precisión/Recuerdo enfatizan la proporción de recomendaciones exitosas. Ideal para: muchos ítems interesantes y se necesitan pocas buenas recomendaciones.

ROC enfatiza la proporción de ítems no exitosos que fueron recomendados. Ideal para: cada recomendación tiene un costo y equivocarse es caro.

Page 39: Sistemas de recomendación: tipos y evaluación

Evaluación:métricas de precisión

Ciertas métricas son más adecuadas para determinadas tareas y tipos de datos

Page 40: Sistemas de recomendación: tipos y evaluación

Evaluación:más allá de la precisión

Cobertura

¿Qué porcentaje de los ítems son los que recomienda el sistema?

¿Sobre qué porcentaje de ítems el sistema puede generar predicciones?

Page 41: Sistemas de recomendación: tipos y evaluación

Evaluación:más allá de la precisión

Tasa de aprendizaje

Novedad y Suerte

Similar a un esquema por refuerzo

Confianza: ¿qué tan seguro está el sistema de que

su recomendación es exacta? Mostrarle al usuario.

Page 42: Sistemas de recomendación: tipos y evaluación

Evaluación:más allá de la precisión

Evaluación del usuario

Evaluación explícita/implícita

Estudios de laboratorio/campo

Definición de lo que es una salida exitosa

Corto/largo alcance

Page 43: Sistemas de recomendación: tipos y evaluación

Evaluación:más allá de la precisión

Satisfacción del usuario

¿A qué métricas son más sensitivos los usuarios?

¿Cómo afectan los diversos aspectos (cobertura, novedad, etc.) a la satisfacción?

Page 44: Sistemas de recomendación: tipos y evaluación

Gracias.¿Preguntas?

[email protected]

Page 45: Sistemas de recomendación: tipos y evaluación

Referencias

Candillier, L., Jack, K., Fessant, F., and Meyer, F. (2009). State­of­the­Art Recommender Systems, chapter 1, pages 1–22. IGI Global. Book: Collaborative and Social Information Retrieval and Access: Techniques for Improved User Modeling.

de Wit, J. J. (2008). Evaluating recommender systems – an evaluation frame­work to predict user satisfaction for recommender systems in an electronic programme guide context. Master’s thesis, University of Twente.

Gunawardana, A. and Shani, G. (2009). A survey of accuracy evaluation metrics of recommendation tasks. Journal of Machine Learning Research, 10:2935–2962.

Herlocker, J. L., Konstan, J. A., Terveen, L. G., and Riedl, J. T.(2004). Evaluating collaborative filtering recommender systems. ACM Trans. Inf. Syst.,22(1):5–53.

Lathia, N. (2009). Computing Recommendations with Collaborative Filtering,chapter 2, pages 23–38. IGI Global. Book: Collaborative and Social Information Retrieval and Access: Techniques for Improved User Modeling.

Page 46: Sistemas de recomendación: tipos y evaluación

Referencias imágenes

http://www.flickr.com/photos/ario/54106663/sizes/m/http://www.flickr.com/photos/44760652@N05/4659522355/http://www.flickr.com/photos/51813566@N08/4760804346/http://www.flickr.com/photos/7750017@N02/4267291403/http://www.flickr.com/photos/94698336@N00/292229414/http://www.flickr.com/photos/15086630@N07/4152920543/http://www.flickr.com/photos/splorp/59240233/sizes/l/http://www.flickr.com/photos/44921934@N00/302001867/http://www.flickr.com/photos/79477324@N00/230625187/http://www.flickr.com/photos/26517433@N00/2007012694/http://www.flickr.com/photos/38917708@N00/455000502/http://www.flickr.com/photos/49366539@N00/572481795/http://www.flickr.com/photos/49462908@N00/4411505290/http://www.flickr.com/photos/80639080@N00/1286122845/http://www.flickr.com/photos/32263295@N00/3938238831/http://www.flickr.com/photos/40780016@N02/3914729343/http://www.flickr.com/photos/49408564@N00/91970575/

Page 47: Sistemas de recomendación: tipos y evaluación

Referencias imágenes

http://www.flickr.com/photos/44124426342@N01/151822725/http://www.flickr.com/photos/35034364750@N01/282496846/http://www.flickr.com/photos/10687935@N04/3887516326/http://www.flickr.com/photos/32957828@N00/3737437574/http://www.flickr.com/photos/24431382@N03/4671584999/http://www.flickr.com/photos/35855601@N06/3313477849/http://www.flickr.com/photos/71239936@N00/397653832/http://www.flickr.com/photos/23812016@N05/4998557125/http://www.flickr.com/photos/39332788@N02/4060003777/http://www.flickr.com/photos/41987260@N00/2234941799/http://www.flickr.com/photos/65793011@N00/84894948/http://www.flickr.com/photos/32109282@N00/4504668254/http://www.flickr.com/photos/32109282@N00/4633615801/http://www.flickr.com/photos/71438311@N00/2764675971/http://www.flickr.com/photos/70403129@N00/2492474473/http://www.flickr.com/photos/15087210@N00/997085301/http://www.flickr.com/photos/60364452@N00/264891907/