Post on 04-Dec-2014
description
Social Business Intelligence
consulting, s.a.au
torit
as
2
“Cuando eres capaz de ver lo sutil, es fácil ganar”
Sun Tzu
consulting, s.a.au
torit
as
3
“Active Listening: more than just paying attention” Kathryn Robertson
¿Qué es la Escucha Activa?
http://www.youtube.com/watch?v=M6lJWIh1iNQ
Mi Reputación
Mi actividad
Mi Entorno
Mi Inspiración
consulting, s.a.au
torit
as
4
¿Qué es Social Business Intelligence?
http
://hd
wal
l.co/
face
book
-wal
lpap
er-d
igg/
DATOS -> INFORMACIÓN -> CONOCIMIENTO -> INTELIGENCIA
Herramientas ymétodos
Interpretaciónhumana
Aplicaciónestratégica
consulting, s.a.au
torit
as
5
¿Cómo lo hacemos en Autoritas?
consulting, s.a.au
torit
as
6
TOMA DE DECISIONES
ESTRATEGIA
RECUPERACIÓN DE INFORMACIÓN
FILTRADO, LIMPIEZAY ELIMINACIÓN DE RUIDO
EXTRACCIÓN DECONOCIMIENTO
InteligenciaSocial
Negocio
Ciclo de la Inteligencia Social de Negocio
consulting, s.a.au
torit
as
7CRISP-DM
consulting, s.a.au
torit
as
8
TOMA DE DECISIONES
ESTRATEGIA
RECUPERACIÓN DE INFORMACIÓN
FILTRADO, LIMPIEZAY ELIMINACIÓN DE RUIDO
EXTRACCIÓN DECONOCIMIENTO
InteligenciaSocial
Negocio
Piensa, piensa, piensa......pues el pensamiento
precede a la acción
consulting, s.a.au
torit
as
9
Mi Entorno
¿Qué esperas de Internet / Redes Sociales para tus
objetivos de negocio?
consulting, s.a.au
torit
as
10
Mi Entorno
¿Dónde está tu ROI?
consulting, s.a.au
torit
as
11
Atrapar al malo
Investigación policial
¡Estos lo tienen muy claro!
consulting, s.a.au
torit
as
12
Predecir la demanda
Empresa turística
consulting, s.a.au
torit
as
13
Medir la reputación en el cálculo de riesgos
Compañías aseguradoras
consulting, s.a.au
torit
as
14
Internet como fuente de información
Agencias de estudios de mercado
consulting, s.a.au
torit
as
15
Organismos gubernamentales
Gobiernoabierto
Participación
Colaboración Transparencia
Escu
cha A
ctiva
consulting, s.a.au
torit
as
16
Atención al cliente
Compañías telefónicas
consulting, s.a.au
torit
as
17
Generación de contenidos
Medición de audiencias
Medios de comunicación
consulting, s.a.au
torit
as
18
¿Y el tuyo?Piensa, piensa, piensa...
consulting, s.a.au
torit
as
19
consulting, s.a.au
torit
as
20
Por ejemplo, el entorno de Coca Cola...
consulting, s.a.au
torit
as
21
TOMA DE DECISIONES
ESTRATEGIA
RECUPERACIÓN DE INFORMACIÓN
FILTRADO, LIMPIEZAY ELIMINACIÓN DE RUIDO
EXTRACCIÓN DECONOCIMIENTO
InteligenciaSocial
Negocio
“La verdad está ahí fuera”Expediente X
consulting, s.a.au
torit
as
22
ORDENLA SOLUCIÓN
ES EL BIG DATA
¡Todo el mundo lo dice!
consulting, s.a.au
torit
as
23
ORDEN
consulting, s.a.au
torit
as
24
OBJETIVO: Recuperar todo lo que hay que recuperar y sin recuperar nada que no
se deba recuperar
consulting, s.a.au
torit
as
25
Orígenes de información (canales)
consulting, s.a.au
torit
as
26
Mapeo concepto-búsqueda
Conceptos de inteligencia
Claves de búsqueda por
canal
1 N
Marcas
Personas
Productos
Campañas
Competencia
Referentes
CríticosTemas
Países
consulting, s.a.au
torit
as
27
Mapeo concepto-búsqueda
Conceptos de inteligencia
Claves de búsqueda por
canal
1 N
Un ejemplo real: televisión española
5 denominaciones10 personajes10 programas10 campañas
6.856 claves de búsqueda
8 canales
consulting, s.a.au
torit
as
28
API vs. Crawler
‣API restringe el acceso a los datos: Facilitan sólo una muestra de la información existente y accesible a través de buscador‣API restringe la cantidad de peticiones realizables‣Crawler requiere infraestructura y solución a problemas IR (periodicidad, fechas, idiomas, almacenamiento...)‣Crawler puede generar problemas legales
API gratuita vs. pago
‣Restricción de resultados: las APIs gratuítas restringen en exceso los resultados frente a la interfaz del buscador‣Limitaciones de licencia de las APIs gratuítas, no permitiendo por ejemplo la reordenación, mezclado y almacenamiento de datos
consulting, s.a.au
torit
as
29
Arquitectura general de un buscador
consulting, s.a.au
torit
as
30
Arquitectura general de un buscador
Volumen- 50K medios- 2.5M blogs- 40K foros- 22K webs
consulting, s.a.au
torit
as
31
Arquitectura general de un buscador
Volumen- 50K medios- 2.5M blogs- 40K foros- 22K webs
Velocidad- PeriodicidadVariedad- Fecha publicación- Contenido útil- Idioma...Valor- Etiquetado- Dim. geográfico- Personajes públicos...
consulting, s.a.au
torit
as
32
ORDEN
Si la fecha va en la url es fácil saberla
Eso es relativo, esta URL es de Julio o de
Enero:http://xxx/07/01/2010/
crawler-403-forbidden.html
Ejemplo de Variedad
consulting, s.a.au
torit
as
33
TOMA DE DECISIONES
ESTRATEGIA
RECUPERACIÓN DE INFORMACIÓN
FILTRADO, LIMPIEZAY ELIMINACIÓN DE RUIDO
EXTRACCIÓN DECONOCIMIENTO
InteligenciaSocial
Negocio
información = datos - ruido
consulting, s.a.au
torit
as
34
¿Por qué hay ruido?
Los usuarios mienten, plagian o no dicen demasiadas cosas útiles...
consulting, s.a.au
torit
as
35
¿Y si no mienten, copian ni dicen poco?
encontrabilidad relevancia
consulting, s.a.au
torit
as
36
Sección de anuncios sin
relevancia para el contenido
Sección de última hora que
distorsiona la semántica de la
página
Contenido útil
Recuperar contenido útil
consulting, s.a.au
torit
as
37
Inglésestoy sin internet ¬¨¬¨ fuuuuck!!!
Finlandés... euskocaja, como euskolabel, euskotren, euskomueble... XDDD
PortuguésFlowah Powah!
AlemánVierrrrrrrrrrrrnes, egunon!!
Modelos del lenguaje vs. n-Gramms vs. Machine Learning
Filtrar por idioma
consulting, s.a.au
torit
as
38
Geografía de origen vs. geografía de contenido vs. geografía de perfil
Filtrar por geografía
consulting, s.a.au
torit
as
39
resultados
elimina url prescindibles
filtra palabras
marca url’s como SpamElimina url’s
Quita de la ‘vista’ los antitesauros
filtra #hastags
filtra influenciadores
filtra localizaciones
“Limpia, fija y da explendor”Lema de la RAE80
% d
el
trab
ajo
consulting, s.a.au
torit
as
40
El mito del todo gratis
producciónProductividad = ----------------------- horas x persona
Coste = persona x horas x precio_hora + precio_herramienta
[1]
[2]
Satisfacción = Percepción - Expectativas[3]
consulting, s.a.au
torit
as
41
Creo que he resuelto el:
consulting, s.a.au
torit
as
42
Evaluación de la Recuperación de Información...
...en la ciencia
- ¿Quieres que todo lo que recuperes sea bueno? -> Precisión
- ¿No quieres dejar de recuperar nada? -> Alcance
consulting, s.a.au
torit
as
43
7.000 recuperados 54 incorrectos 99.23% precisión
3.000 recuperados50 no recuperados
98.36% alcance
Evaluación de la Recuperación de Información...
...en la vida real
¡¡Estamos perdiendo
credibilidad!!
consulting, s.a.au
torit
as
44
Ejemplo
BÚSQUEDAS: Mallorca, Menorca, Ibiza, Formentera, Baleares, ...
MÉTODO: 1.200 tuis aleatorios / 3 anotadores
30%
70%
EtiquetadosNo Etiquetados
0
25
50
75
100
Perfil Detector Combinado
94%
82%85%79%
87%85%
66%57%59%
% AciertosPrecisiónAlcance
Proyecto de turismo con 4.575.096 tuits
1.372.528
3.202.567
1.8
89
.51
4
1.8
25
.46
3
2.1
13
.69
4
672.539 recuperados erróneamente204.419 válidos no recuperados1.372.528 que no se sabe
consulting, s.a.au
torit
as
45
ORDEN
DATOS -> INFORMACIÓN -> CONOCIMIENTO -> INTELIGENCIA
Herramientas ymétodos
Interpretaciónhumana
Aplicaciónestratégica
consulting, s.a.au
torit
as
464
TOMA DE DECISIONES
ESTRATEGIA
RECUPERACIÓN DE INFORMACIÓN
FILTRADO, LIMPIEZAY ELIMINACIÓN DE RUIDO
EXTRACCIÓN DECONOCIMIENTO
InteligenciaSocial
NegocioOrdenar la información...
...para analizarla, cruzarla y sacarle valor
consulting, s.a.au
torit
as
47
Las dimensiones del orden...
consulting, s.a.au
torit
as
48
...para responder preguntas...
...y saber qué nuevas preguntas plantear
consulting, s.a.au
torit
as
49
E.g. ¿De QUÉ se está hablando?
VolumenVelocidadVariedadValor
consulting, s.a.au
torit
as
50
¿Cuándo? -> E.g. Gestión de crisis
¿Cuándo suceden las cosas?
VolumenVelocidadVariedadValor
consulting, s.a.au
torit
as
51
¿Cuándo? -> E.g. Gestión de crisis
¿Cuándo suceden las cosas?
¡En tiem
po rea
l!
Y reco
rdad e
l asunt
o de la
s fecha
s...
VolumenVelocidadVariedadValor
consulting, s.a.au
torit
as
52
¿DÓNDE/DE DÓNDE se está hablando?
VolumenVelocidadVariedadValor
consulting, s.a.au
torit
as
53
¿DÓNDE/DE DÓNDE se está hablando?
¡¡Aprox. el
2% georefe
rencia
sus con
tenidos
!!
VolumenVelocidadVariedadValor
consulting, s.a.au
torit
as
54
ORDEN¿Cómo? -> No sólo sentiment analysis
La polaridad es sólo una dimensión, la emocional, la de valores, DAFO... todas ellas responden a la cuestión ¿cómo?
VolumenVelocidadVariedadValor
consulting, s.a.au
torit
as
55
ORDEN
Un ejemplo: “La prima de riesgo en España está a 235”¿Positivo, negativo, neutro o none?
consulting, s.a.au
torit
as
56
ORDEN
Un ejemplo: “La prima de riesgo en España está a 235”¿Positivo, negativo, neutro o none?
Mi pregunta: ¿Para quién?- ¿Para el presidente del país?- ¿Para el líder de la oposición?- ¿Para el director del Banco de España?- ¿Para el inversor extranjero?- ¿Para el capitalista nacional?- ¿Para el que tiene una hipoteca?
consulting, s.a.au
torit
as
57
ORDEN
Un ejemplo: “La prima de riesgo en España está a 235”¿Positivo, negativo, neutro o none?
Mi pregunta: ¿Para quién?- ¿Para el presidente del país?- ¿Para el líder de la oposición?- ¿Para el director del Banco de España?- ¿Para el inversor extranjero?- ¿Para el capitalista nacional?- ¿Para el que tiene una hipoteca?
¡¡Subjet
ividad
en em
isor y
receptor!
!
consulting, s.a.au
torit
as
58
ORDEN¿Quién? -> Análisis de Red Social
Si quiero transmitir con éxito un mensaje, ¿quién me puede ayudar?
Si hay un conflicto,¿a quién tengo que vigilar?
VolumenVelocidadVariedadValor
consulting, s.a.au
torit
as
59
ORDEN¿Por qué? -> Author Profiling
EMOTIONAL PROFILE
GENDERAGE GROUP
NATIVE LANGUAGE
... ¡y mucho mucho más!
VolumenVelocidadVariedadValor
consulting, s.a.au
torit
as
60
ORDEN¿Por qué? -> Author Profiling
EMOTIONAL PROFILE
GENDERAGE GROUP
NATIVE LANGUAGE
... ¡y mucho mucho más!
Lo vere
mos en Te
xt Minin
g II
VolumenVelocidadVariedadValor
consulting, s.a.au
torit
as
61
El Big Data es la solución, el problema...y la oportunidad
80~120 tuits/segundo
=4.800~7.200tuits/minuto
=288.000~432.000 tuits/hora
=6.912.000~10.368.000 tuits/día
‣Recuperar y almacenar‣Evolución‣Palabras y temas‣Etiquetado‣Hashtags‣Personas‣Localizaciones‣Marcas‣Tono, emoción‣Usuario, relaciones‣Influencia‣Sexo y edad‣Perfil autor‣...
http
://ow
.ly/C
kzH
c
consulting, s.a.au
torit
as
62
Precisión vs. coste computacional
0
375000
750000
1125000
1500000
Approach 1 Approach 4 Approach 7 Approach 10 Approach 13 Approach 16 Approach 19
10.2
6 m
inut
es28
.83
min
utes
38.3
1 m
inut
es54
.03
min
utes
1.04
hou
rs1.
09 h
ours
2.66
hou
rs3.
25 h
ours
4.66
hou
rs4.
86 h
ours
5.08
hou
rs5.
13 h
ours
6.37
hou
rs6.
56 h
ours
6.82
hou
rs17
.88
hour
s4.
44 d
ays
5.19
day
s6.
68 d
ays
9.90
day
s11
.78
days
0
10
20
30
40
Approach 1 Approach 4 Approach 7 Approach 10 Approach 13 Approach 16 Approach 19
29.06
34.72
39.86
24.20
28.34 27.98
35.06
25.1427.03
38.58
31.25 32.34
7.87
24.6522.87
27.03
32.22
24.67
33.04
15.40
19.82
%
IDENTIFICACIÓN DE EDAD Y GENERO EN ~240K AUTORES
consulting, s.a.au
torit
as
63
ORDEN
DATOS -> INFORMACIÓN -> CONOCIMIENTO -> INTELIGENCIA
Herramientas ymétodos
Interpretaciónhumana
Aplicaciónestratégica
TOMA DE DECISIONES
consulting, s.a.au
torit
as
64
OPORTUNIDADES
BIG DATA - SBI
Aprendizaje Automático: Para
inferir nuevos modelos a partir de los datos
existentes, para dotar de inteligencia a nuestras
aplicaciones
Recuperación de Información: Para
acceder a las enormes cantidades de
información disponibles en Internet
Data Mining: Para identificar patrones válidos, novedosos,
potencialmente útiles y deseablemente
comprensibles a partir de los datos
Natural Language Processing: Porque el contenido textual de la Web está escrito en el
lenguaje humano
Data Visualization
Collective Intelligence
System Architecture
User eXperience
Social Investigation
Social Network Analysis
SOMOS UN EQUIPO
MULTIDISCIPLINARDE
PROFESIONALES
NÓMADAS QUE
ADAPTAMOS
SOLUCIONES
GLOBALES A
ENTORNOS
LOCALES
AUTORITAS
Argentina - Brasil - Chile - España - México - Panamá - UK