Post on 14-Feb-2017
¿Quién es un científico de datos?Según Josh Wills: “Una persona que es mejor en estadística que cualquier ingeniero de software y mejor en ingeniería de software que cualquier estadista”.
http://www.kdnuggets.com/2015/11/different-data-science-roles-industry.html
¿Qué es un producto de datos?
• Es la combinación de datos con algoritmos estadísticos usados para inferencia o predicción.
• Podemos citar el sistema de recomendación de Amazon,Uber o Netflix como productos de datos que examinan las preferencias del los usuarios y genera recomendaciones.
Áreas de oportunidad
los productos de datos han revolucionado la economía de la información y ha cambiado la forma en la que los negocios, las Startups de base tecnológica, organizaciones y gobiernos ven los datos
Características de un producto de datos
• Mike Loukides argumenta que un producto de datos es otro nombre para Data-Driven Apps• Auto adaptables• Aprenden patrones de comportamiento• Ampliamente aplicables• Influencia el comportamiento humano
Bajo esta definición el termostato Nest es un producto de datos, vehículos autónomos y aplicaciones de Quantified-Self.
¿Cómo genero innovación con datos?
1. Cosas que sabemos que sabemos: Hechos2. Cosas que sabemos que no sabemos: Preguntas3. Cosas que no sabemos que sabemos: Intuición4. Cosas que no sabemos que no sabemos: Exploración
Datos Crudos
Datos Limpios
Consultas y Reportes
OLAP –Reportes Ad-Hoc
Análisis Estadístico
Modelado Predictivo
Optimización
Ve
nta
ja C
om
pet
itiv
a
Madurez Analítica
¿Qué paso?
¿Por que paso?
¿Qué va a pasar?
¿Que es lo mejorque puede pasar?
¿Qué preguntas que puedo hacer a los datos?
• Numéricos• Categóricos• Espaciales• Temporales• Sociales
• Patrones• Relaciones• Distribuciones• Anomalías
Diferentes usuarios, diferentes datos
Algoritmos
Machine Learning = Aprendizaje por repetición
• Clasificación
• Agrupación
• Predicción
• Simulación
• Optimización