Post on 09-Jul-2016
description
EIN945-Inteligencia de Negocios
Unidad Nº 1: Introducción a la Inteligencia de NegociosClase Nº01: Introducción
Presentación Profesor
Gabriel Vergara Butrón
MBA (Magíster en Gestión y Dirección de Empresas)
Ingeniero Civil Industrial
Coordenadas:
Móvil: 56-9-97487207E-mail: gavergar22@gmail.com
Programa del Curso
Teórico-Estratégico
Programa del Curso
Práctico
Evaluaciones
• Cátedra I = 30% (80% teórico, 20% práctico)
• Cátedra II = 30% (Actividades y Controles de Lectura)
• Examen = 40%
Características:
• Sin eximición.
Agenda
• La motivación del problema
• ¿Qué es el Business Intelligence?
• El Proceso KDD
• Las aplicaciones de Data Mining
• Data Warehouse
• Principales Modelos de Data Mining
• Algunas Aplicaciones
A cerca de Leyes, Monstruos y Gigantes
• Ley de Moore: “La capacidad de procesamiento se duplica cada 18 meses”
• Su primo más agresivo: “La capacidad de almacenamiento se duplica cada9 meses”
• La brecha entre capacidad de procesar y lo que almacenamos, aumentacon el tiempo.
0
1,000,000
2,000,000
3,000,000
4,000,000
5,000,000
6,000,000
7,000,000
1988 1990 1992 1994
Disk
Processing
0
1,000,000
2,000,000
3,000,000
4,000,000
5,000,000
6,000,000
7,000,000
1988 1990 1992 1994
Disk
Processing
0
1,000,000
2,000,000
3,000,000
4,000,000
5,000,000
6,000,000
7,000,000
1988 1990 1992 1994
Disk
Processing
A cerca de Leyes, Monstruos y Gigantes
• La librería del US Congress tiene 10 Teras de texto
• Fuentes multimedia: video, audio almacenan menos de 3 Petas.– Gigabyte (109) viene del latín Gigas, para “gigante”
– Terabyte (1012) viene del griego Teras para Monstruo (terabytes: terror bytes)
– Vienen otros como: Peta, Exa, Zetta, etc
• Trabajar con estos “monstruos” es cosa sería.
• El año 2000 se analizó que el 11% de todo el conocimiento humano se generó durante 1999.
“La necesidad es la madre de la invención”
• Problema de Explosión de Datos:
– Sistema automáticos de captura de información,
madurez en la tecnología de bases de datos e Internet
llevan a importantes cantidades de datos almacenados
en las bases de datos, data warehouses y otros
repositorios de información.
• Enfoque competitivo.
• Bajo costo de computadores.
• Fuertes bases teóricas/Data matemáticas.
Nos ahogamos en información, pero estamos
hambrientos por conocimiento!
Yo manejo un supermercado (restaurant, tienda de videos o libros) y mi
registro de cajas (o website) almacena transacciones en la Base de Datos.
• Puede ayudarme a visualizar las ventas?
• Puede generar perfiles de clientes?
• Dónde estoy ganando o perdiendo plata?
• Cómo los usuarios visitan mi website?
• Dígame algún patrón interesante
Yo no sé nada de Estadística ni Data Mining, tampoco tengo estadísticos ni
analistas dedicados!!!
Pero ya tengo la Base de Datos…
• Muchos análisis de consultas interesantes son difíciles de precisar
• Por ejemplo:– Qué registros son transacciones fraudulentas?
– Cuáles clientes son más probables de elegir una Ford sobre una Toyota?
– Quiénes son buenos clientes en términos de riesgo en mi base de datos?
• La base de Datos contiene información – bueno/mal cliente, rentabilidad
– respondió/no respondió la encuesta
Business Intelligence y Bases de Datos
• Aumento explosivo de bases de datos.
• Los datos parecen siempre crecer y llenar el
repositorio:
– Alta dimensionalidad
– Gran número de registros
– Nuevas Fuentes
• Las herramientas de análisis actuales no soportan
los nuevos requerimientos y escalas.
• El usuario final no es un estadístico.
¿Por qué Business Intelligence?
Acceso a Datos
• Buscar algunos registros
• Reportes estándarSQL
SQL/OLAP
• Optimizar Procesos de Negocios
• Ubicar un problema/ entender algo
nuevo
• Responder una pregunta difícil
BI
Definición de Business Intelligence
• “Business intelligence es el proceso de extracción de datosdesde una BD y luego el análisis de esos datos para extraerinformación susceptible de usar para tomar decisiones yacciones de negocios informadas”.
• Preguntas a responder por aplicaciones de BusinessIntelligence:
– ¿Como comparar las ventas totales de todos los productos del2013, con las ventas totales del 2012?
– ¿Cómo está la rentabilidad a la fecha comparado con igual períododurante los últimos cinco años?
– ¿Cuánto gastaron nuestros clientes sobre 35 años durante elúltimo año, y como su comportamiento ha evolucionado en eltiempo?
Definición de Business Intelligence (2)
• Business intelligence (BI): es una amplia categoría de
aplicaciones y tecnologías para extraer, almacenar,
analizar y entregar acceso a datos que ayuden a los
usuarios de negocio, en la toma de decisiones.
Aplicaciones BI applications incluyen trabajos en
decision support systems (DSS), consultas y reportes,
online analytical processing (OLAP), análisis
estadístico, pronóstico y Data Mining.
Definición de Business Intelligence (3)
Se refiere a los procesos mediante los cuales las
organizaciones reúnen datos y analizan para
poder tomar decisiones centradas en su
estrategia y modelo de negocio
La capacidad de comprender las interrelaciones de los hechos presentados en tal forma como
para orientar la acción hacia una meta deseada
* Hans Peter Luhn (1958)
Inteligencia de Negocios
• Se dice que ha evolucionado desde los sistemas de apoyo a las decisiones, DSSUn Sistema de Soporte a la Decisión (DSS) es una herramienta de Business Intelligence enfocada al análisis de los datos de una organización.En principio, puede parecer que el análisis de datos es un proceso sencillo, y fácil de conseguir mediante una aplicación hecha a medida o un ERP sofisticado. Sin embargo, no es así: estas aplicaciones suelen disponer de una serie de informes predefinidos en los que presentan la información de manera estática, pero no permiten profundizar en los datos, navegar entre ellos, manejarlos desde distintas perspectivas... etc.
• Los datos son la fuente principal para realizar el análisis detrás de este concepto
• Se busca ir más allá en la presentación de la información, de manera que los usuarios tengan acceso a herramientas de análisis
Inteligencia de Negocios
Inteligencia de Negocios
Datos• Datos Clientes• Datos Tiendas• Datos Demográficos• Datos Geográficos
Información• X vive en Z• S tiene Y años• X y S se cambiaron• W tiene dinero en Z
Conocimiento• Una cantidad Y del producto A es usada en la región Z• Clientes de la clase P usan x% de producto C en el periodo D
Decisiones• Promocione el producto A en la región Z• Mailing a familias del perfil P• Venta cruzada del servicio B a clientes C
Inteligencia de Negocios
Data Warehouse Data Mart
Data Mining
MarketingCliente
• Datos Superficiales• Datos SuperficialesSe extraen con consultas tipo
SQL
• Datos Multi-Dimensionales • Datos Multi-Dimensionales Se extraen con
OLAP
• Datos Escondidos• Datos EscondidosSe extraen con procesos
KDD
• Datos Profundos• Datos ProfundosSe extraen con uso de la
Intuición
Inteligencia de Negocios
Datos en la WebSe extraen con Web Mining
* Basado en Clase de Patricio Wolff (2012), MBE, U. de Chile.
AnalíticaSe utilizan técnicas de
Investigación Operativa
Gráficamente
�Empresas y Organizaciones tienen
gran cantidad de datos almacenados.
�Los datos disponibles contienen
información importante.
�La información está escondida en los datos.
�BI puede encontrar información
nueva y potencialmente útil en los datos
¿Qué es Business Intelligence?
Business Intelligence involucra muchos términos
• Data Warehouse
• OLAP
• Data Mining
• Knowledge Discovery in Databases (KDD)
• Customer Relationship Management
• Database Marketing
• Balance Scorecard
¿Qué es Data Mining?
Proceso para encontrar estructura interesante en
los datos
– Estructura se refiere a patrones, modelos predictivos,
relaciones ocultas, interesantes o susceptibles de
generar margen para la empresa
• Ejemplos de tareas realizadas por Data Mining
– Modelos Predictivos (Clasificación y Regresión)
– Segmentación (Clustering)
– Afinidad de Datos (Summarization)• relaciones entre campos, asociaciones, visualización de datos
Data Mining
2.Selección y Preprocesamiento
4.Interpretación y Evaluación
Knowledge
p(x)=0.02
Warehouse
Patrones y Modelos
Datos preparados
Datos Consolidados
3.Data Mining
1.Consolidaciónde los Datos
Conocimiento
p(x)=0.02
DW
2.Selección y Preprocesamiento
4.Interpretación y Evaluación
Knowledge
p(x)=0.02
Warehouse
Patrones y Modelos
Datos preparados
Datos Consolidados
3.Data Mining
1.Consolidaciónde los Datos
Conocimiento
p(x)=0.02
DW
6. Apoyo a la Toma de Decisiones
5. Visualizacióndel conocimiento
6. Apoyo a la Toma de Decisiones
5. Visualizacióndel conocimiento
Herramientas para Data Mining
• Redes Neuronales:
– MLP
– Mapas autoorganizativos
• Árboles de Decisión:
– CART
– ID3, C4.5
– CHAID
• Regresiones: logit, probit
• Reglas de Asociación
• Lógica Difusa
� Customer Relationship Management
Segmentación de clientes
Database Marketing
Predicción de compra
Retención de clientes
Predicción de fuga
� Detección de Fraude
Tarjetas de crédito
Uso de teléfonos (celulares)
� Predicción de series de tiempo
Más Aplicaciones
• Marketing y Ventas: Identificar potenciales clientes; establecer la
efectividad de las campañas de marketing.
• Análisis de Procesos de Manufactura: Identificar las causas de
problemas de manufactura.
• Entendiendo comportamiento de Consumidores: modelos de
retención de clientes, afinidades, clustering.
• Detección de Fraudes: Identificar transacciones fraudulentas.
Aplicaciones de Negocio
• Aprobar Créditos: Establecer Credit Scoring para un cliente a la hora
de pedir un préstamo.
• Gestión de Portfolio: optimizar un portfolio de instrumentos
financieros maximizando el retorno o minimizando el riesgo
• Análisis de websites: modelar preferencias de usuarios desde logs,
filtros colaborativos, caminos preferidos, etc.
Aplicaciones de Negocio
Evolución en distintas industrias
Razones iniciales:
En telecomunicación:En telecomunicación:En telecomunicación:En telecomunicación:
Facturación de llamadas
Potenciales:
En telecomunicaciónEn telecomunicaciónEn telecomunicaciónEn telecomunicación::::
Detección de fraude
En supermercados:En supermercados:En supermercados:En supermercados:
Gestión del inventario
En bancos:En bancos:En bancos:En bancos:
Manejo de cuentas
En supermercados:En supermercados:En supermercados:En supermercados:
Asociación de ventas
En bancos:En bancos:En bancos:En bancos:
Segmentación de clientes
En empresas de producción:En empresas de producción:En empresas de producción:En empresas de producción:
Control de procesos
En empresas de producciónEn empresas de producciónEn empresas de producciónEn empresas de producción: : : :
Mantención preventivo
Estrategia yMarketing
Base de Datos de
Marketing
DataWarehousing
KDD &Data Mining
Aumente el conocimiento sobre las decisiones
Ej: impacto sobre el marketing
Para qué es útil el Data Mining
Data Mining y CRM
• Aplicaciones descriptivas
– Segmentación de clientes
– Análisis de afinidad
• Aplicaciones Predictivas
– Recomendación de productos
– Modelos de scoring
Se optimiza cuando se usan de forma combinanda
Lealtad de clientes
Análisis de procesos
Adquisición de clientes
Detección
de fraude
Business
ChallengesTechnologies
Segmentación
Regresión
Logistica
Genetic
Algorithms
Arboles de
decisión
Chaid
CART
OLAP
Redes
Bayesianas
Redes
Neuronales
Brecha en el Análisis de datos
Desafíos del
NegocioHerramientas
Los Gerentes son incapaces de aplicar el poder de las herramientas de Data
Mining para lograr resultados útiles a sus negocios
Lealtad de clientes
Análisis de procesos
Adquisición de clientes
Detección
de fraude
Business
ChallengesTechnologies
Segmentación
Regresión
Logistica
Genetic
Algorithms
Arboles de
decisión
Chaid
CART
OLAP
Redes
Bayesianas
Redes
Neuronales
Brecha en el análisis de datos
Desafíos del
NegocioHerramientasEspecialistas
Estadísticos
Administradores
y analisitas de DB
Consultores
Data Miners
Los Gerentes son incapaces de aplicar el poder de las herramientas de Data
Mining para lograr resultados útiles a sus negocios
La Cadena de Valor
Datos• Datos Clientes• Datos Tiendas• Datos Demográficos• Datos Geográficos
Información• X vive en Z• S tiene Y anos• X y S se cambiaron• W tiene dinero en Z
Conocimiento• Una cantidad Y del producto A es usada en la región Z• Clientes de la clase P usan x% de producto C en el periodo D
Decisión• Promocione el producto A en la región Z• Mailing a familias del perfil P• Venta cruzada del servicio B a clientes C
Preguntas Claves Para un E-Business
1. ¿Número de nuevos clientesnuevos clientesnuevos clientesnuevos clientes?
2. ¿Cuáles son los caminos de navegación más popularescaminos de navegación más popularescaminos de navegación más popularescaminos de navegación más populares en mi sitio? ¿Son
los caminos diferentes para los clientes nuevos que los de los clientes
frecuentes?
3. ¿Cuáles son las palabras de búsqueda más frecuentespalabras de búsqueda más frecuentespalabras de búsqueda más frecuentespalabras de búsqueda más frecuentes?
4. ¿ Cuántas veces clientes “primerizos” compraronclientes “primerizos” compraronclientes “primerizos” compraronclientes “primerizos” compraron en el sitio ayer?
5. ¿Cuál fue el producto más rentableproducto más rentableproducto más rentableproducto más rentable ayer?
6. ¿Fue alto o bajo el ratio compra/visitaratio compra/visitaratio compra/visitaratio compra/visita comparado con el mismo día de la
semana pasada?
¿Como puedo generar un mejor retorno sobre la inversión y más ingresos para la compañía?
Inteligencia de Negocios
ProductosProductos
Servicios de Búsqueda
La ruta más corta
Reconocimiento (voz,
imagen)
FinancieroFinanciero
Planificación financiera de la cadena de Suministros
Gestión de Riesgos
Gestión de Recursos Humanos
Gestión de Recursos Humanos
Gestión de talentos
Staffing
Red LogísticaRed Logística
Optimización de Inventarios
Planificación de la
Distribución
Localización de plantas y bodegas
Plan de entrega
Producción y manufacturaProducción y manufactura
Programación de la
Producción
Costeo de Producción
Ventas y CRM
Ventas y CRM
Predicción de la demanda
Pricing
Gestión de Incidentes
Predicción de comportamien
to de ventas
Servicios Corporativos
Servicios Corporativos
Gestión de la calidad
Gestión de proyectos
Nuevos proyectos
* Basado en Clase de Patricio Wolff (2012), MBE, U. de Chile.
Ejemplos de Inteligencia de Negocios
Ejemplos de Inteligencia de Negocios
Ejemplos de Inteligencia de Negocios
* Forbes (2004) Proximity and priority: applying a gene expression algorithm to the TSP
Ejemplos de Inteligencia de Negocios
Ejemplos de Inteligencia de Negocios
*Trabelsi (2012) Heuristics and metaheuristics for mixed blocking constraints flowshop scheduling problems
Ejemplos de Inteligencia de Negocios
Ejemplos de Inteligencia de Negocios
* Miranda et al. (2005) Predicción de Fugas de Clientes para una Institución Financiera mediante Support Vector Machines
Implementación de Inteligencia de Negocios
– Módulos del ERP• Ej: SAP Business Warehouse
– Módulos externos añadidos al ERP• Ej: Jaspersoft
– Capa inteligente• Con orientación a Servicios
• Desarrollo a la medida
Plataformas de Inteligencia de Negocios
* Fuente: Gartner (2009)
Inteligencia de Negocios
• Ventajas de la Inteligencia de negocios
– Mejora en la calidad de las decisiones
– Orienta las decisiones a objetivos generales
– Control de Costos
– Profunda y realista visión del negocio
– Permite planificar y programar el trabajo
– Alinea la estrategia al establecer objetivos claros
– Integración de sistemas y áreas
Inteligencia de Negocios
• Desventajas de la Inteligencia de negocios
– La automatización podría no resultar
– No considera la intuición
– Podría resultar un desastre si operaciones y TI no están alineados
– Lo que se necesita podría no estar en los datos que se tienen
– En algunos casos deja explicito el know-how
– Si no se analizan la estrategia y los procesos “core” podría ser un tanque para matar un mosca
Enterprise Mining Process
KDD Process + Objetivos del Negocio + Eficiencia + Comunicación con el usuario de negocio
• Especificación del problema
– Objetivos y metas del negocio
• Levantamiento de Datos
– Casos a elegir
• Calidad de los datos / Limpieza
• Preprocesamiento de Datos
• Data mining
– Impacto del Negocio
• Gestión del Modelo
Agenda
• Inteligencia de Negocios
– Definición
– Niveles
– Procesos que apoya
– Ejemplos
– Implementación de BI
– Ventajas
Inteligencia de Negocios
• Consultas SQL (Structured Query Language)– Lenguaje declarativo de acceso a bases de datos
relacionales
– Permiten efectuar consultas con el fin de recuperar información de forma sencilla
SELECT c.nombre FROM cliente AS c, pedidos AS pWHERE c.id = p.cliente_id
AND p.npedido = 122;
Inteligencia de Negocios
• Las herramientas OLAP (OnLine AnalyticalProcessing)
– Proporcionan un análisis multidimensional de los datos, es decir, permiten resumir y segmentar los datos.
– Utiliza estructuras multidimensionales (o Cubos OLAP) que contienen datos resumidos de grandes Bases de datos
– Adecuadas para el análisis instantáneo de grandes cantidades de datos.
– Producen otros datos
(más agregados, combinados). Tiem
po
Inteligencia de Negocios
• El proceso KDD ( Knowledge Discovery in Databases)
– Identificación de los Objetivos
– Selección de datos
– Preprocesamiento
– Transformación
– Data Mining (descubrir patrones en los datos)
– Interpretación y Evaluación
– Integración al Negocio
Proceso KDD
Inteligencia de Negocios
• Se puede definir el Web mining en tres variantes:
– Minería del contenido de la Web (contenido de las páginas)
– Minería de la estructura de la Web (Estructura de enlaces)
– Minería de los registro de navegación en la Web
– Ha permitido que el comercio electrónico para hacer marketing personalizado
Inteligencia de Negocios
* Basado en Davenport y Harris (2007) Competing on Analytics