B&SConsulting Analytics
-
Upload
dany-davan -
Category
Documents
-
view
12 -
download
2
Transcript of B&SConsulting Analytics
Construyendo soluciones analíticas para su
empresa Jorge Rodríguez M.
942150982 / RPM: #0025095
Contenido
1. Situación actual
2. Data Mining
3. Metodología
4. Aplicaciones
5. Anexos
Situación actual
¿Cómo se hace esto?
¿Se siente así?
El fin del cliente como medio
El comienzo del cliente con poder
Evolución de una estrategia centrada en el cliente
Tendencias y perturbaciones en el análisis predictivo
Contenido
1. Situación actual
2. Data Mining
3. Metodología
4. Aplicaciones
5. Anexos
Data Mining - ¿Por qué se necesita?
Contribuye a las decisiones tácticas
y estratégicas
Permite a los usuarios dar prioridad a
decisiones y acciones
Proporciona poderes de
decisión a los usuarios del
negocio
Ahorra grandes cantidades de dinero a una
empresa y abre nuevas
oportunidades de negocio
Resulta un buen punto de encuentro
entre los investigadores y las
personas de negocio
Permite que relaciones no descubiertas e
identificadas sean expresadas como
reglas de negocio o modelos
predictivos
Permite explorar, visualizar y
comprender los datos e identificar
patrones, relaciones y
dependencias que impactan en los
resultados finales de la cuenta de
resultados
Es tiempo de análisis…
“El que no aplique nuevos remedios debe esperar
nuevos males, porque el tiempo es el máximo
innovador.”
Sir Francis Bacon
Valor del Data Mining
Data Mining – Plataforma Analítica
Objetivos de Negocios
Plataforma Integral de Apoyo a la Toma de Decisiones
Incrementa
r
Base de
Clientes
ETL Data Stage
Oracle
Extracción
Transformación
Carga
Datos
Tangible a
Tecnología
Tangible al
Negocio Técnicas
Analíticas
Manejo y
Optimización
de Campañas
Retención
Análisis y
Optimización
de Canales
Incrementa
r
Avg. Ticket
Cliente
Valioso
Reducción
de Costos de
Campañas
Incrementa
r
Lealtad
BI BO
Micro Strategy
QlikView
Estructura
Presentación
Distribución
Información
Analytics SAS Miner
IBM SPSS
Rapid Miner
Optimización
Pronósticos
Análisis estadístico
Conocimiento
Cada solución cubre las expectativas
Segmentación
Perfil y Valor
Cross Sell y
Up Sell
Data Mining – Software
Data Mining – Open Source
Orange es una suite de software para minería de base de datos y aprendizaje automático basado en componentes que cuenta con un fácil y potente, rápido y versátil front-end de programación visual para el análisis exploratorio de datos y visualización, y librerias para Python y secuencias de comando. Contiene un completo juego de componentes para preprocesamiento de datos, característica de puntuación y filtrado, modelado, evaluación del modelo, y técnicas de exploración. Está escrito en C++ y Python, y su interfaz gráfica de usuario se basa en la plataforma cruzada del framework Qt.
RapidMiner, antes llamado YALE (Sin embargo, otro ambiente de aprendizaje), es un ambiente de experimentos en aprendizaje automático y minería de datos que se utiliza para tareas de minería de datos tanto en investigación como en el mundo real. Permite a los experimentos componerse de un gran número de operadores anidables arbitrariamente, que se detallan en archivos XML y se hacen con la interfaz gráfica de usuario de RapidMiner. RapidMiner ofrece más de 500 operadores para todos los principales procedimientos de máquina de aprendizaje, y también combina esquemas de aprendizaje y evaluadores de atributos del entorno de aprendizaje Weka. Está disponible como una herramienta stand-alone para el análisis de datos y como motor para minería de datos que puede integrarse en tus propios productos.
Escrito en Java, Weka (Entorno Waikato para el Análisis del Conocimiento) es una conocida suite de software para máquinas de aprendizaje que soporta varias tareas típicas de minería de datos, especialmente pre procesamiento de datos, agrupamiento, clasificación, regresión, visualización y características de selección. Sus técnicas se basan en la hipótesis de que los datos están disponibles en un único archivo plano o relación, donde cada punto marcado es etiquetado por un número fijo de atributos. WEKA proporciona acceso a bases de datos SQL utilizando conectividad de bases de datos Java y puede procesar el resultado devuelto como una consulta de base de datos. Su interfaz de usuario principal es el Explorer, pero la misma funcionalidad puede ser accedida desde la línea de comandos o a través de la interfaz de flujo de conocimientos basada en componentes.
Diseñado para los científicos, ingenieros y estudiantes, jHepWork es un framework para análisis de datos libre y de código abierto que fue creado como un intento de hacer un entorno de análisis de datos usando paquetes de código abierto con una interfaz de usuario comprensible y para crear una herramienta competitiva a los programas comerciales. Esto se hace especialmente para las ploteos científicos interactivos en 2D y 3D y contiene bibliotecas científicas numéricas implementadas en Java para funciones matemáticas, números aleatorios, y otros algoritmos de minería de datos. jHepWork se basa en Jython un lenguaje de programación de alto nivel, pero codificación en Java también puede ser usada para llamar librerías jHepWork numéricas y gráficas.
KNIME (Konstanz Information Miner) es una plataforma de código abierto de fácil uso y comprensible para integración de datos, procesamiento, análisis, y exploración. Ofrece a los usuarios la capacidad de crear de forma visual flujos o tuberías de datos, ejecutar selectivamente algunos o todos los pasos de análisis, y luego estudiar los resultados, modelos y vistas interactivas. KNIME está escrito en Java y está basado en Eclipse y hace uso de sus métodos de extensión para soportar plugins proporcionando así una funcionalidad adicional. A través de plugins, los usuarios pueden añadir módulos de texto, imagen, procesamiento de series de tiempo y la integración de varios proyectos de código abierto, tales como el lenguaje de programación R, WEKA, el kit de desarrollo de Química y LIBSVM.
Contenido
1. Situación actual
2. Data Mining
3. Metodología
4. Aplicaciones
5. Anexos
Data Mining – Metodología CRISP-DM
Conocimiento del negocio
Conocimiento de la información
Preparación de los datos
Modelamiento
Evaluación
Despliegue
Ciclo de vida del cliente
¿Qué datos analizar?
Contenido
1. Situación actual
2. Data Mining
3. Metodología
4. Aplicaciones
5. Anexos
Data Mining - Aplicaciones
Segmentación
Clientes
Ventas
Cruzadas
Optimización
Campañas
Detección y
Prevención
Fraudes
Pérdida
Esperada
Predicción
Portafolio
Inteligencia
Comercial
Cliente
Preferente Modelos
Retención
Clientes
Series de
Tiempo
Inteligencia
Operacional
Inteligencia
Riesgos
Inteligencia
Financiera Lavado de
Dinero
Análisis
Competencia
Análisis
Flujos de
Caja
Simulación de
Inversiones
Pronósticos de
Demanda
Agencia
Operativa
Cobranza
Temprana
Scoring de
Cobranzas
Cobranza
Media-Tardía
Análisis
Desempeño
Ciclo de
Vida
Predictores de
Riesgo
Adquisición rentable
Desarrollo de relaciones
Gestión de la retención del cliente
Segmentación y estrategias de recobro
Segmentación de clientes
Contenido
1. Situación actual
2. Data Mining
3. Metodología
4. Aplicaciones
5. Anexos
Modelo de maduración del BI
Prenatal:
Reportes creados
por IT.
manualmente.
Esfuerzo en la
obtención de
datos.
Incentiva a la
generación de
planillas en Excel.
Infancia:
Spreadmarts creados
por analistas de
negocios.
Visión fragmentada:
falta de integridad,
nomenclatura,
distintas reglas de
negocio.
Ventaja para el
usuario final: fácil
creación, comodidad,
control de los datos.
Etapa Crítica: El Golfo
Etapa crítica donde esta la mayoría de
las organizaciones.
Múltiples y fragmentadas visiones
como resultado de distintas fuentes de
datos.
Falta de control en la calidad de datos.
Falta de adopción por parte de los
usuarios.
Niñez:
Se reconoce la
necesidad de
centralizar la
información y
distribuirla de manera
periódica.
Se desarrollan
repositorios con
distintos fines
(reporting, analíticos).
Los analistas tienen
herramientas que le
permiten solamente
analizar y
comprender
información para los
procesos que
gestionan.
Adolescencia:
Unificación de
criterios a nivel del
negocio.
Creación de un
repositorio de datos a
nivel de la empresa
(Data Warehouse)
Reporting más
complejo:
dashboards, análisis
de campañas,
métricas integradas.
Se puede acceder a
información de toda
la organización.
Adultez:
Integración de
proyectos de BI en un
único Enterprise Data
Warehouse.
Construcción de la
visión única del
negocio.
Procesos de BI
críticos como los
procesos
transaccionales.
Aparición de nuevos
e inesperados usos
de los sistemas de
explotación.
Sabiduría:
Provisión de servicios
de inteligencia en
nichos antes
impensados.
Servicios de
información analítica
para clientes finales.
Motores de inferencia
online, web mining.
Etapa Crítica: El Abismo
Pérdida de flexibilidad.
Volumen inmanejable de reportes,
malas prácticas de auto-service.
Propiedad. Peligro de retorno al
manejo de información por silos.
Percepción sobredimensionada de
tareas de integración de datos, pocos
medios de explotación.
Para pasar esta etapa…
Lograr cambiar la visión que tiene la
organización respecto de la solución
de BI, dejando de pensar que es sólo
una herramienta de reporting.
Eliminar los spreadmarts.
Definir claramente las
responsabilidades de entrega de datos
y servicios ofrecidos.
Para pasar esta etapa:
Análisis de uso, eliminación de lo inútil,
reportes parametrizables.
Análisis de necesidades según perfiles
de usuarios.
Adoptar BI como un recurso crítico,
parte del negocio y no un servicio más
de IT.
Enlaces importantes
1. http://rapid-i.com/
2. http://orange.biolab.si/
3. http://www.knime.org/
4. http://www.cs.waikato.ac.nz/ml/weka/
5. http://jwork.org/jhepwork/
6. http://voyagememoirs.com/pharmine/2008/05/18/summary/
7. http://www.kdnuggets.com/polls/2010/data-mining-analytics-tools.html
8. http://www.springerlink.com/content/b7437372g47wh517/
9. http://blog.samibadawi.com/2010/04/r-rapidminer-statistica-ssas-or-
weka.html
“El requisito del éxito es la prontitud en las decisiones”
Sir Francis Bacon