CAPÍTULO 04: COMPONENTES DE
BI
Isis Lay 12003204
Carlos Escobar 12003202
Índice Introducción Componentes de BI Fuentes de Información Calidad de datos ETL DWH Data Marts Herramientas de BI OLAP Datamining Visualización Preguntas Conclusión Recomendación Bibliografía
IntroducciónActualmente, gran número de compañías requieren una adecuada toma de decisiones, por lo que la información que se quiere investigar sobre los diferentes elementos de la organización se encuentran en bases de datos u otras fuentes que posee la empresa. Es por ello que nace la necesidad de un esquema de solución de BI.
¿Cuál es la información requerida para gestionar y tomar decisiones?
¿Cuál debe ser el formato y composición de los datos a utilizar?
¿De dónde proceden esos datos y cual es la disponibilidad y periodicidad requerida?
Componentes de BI
Componentes de BI•A
limentan de información el DWH
Fuentes de información
•Extracción, transformación y carga de los datos en el DWH. Los datos se transforman, limpian, filtran y redefinen
ETL
•Almacena los datos logrando su flexibilidad, facilidad de acceso y administración
DWH
•Herramientas de visualización, análisis y navegación
Herramientas
•Cálculos, consultas, planeamiento, pronostico y análisis de escenarios en big data
OLAP
Fuentes de información
ETL
Externas
Operacio-nales
Departa-mentales
Fuentes de información
Sistemas operacionales
Sistemas departamentales
Fuentes externas
ERP
CRM
SCM
Legacy
Previsiones
Presupuestos
Hojas de cálculo
Otros
Estudios de mercado
Índices de la industria
Estadísticas y censos
WWW
Calidad de los datos
Calidad
Precisión
Integridad
CoherenciaTotalidad
Validez
Disponibili-dad
Accesibili-dad
Extracción, transformación y carga (ETL)
•Recuperar los datos físicamente de las fuentes de información. Datos en brutoExtracción
•Corregir errores, eliminar duplicados, completar vacíos.Limpieza
•Estructurar y sumariar los datos en modelos de análisis de las áreas.Transformación
•Validar la consistencia e integrar en distintos modelos de datosIntegración
•Añadir nuevos datos al DWHActualización
Proceso de limpieza de datos
• Identifica y aísla elementos individuales:• Separa nombre completo en nombre, primer
apellido, segundo apellido.
• Corrige valores individuales usando algoritmos• Comprueba dirección y código postal
correspondiente
• Transforma valores en formatos definidos y consistentes.
• Busca y relaciona los registros, corrigiéndolos y estandarizándolos.
• Elimina duplicados.
Depurar
Estandarizar
Relacionar
Corregir
Consolidar • Analiza e identifica relaciones entre registros relacionados y los consolida
Herramientas de ETL
ETL
Diseño gráfico
Gestión de Metadata
ExtracciónTransforma-
ción CargaServicios de transporteAdministra-ción
y operación
Datawarehouse (DWH)
Hugh J. Watson
• “Un Datawarehouse es una colección de información creada para soportar las aplicaciones de toma de decisiones”
Bill Inmon
• “Es un conjunto no volátil de información que soporta la toma de decisiones, Orientado sobre un área, integrado al tiempo.”
Ralph Kimbal
• “El Datawarehouse da acceso a la información de la corporación o área funcional. El alcance del Datawarehouse puede ser bien un departamento o bien corporativo.”
Datawarehouse (DWH)
Hugh J. Watson
• “Datawarehousing es el proceso completo de extraer información, transformarla y cargarla en un Datawarehouse y el acceso a esta información por los usuarios finales y las aplicaciones”
Sharon Sibigthroth
• “Descubres el valor real de un Datawarehouse cuando alguien puede encontrar los detalles importantes en la información, y te dice algo que puede generar la diferencia”.
Data Marts Dependientes
Fuentes de datos
Datawarehouse
Data Marts
Data Marts Independientes
Fuentes de datos
Data Marts
Estrategias de construcción de un DWH
W.H Inmon
• Definir un DWH corporativo y a partir de él ir construyendo los modelos de análisis para los distintos niveles y departamentos de la organización; es decir, una estrategia de arriba abajo, desde la estrategia a lo más operativo.
R. Kimball
• Construir distintos Data Marts que cubran las distintas necesidades de la organización, sin la necesidad de construir un Datawarehouse.
Componentes y factores de DWH
MetadataInformación de la información. Contiene el significado de los componentes que residen en el Datawarehouse (o Data Mart) y sus atributos. Es útil para tecnología y los usuarios funcionales.
Operational Data Store (ODS)Consolidan datos de distintas fuentes y sistemas no integrados y facilitan un acceso online integrado sobre esa información. Proporciona información integrada con el fin de facilitar la toma de decisiones en entornos operacionales. Sus datos son volátiles (dos o tres meses) y se actualizan en tiempo real. Es una fuente de datos para el DWS.
Factores para implementar DHW1. Tamaño y volumen de datos del Datawarehouse 2. Complejidad de los esquemas de datos. 3. Número de usuarios concurrente. 4. Complejidad de las consultas
Gestión del DatawarehouseLos usuarios de negocio necesitan tomar decisiones por lo que debemos asegurar: 1. Alta disponibilidad. 2. Rendimiento. 3. Copias de seguridad y recuperación. 4. Recuperación física en caliente.
Herramientas de BIHerramienta Descripción
Generadores de informes
Utilizadas por desarrolladores profesionales para crear informes estándar para grupos, departamentos o la organización.
Herramientas de usuario final de consultas e informes
Empleadas por usuarios finales para crear informes para ellos mismos o para otros; no requieren programación.
Herramientas OLAP Permiten tratar la información de forma multidimensional para explorarla desde distintas perspectivas y periodos de tiempo.
Herramientas de Dashboard y Scorecard
Muestran información crítica de rendimiento utilizando iconos gráficos pudiendo ver más detalle e informes.
Herramientas de BIHerramienta Descripción
Herramientas de planificación, modelización y consolidación
Permiten crear planes de negocio, simulaciones, planificación, presupuestos, previsiones, etc. Proveen a los dashboards y Scorecard de objetivos y umbrales de las métricas
Herramientas Datamining
Permiten crear modelos estadísticos de las actividades de los negocios. Descubren e interpretan patrones desconocidos en la información para resolver problemas de negocio.
Procesamiento analítico en línea (OLAP)
FAST
SHARED
MULTIDIMEN-SIONAL
ANALYSIS
Tipos de OLAPTipo Descripción
Relational OLAP (ROLAP)
Acceden directamente a la base de datos relacional. No tiene limitaciones en cuanto al tamaño, pero es más lento que MOLAP.
Multimensional OLAP (MOLAP)
Accede directamente a una base de datos multidimensional. Es muy rápida en los tiempos de respuesta, pero si queremos cambiar las dimensiones, debemos cargar de nuevo el cubo
Hybrid OLAP (HOLAP)
Accede a los datos de alto nivel en una base de datos multidimensional y a los atómicos directamente sobre la base de datos relacional. Utiliza las ventajas del ROLAP y del MOLAP.
Desktop OLAP (DOLAP)
Crea un cubo en la memoria del ordenador y cuando finaliza lo elimina de memoria. El usuario sólo recibe y analiza las dimensiones en los que está interesado y en forma local.
Datamining
Visualización
Usuarios de herramientas de BI
Preguntas capítulo 04
¿Que entendemos por proceso ETL? ¿Cuál es la utilidad de los
Datawarehouse o almacenes de datos? ¿Qué son los Data Mart? ¿En que consisten los cubos OLAP?
Conclusiones BI se compone de diversos elementos, como lo son:• Fuentes de información• Herramientas de ETL• Data Warehouse y Data Mart• Herramientas de BI
• Queries y reports• OLAP• Interfaz y visualización (Scorecards y Dashboards)• Data Mining
Gracias a BI, podemos identificar lo que está pasando, entender por qué pasa, ayudar a predecir que va a pasar y tomar las medidas necesarias.
Recomendaciones Adecuada planificación Contemplar elementos como la información que
se necesita Detallar el uso de la misma, Determinar a quien va dirigido Analizar minuciosamente los aspectos técnicos
como lo son tiempo de respuesta, integración, seguridad, navegación, entorno gráfico.
Bibliografía
Cano, Josep. 2007. Business Intelligence: Competir con Información. España, Barcelona. Banesto, Fundación Cultural.
Gracias!
Top Related