Class 51 OLAP.ppt
-
Upload
jesus-uchiha -
Category
Documents
-
view
83 -
download
2
Transcript of Class 51 OLAP.ppt
![Page 1: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/1.jpg)
11/96/96
Mg. Samuel Oporto Díaz
Almacenes de Datos
INTELIGENCIA ARTIFICIAL
![Page 2: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/2.jpg)
22/96/96
Tabla de Contenido• Introducción a la Inteligencia de Negocios• OLTP y OLAP• Metodología• Diseño Lógico• Diseño Físico• Principios de Diseño• Dimensiones• Cubos y medidas
![Page 3: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/3.jpg)
33/96/96
TOMA DE DECISIONES
![Page 4: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/4.jpg)
44/96/96
Toma de decisiones• Proceso de toma de decisiones:
Tomar decisiones sin la información adecuada, sobre todo cuando ésta se encuentra disponible en la organización, es un riesgo que ninguna empresa debería correr.
DecisiónMedición Control
Realidad
![Page 5: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/5.jpg)
55/96/96
Ejercicio 1• Forme grupos de 4 o 5 alumnos.• Defina un problema de decisión de su entorno inmediato.• La decisión debe ser tomada necesariamente por el grupo.• Debe ser un problema real.• Diga qué información requieren para tomar la decisión.• Diga en qué estado se encuentra, ¿debe procesarla?• Quién es el dueño de la información.• Qué variable controla con esta información.• Explique qué acciones tomará dependiendo del valor de la
variable, arme un grafo, un cuadro, un árbol de decisión.• Tome la decisión en la realidad.• Explique las consecuencias de su decisión.
![Page 6: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/6.jpg)
66/96/96
INTELIGENCIA DE NEGOCIOS
![Page 7: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/7.jpg)
77/96/96
Niveles en el Uso de los Datos
![Page 8: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/8.jpg)
88/96/96
Niveles en el uso de los datos• Nivel operacional: Se utilizan sistemas de información que
monitorean las actividades y transacciones elementales.
• Nivel de administración : Realiza operaciones repetitivas de captura masiva de datos y servicios básicos de tratamiento de datos, con tareas predefinidas.
• Nivel de conocimientos : Realiza actividades de análisis, de seguimiento, de control y toma de decisiones, realiza consultas sobre información almacenada.
• Nivel estratégico: Realizar las actividades de planificación a largo plazo, tanto del nivel de administración como de los objetivos que la empresa posee. Mira el futuro
![Page 9: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/9.jpg)
99/96/96
Uso de la información
Plazo Nivel Uso
Corto plazo Operacional y Administrativo
Obtención y control de datos
OLTP
Mediano plazo
De Conocimientos
Decisiones tácticas
OLAP
Largo plazo Estratégico Decisiones estratégicas
OLAP
OLTP (On-Line Transaction Processing - Procesamiento de Transacciones en Línea). Para la capturan y almacenamiento de transacciones.
OLAP (On-Line Analytical Processing – Procesamiento Analítico en Línea). Para el análisis y las navegación en los datos.
![Page 10: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/10.jpg)
1010/96/96
Inteligencia de Negocios
Business intelligence.• Conjunto de estrategias y herramientas enfocadas a la
administración y creación de conocimiento mediante el análisis de datos existentes en una organización o empresa.
• Características de las herramientas:– Accesibilidad a la información. Acceso de datos a los usuarios con
independencia de la procedencia de estos. – Apoyo en la toma de decisiones. Los usuarios tienen acceso a
herramientas de análisis que les permitan seleccionar y manipular sólo aquellos datos que les interesen.
– Orientación al usuario final. Independiente de los conocimientos técnicos de los usuarios y su capacidad para utilizar estas herramientas.
![Page 11: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/11.jpg)
1111/96/96
Inteligencia de Negocios
Business intelligence.• Es el conjunto de técnicas y herramientas que apoyan la
toma de decisiones.
• Características:1. Proveen información para el control del proceso de negocio,
independientemente de la fuente de los datos.2. Dan soporte a la toma de decisiones.3. Diferencia la información útil para los usuarios finales.4. Uniformiza los términos usados en la institución.
Independientemente del origen de los datos o de la forma de extracción, transformación y agregación.
![Page 12: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/12.jpg)
1212/96/96
Disciplinas• Enterprise Resource
Planning– ERP• Supply Chain
Management - SCM• Customer Relationship
Management. - CRM• Data Warehouses -
DW• Business Intelligence –
BI• Enterprise Application
Integration – EAI
![Page 13: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/13.jpg)
1313/96/96
Disciplinas• Data Warehousing: Se basa en estructuras
multidimensionales (cubos) que almacenan información calculada previamente de todas las combinaciones de todos los niveles de todas las aperturas de análisis. NxM.
• Data Mart: Es el almacén de datos de un hecho en particular.
• Data Mining: Es una técnica para la extracción de patrones y reglas desde los datos, ayuda a crear nuevos modelos no percibidos por el analista hasta ese momento pero que realmente existen en los datos.
![Page 14: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/14.jpg)
1414/96/96
Evolución• Business Data to Business Information
Etapa Pregunta del Negocio Tecnología disponible
Proveedores Características
Data Collection
(1960)
¿Cuál fue el total de ventas en Lima y en
Arequipa?
Computadoras, cintas, discos
IBM, NCR, etc Retrospectivo
Estático
Data Access (1980)
¿Cuáles fueron las ventas por sucursal en Lima y en Arequipa?
RDBMS SQL Oracle, Informix,
Sybase, etc Retrospectivo
binámico
Data Navigation
(1990)
¿Cuál fue el total de ventas en Lima?, Drill
DownOLAP DW
Pilot, Discoverer, Arbor,etc
Retrospectivo Dinámico Niveles
múltiples
Data Mining (2000)
¿Cómo evolucionarán las ventas en el próximo año?
Algoritmos avanzados,
Multiprocesadores
Intelligent Miner (IBM), SAS, etc
Prospectivo, Proactivo
![Page 15: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/15.jpg)
1515/96/96
Inteligencia de NegociosPlazo Técnica Tecnología Tecnología Conocimiento
Largo Plazo Minería de Datos Agrupamiento
Clasificación
Secuenciación
Reglas de asociación
Patrones
Nuevos Conocimientos
Mediano Plazo Data Warehouse OLAP Información
Toma de Decisiones
Corto Plazo Legacy Sistems (sistemas transaccionales)
OLTP Datos
Operativo
![Page 16: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/16.jpg)
1616/96/96
OLAP Y OLTP
![Page 17: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/17.jpg)
1717/96/96
OLTP y OLAP OLTP OLAP
Usuario Operativos, Profesionales TI Trabajadores de conocimiento
Uso Predecible, Repetitivo Ad hoc, Heurístico
Accesos Alta Media y baja
Tipo acceso R/W - actualización al campo Lectura - Sumarización
T. respuesta Segundos Segundos a minutos
Contenido Valores elementales Datos sumarizados, derivados
Estabilidad Dinámicos Estáticos hasta su actualización
Función Operaciones día a día Soporte a las decisiones
Diseño BD Orientado a la aplicación Orientado al tema (sujeto)
Estructura Transaccional (NORMALIZADA) Consultas (DESNORMALIZADA)
# filas cientos millones
# usuarios miles cientos
DB Size 100 MB-GB 100GB-TR
métrica rendimiento de la transacción rendimiento de la consulta
![Page 18: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/18.jpg)
1818/96/96
OLTP • On-Line Transaction Processing.• Sistemas operacionales que capturan transacciones y las
almacenan en Base de Datos.
• Características:– Transacciones en tiempo real (con día a día)– Datos almacenados cambian continuamente.– Mantienen los datos (INSER; DELETE;UPDATE)– Estructuras de datos optimizadas – normalizadas.– Basado en reglas.– Limitado para la toma de decisiones, las consultas
históricas producen un impacto en la operación del sistema.
– Usa Diagrama Entidad Relación (DER).
![Page 19: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/19.jpg)
1919/96/96
OLTP - EjemploOperación del Cliente:
• Tomar la tarjeta del Cliente.
• Validar el Cliente. si el Cliente existe confirmar que se encuentra en una línea de cajeros habilitada.
• Autenticar el cliente en el sistema.
Realizar una transferencia:
• Verificar que está autorizado para realizarla.
• Verificar que tiene saldo.
• Inicializar la transferencia manejándola como una transacción.
• Emitir comprobante.
• Saludar al Cliente.
Operación en sitio Web:
• Validar al cliente y autenticarlo en el sistema.
• Tomar el pedido.
• Controlar los topes de créditos.
• Informar los valores parciales de la compra y acumulados.
• Requerir confirmación del cliente antes de enviar el pedido.
• Enviar el pedido.
• Descontar del stock las cantidades vendidas.
• Informar el número de venta y la fecha de entrega.
• Saludar al cliente.
Sistema de Cajeros Automáticos.
![Page 20: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/20.jpg)
2020/96/96
OLAP• On-Line Analytical Processing.• Respuesta rápida y flexible a consultas, orientada al
análisis de datos.
• Características:– Optimizado para responder rápidamente a consultas.– Consulta interactiva de los usuarios.– Almacenan varios niveles de datos optimizadas para
responden a consultas.– Proporciona una vista de datos multidimensional.– Se puede cambiar fácilmente filas, columnas, y páginas
en informes de OLAP.
![Page 21: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/21.jpg)
2121/96/96
OLAP - Ejemplos• Sistemas de Información para
ejecutivos
– Alertas.
– Toma de decisiones.
• OLAP en la Actividad Financiera
– Reportes analíticos.
– Planeamiento.
– Análisis.
• OLAP en el Marketing
– Análisis de productos.
– Análisis de Clientes.
– Análisis de Facturación.
• OLAP en Otros Usos
– Análisis de la Producción.
– Análisis de Servicios al cliente.
– Evolución del Costo del producto.
![Page 22: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/22.jpg)
2222/96/96
OLAP - OLTP
OLTP Diagrama E-REntidad
Atributo
Relación
Normalización
Integridad Referencial
UML
Lenguaje de Modelamiento Unificado
Análisis
Diseño
Desarrollo
Implementación
Explotación
OLAP Cubos
Hechos
Dimensiones
Jerarquías
Medidas
Codificación
Granularidad
UDM
modelo dimensional unificado
Diseño
Carga
Explotación
![Page 23: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/23.jpg)
2323/96/96
Ejercicio 2• Responder las siguientes preguntas:
![Page 24: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/24.jpg)
2424/96/96
METODOLOGIA
![Page 25: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/25.jpg)
2525/96/96
Metodología
![Page 26: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/26.jpg)
2626/96/96
MetodologíaDefinición • Plantear los objetivos del
proyecto.• Definir los requerimientos del
negocio.• Modelar el negocio• Definir el plan de trabajo y
equipo de proyecto. Modelamiento • Comprender los requerimientos
del negocio.• Diseñar la arquitectura del DWH• Definir el equipo de pruebas.• Revisar el diseño
Construcción• Construir el DWH• Refinar los desarrollos del ETL• Probar la solución• Prueba de performance• Documentación Producción • Poner en operación del sistema• Validar y cargar la información
inicial• Administrar el crecimiento• Soporte de la solución.• Respaldar periodicamente la
información.
![Page 27: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/27.jpg)
2727/96/96
Ejercicio 3• Identifique metodologías para el desarrollo de DWH• Identifique metodologías para el desarrollo de SI• Compare las metodologías de desarrollo de DWH vs SI• Existen metodologías ágiles para el desarrollo de DWH
![Page 28: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/28.jpg)
2828/96/96
Ciclo de Vida del Proyecto
TechnicalArchitecture
Design
TechnicalArchitecture
Design
ProductSelection &Installation
ProductSelection &Installation
End-UserApplication
Specification
End-UserApplication
Specification
End-UserApplication
Development
End-UserApplication
Development
ProjectPlanningProject
Planning
Business
Requirement
Definition(week1)
Business
Requirement
Definition(week1)
DeploymentDeploymentMaintenance
andGrowth
Maintenanceand
Growth
Project ManagementProject Management
DimensionalModeling
DimensionalModeling Physical
DesignPhysicalDesign
Data StagingDesign &
Development
Data StagingDesign &
Development
![Page 29: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/29.jpg)
2929/96/96
DISEÑO LÓGICO
![Page 30: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/30.jpg)
3030/96/96
Diseño Lógico
![Page 31: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/31.jpg)
3131/96/96
Diseño Lógico• Esquema conceptual• Esquemas fuentes no integrados• Esquema fuente integrado• Esquema lógico intermedio• Esquema lógico del DWH
• Lineamientos de diseño• Mapeos• Reglas
• Transformaciones
![Page 32: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/32.jpg)
3232/96/96
Esquemas
Esquema conceptual
Esquema lógico
Esquema físico
Esquema visualización
lineamientos carga consultas
Esquema Fuente
Integrado
Esquema Intermedio
reglas de transformación
![Page 33: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/33.jpg)
Esquema conceptual• Especifica los requerimientos del usuario.
– Hechos, Dimensiones, Medidas
• Representa los objetos del negocio en términos de hechos, dimensiones, atributos de las dimensiones, cruces entre dimensiones, niveles de las dimensiones y medidas.
![Page 34: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/34.jpg)
3434/96/96
Esquemas fuentes• Define el origen de datos:
– Esquemas fuentes no integrados
– Esquema fuente integrado.
![Page 35: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/35.jpg)
3535/96/96
Esquema fuente intermedio• Define los cambios desde el esquema fuente integrado
hasta el esquema lógico del DWH
![Page 36: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/36.jpg)
3636/96/96
Esquema Lógico• La construcción del esquema lógico del DWH se lleva a
cabo mediante transformaciones aplicadas al esquema lógico de la base de datos fuente.
• Estas transformaciones se aplican a sub-esquemas relacionales, comenzando por el esquema fuente, generando como resultado el esquema lógico del DWH
• Especifica– El estilo de diseño del DH Copo de nieve o Estrella– Normalización de dimensiones– Fragmentación de datos
![Page 37: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/37.jpg)
3737/96/96
Modelos básicos dimensionales
Estrella Copo de Nieve
![Page 38: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/38.jpg)
3838/96/96
Esquema Físico• Existe tres formas de almacenar los datos:
.
Base de Datos Relacional
Vista de Usuario
Base de Datos Multidimensional
DATOS AGREGACIONES
Base de Datos Relacional
Vista de Usuario
Base de Datos Multidimensional
DATOS AGREGACIONES
Base de Datos Relacional
Vista de Usuario
Base de Datos Multidimensional
AGREGACIONES Y DATOS
Base de Datos Relacional
Vista de Usuario
Base de Datos Multidimensional
AGREGACIONES Y DATOS
Base de Datos Relacional
Vista de Usuario
Base de Datos Multidimensional
AGREGACIONES Y DATOS
Base de Datos Relacional
Vista de Usuario
Base de Datos Multidimensional
AGREGACIONES Y DATOS
ROLAP - Relacional OLAP. HOLAP - OLAP híbrido
MOLAP - Multidimensional OLAP.
![Page 39: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/39.jpg)
3939/96/96
Mapeos• Indican donde se encuentran en el esquema lógico fuente,
los elementos del esquema lógico conceptual.• Permiten asociar cada elemento.
![Page 40: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/40.jpg)
4040/96/96
Transformaciones• El diseño lógico del DW se realiza aplicando sucesivas
transformaciones de esquemas.• De deja una traza del diseño, de las transformaciones.
![Page 41: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/41.jpg)
4141/96/96
Transformaciones
![Page 42: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/42.jpg)
4242/96/96
Lineamientos de diseño• Abstrae la estrategia de diseño lógico del DWH y las
restricciones de desempeño y almacenamiento.• Define:
– El estilo de diseño del DH Copo de nieve o Estrella– Fragmentación vertical de dimensiones. Cuando normalizar o de-
normalizar una dimensión.• Estrella de-normaliza las dimensiones
• Copo de nieve normaliza las dimensiones
– Fragmentación horizontal de cubos.• Número de cubos para el datamart
• Cubos con datos históricos
– Mapeos• Estable la correspondencia entre esquemas
– Reglas
![Page 43: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/43.jpg)
4343/96/96
DISEÑO FÍSICO
![Page 44: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/44.jpg)
4444/96/96
MOLAP - OLAP Multidimensional• Los datos origen y sus agregaciones están en una
estructura multidimensional.• Los objetos dimensionales son procesados para incorporar
cambios de los datos operacionales• Existe latencia. tiempo comprendido entre procesamientos• Características:
– Provee excelente rendimiento y compresión de datos.
– Mejor tiempo de respuesta, depende de las las agregaciones.
– Estructura optimizada para maximizar las consultas.
– Apropiado para cubos de rápida respuesta.
Base de Datos Relacional
Vista de Usuario
Base de Datos Multidimensional
AGREGACIONES Y DATOS
Base de Datos Relacional
Vista de Usuario
Base de Datos Multidimensional
AGREGACIONES Y DATOS
![Page 45: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/45.jpg)
4545/96/96
ROLAP - OLAP Relacional • La información del cubo, sus datos, su agregación, sumas
son almacenados en una base de datos relacional.• No copia la BD original, accede a las tablas origen.• Es más lenta que las otras estrategias (MOLAP o HOLAP).• Se utiliza para ahorrar espacio de almacenamiento en
grandes DB de baja frecuencia de consulta.• Usos comunes:
– Cuando los clientes desean ver los cambios inmediatamente. – Cuando contamos con grandes conjuntos de datos que no son
frecuentemente buscados
Base de Datos Relacional
Vista de Usuario
Base de Datos Multidimensional
AGREGACIONES Y DATOS
Base de Datos Relacional
Vista de Usuario
Base de Datos Multidimensional
AGREGACIONES Y DATOS
![Page 46: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/46.jpg)
4646/96/96
HOLAP – OLAP Híbrido• Combina atributos de MOLAP y ROLAP. • Las agregaciones se almacenen en una estructura
multidimensional y los detalle, en la BD original.• Cubos más pequeños q’ MOLAP y más rápidos q’ ROLAP.• Usos comunes:
– Cubos que requieren rápida respuesta
– Cuando existen sumarizaciones basadas en una gran cantidad de datos de origen.
– Solución de compromiso para bajar el espacio ocupado sin perjudicar totalmente el rendimiento de las consultas.
Base de Datos Relacional
Vista de Usuario
Base de Datos Multidimensional
DATOS AGREGACIONES
Base de Datos Relacional
Vista de Usuario
Base de Datos Multidimensional
DATOS AGREGACIONES
![Page 47: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/47.jpg)
4747/96/96
Características
MOLAP ROLAP HOLAPAlmacenamiento de las Agregaciones
Modelo Multidimensional
Base de datos relacional
Modelo Multidimensional
Almacenamiento de los datos
Modelo Multidimensional
Base de datos relacional
Base de datos relacional
Facilidad de Creación
Sencillo Muy Sencillo Sencillo
Velocidad de respuesta
Buena Regular o Baja
Buena para consultas que posean agregaciones, Regular para datos de bajo nivel
EscalabilidadProblemas de escalabilidad
Son más escalables
Recomendados para
Cubos con uso frecuente
Datos que no son frecuentemente usados
Si el cubo requiere una rápida respuesta
![Page 48: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/48.jpg)
4848/96/96
Ventajas y Desventajas
Ventajas Desventajas
MOLAPMejor performance en los tiempos de respuesta
Duplica el almacenamiento de datos (ocupa más espacio)
Tiempo de Latencia
ROLAP
Ahorra espacio de almacenamiento. Útil cuando se trabaja con muy grandes conjuntos de datos.
El tiempo de respuesta a consultas es mayor.
HOLAPBuen tiempo de respuesta sólo para información sumarizada
Volúmenes de datos más grandes en la base de datos relacional
![Page 49: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/49.jpg)
4949/96/96
Diseño Físico
query and reporting (Q&R) tool
![Page 50: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/50.jpg)
5050/96/96
PRINCIPIOS DE DISEÑO
![Page 51: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/51.jpg)
5151/96/96
Cubos
![Page 52: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/52.jpg)
5252/96/96
Conceptos de diseño1. Dimensión: Es una entidad de negocios respecto de la cual
se deben calcular las métricas. Ejemplos: clientes, productos, tiempo.
2. Dimension Table (tabla de dimensión): Tablas que almacenan las dimensiones.
3. Fact table (tabla de hechos): Almacena eventos (por ejemplo, las ventas). Contiene las métricas que miden la efectividad de las operaciones del negocio.Fact (hecho): Es una fila de la fact table. Representa un evento específico.
4. Measures (medidas): Valores cuantitativos que almacenan las métricas del negocio. Están representados por columnas numéricas en la fact table.
![Page 53: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/53.jpg)
5353/96/96
![Page 54: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/54.jpg)
5454/96/96
1. Dimensiones• Es un criterio utilizado para cruzar la información.
• La medida “Ventas”, por sí sola, carece de sentido. ¿Quiero ver las ventas por producto? ¿por tiempo? ¿por distribuidor?
• Cada uno de estos criterios produce una dimensión.
![Page 55: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/55.jpg)
5555/96/96
1. Dimensiones y niveles• Una dimensión tiene múltiples niveles de agrupación.
Por ejemplo, la dimensión “Ubigeo” debe poder disgregarse en países, departamentos, provincia, distrito.
• Cada uno de estos niveles de agregación define un nivel.• En el ejemplo antes mencionado, los niveles de la
dimensión “Ubigeo” son:. País
.. Departamento…Provincia….Distrito
• Cada nivel tiene ocurrencias. Por ejemplo, “Lima” es una ocurrencia del nivel Departamento. A estas ocurrencias se les llama miembros (members).
![Page 56: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/56.jpg)
5656/96/96
2. Tablas de dimensión• Las dimensiones se almacenan
en tablas.• Generalmente, cada nivel
representa una columna en la tabla de dimensión.
• Una tabla de dimensión posee una columna clave, comúnmente auto-generada.
• Una tabla de dimensión contiene columnas que almacenan los IDs de cada registro en sus sistemas de origen.
PRODUCTO_DIM
Producto_Key
IDProducto
Familia
Subfamilia
Marca
Presentación
![Page 57: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/57.jpg)
5757/96/96
3. Tabla de Hechos• La tabla de hechos es la tabla primaria del modelo
dimensional, y contiene los valores del negocio que se desea analizar.
• Cada tabla de hechos contiene las claves externas, que se relacionan con sus respectivas tablas de dimensiones, y las columnas con los valores que serán analizados.
• El modelo dimensional divide el mundo de los datos en dos grandes tipos: las medidas y las dimensiones de estas medidas.
• Las medidas, siempre son numéricas, se almacenan en las tablas de hechos y las dimensiones que son textuales se almacenan en las tablas de dimensiones.
![Page 58: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/58.jpg)
5858/96/96
4. Medidas• Son las columnas numéricas que queremos analizar que
provienen directamente de los sistemas OLTP.
• Cuando definimos una medida debemos tener en cuenta cual será la forma de agregación (agrupación de la misma) al subir por la estructura dimensional.
• Estas formas de agregación pueden ser:– Suma: es la operación que suma los valores de las columnas– Cuenta: realiza un conteo de los valores– Mínima: devuelve un valor mínimo– Máxima: proporciona el mayor de los valores– Cuenta de Distintos: cuenta los valores diferentes
![Page 59: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/59.jpg)
5959/96/96
Tabla de hechos y tablas de dimensión
La tabla de hechos tiene relaciones de foreign key con cada una de las tablas de dimensión
![Page 60: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/60.jpg)
6060/96/96
Esquemas de las Dimensiones• En el modelo STAR, cada nivel corresponde con una
columna adicional en una sola tabla de dimensión.
• En el modelo SNOWFLAKE, cada nivel corresponde con una nueva tabla de dimensión.
![Page 61: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/61.jpg)
6161/96/96
El modelo estrella (STAR)
![Page 62: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/62.jpg)
6262/96/96
Modelo SNOWFLAKE
![Page 63: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/63.jpg)
6363/96/96
Modelo STAR vs SNOWFLAKE
STAR SNOWFLAKE
Entendimiento del modelo
Sencillo Mayor dificultad
Número de tablas Menor Mayor
Complejidad de la consulta
Baja Alta
Desempeño de las consultas y el procesamiento del cubo
Rápida Lenta
![Page 64: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/64.jpg)
6464/96/96
Modelo STAR vs SNOWFLAKE
![Page 65: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/65.jpg)
6565/96/96
DIMENSIONES
![Page 66: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/66.jpg)
6666/96/96
Dimensiones• Las dimensiones se obtienen a partir de los criterios
utilizados por los usuarios para consultar las medidas.
• Si las ventas se miden por producto, tiempo y cliente; es posible que deba crear tres dimensiones: producto, tiempo y cliente.
![Page 67: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/67.jpg)
6767/96/96
Atributos• Un atributo representa una propiedad de interés en una
dimensión.
• Ejemplo: atributos de la dimensión Cliente:– Nombre cliente– Grado de instrucción– Nro de hijos– Ciudad– País
• Cada atributo proviene de una columna de la tabla de dimensión.
![Page 68: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/68.jpg)
6868/96/96
Jerarquías y niveles• Existen en una empresa entidades de negocio que admiten
más de una interpretación.
• Por ejemplo: puedo analizar a los clientes por ubicación geográfica, grado de instrucción, sexo, número de hijos, etc.
• Por cada manera distinta de analizar la información de una dimensión, se crea una nueva jerarquía.
• Cada jerarquía contiene su propia estructura de niveles. Cada nivel proviene de un atributo.
![Page 69: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/69.jpg)
6969/96/96
Ejercicio 4• Se desea obtener indicadores de rendimiento de los
empleados de la corporación.• Los reportes de evaluación de los empleados deben ser
totalizados de acuerdo a las divisiones organizacionales y regiones geográficas de la corporación.
• Cada empleado trabaja para una división organizacional. A su vez, cada empleado pertenece a una ciudad, y cada ciudad está contenida en una región.
• ¿Cuál es la manera de definir los niveles de la dimensión Empleado?
![Page 70: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/70.jpg)
7070/96/96
Solución• Crear dos jerarquías: Región y División.
Empleado.Región
▪ Región
▪▪ Ciudad
▪▪▪ Empleado
Empleado.División
▪ División
▪▪ Empleado
![Page 71: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/71.jpg)
7171/96/96
Miembros de una dimensión• Cada miembro es una
ocurrencia específica de una dimensión.
• Las dimensiones suelen tener una estructura basada en niveles. Cada miembro se ubica en un determinado nivel.
![Page 72: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/72.jpg)
7272/96/96
Relaciones entre los miembros• Austria es el padre (parent) de
Graz y Salzburg.• Austria y Belgium son hermanos
(siblings).• Graz y Salzburg son hermanos
(siblings).• Graz y Salzburg son hijos
(children) de Austria.• Los ancestros (ancestors) de
Graz son Ubigeo y Austria.• Los descendientes
(descendants) de Ubigeo son todos los miembros de la dimensión (Argentina, Austria, Graz, Salzburg, etc.)
• Graz y Salzburg son primos (cousin) de Bruxelles y Charleroi.|
![Page 73: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/73.jpg)
7373/96/96
Tipos de dimensiones
1. Dimensiones estándar
2. Dimensiones Time
3. Dimensiones Padre - Hijo
![Page 74: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/74.jpg)
7474/96/96
Dimensiones estándar• Es el tipo más sencillo de dimensión.• Una dimensión estándar tiene un conjunto fijo de jerarquías
y niveles, establecido por el diseñador a través de SSBIDS.
• Propiedades:– Name: Nombre de la dimensión.– Usage: Uso que se dará a la dimensión.– KeyColumns: Columna(s) de clave para la dimensión.– NameColumn: Columna que proporciona el valor
mostrado en la dimensión al consultar datos.
![Page 75: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/75.jpg)
7575/96/96
Dimensiones Parent – Child• Se basan en relaciones
recursivas existentes en una tabla de dimensión.
• Por ejemplo, un empleado tiene un jefe. Pero este jefe es también un empleado.
![Page 76: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/76.jpg)
7676/96/96
Dimensiones Parent – Child• Las dimensiones Parent –
Child contienen un número variable de niveles.
• En la figura, Ken Sánchez es el jefe de Brian Welcker y David Bradley.
• Ejemplos típicos: jerarquías de mando, organigramas.
![Page 77: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/77.jpg)
7777/96/96
Dimensión Time• El tiempo es parte implícita
de la información que contiene el data mart.
• Esta dimensión la podemos definir separándola en distintas jerarquías de tiempo:
• Año• Semestre • Mes
![Page 78: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/78.jpg)
7878/96/96
CUBOS Y MEDIDAS
![Page 79: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/79.jpg)
7979/96/96
Cubos
![Page 80: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/80.jpg)
8080/96/96
Propiedades de los cubos• Name: Nombre del cubo.• Visible: Determina si el cubo es visible o no.• Default Measure: La medida devuelta por el cubo en caso
de que las consultas no especifiquen de forma explícita qué medida se desea visualizar.
• Medida: representa un valor obtenido a partir de una columna numérica de la tabla de hechos.
• Grupo de medidas (measure group): Las medidas se agrupan en grupos de medidas (grupo de medidas). Cada grupo de medidas corresponde con una tabla de hechos. Un cubo puede contener varios grupo de medidas.
![Page 81: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/81.jpg)
8181/96/96
Propiedades de las medidas• Name: Nombre de la medida.• Description: Descripción de la medida.• Source: Columna de la tabla de hechos a partir de la cual
se obtiene la medida. • Format String: Determina el formato de visualización de la
medida (por ejemplo, porcentaje y moneda). También permite ingresar una cadena de formato personalizada.
• Visible: Determina si la medida es visible o no. Esta propiedad es útil cuando se definen medidas intermedias, a partir de las cuales se calcularán otras medidas a través de MDX.
• Data Type: Tipo de dato de la medida. Por defecto, es heredado del tipo de dato de la columna que genera la medida.
![Page 82: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/82.jpg)
8282/96/96
Función de agregación• SUM: Es por defecto. Significa que el valor de la medida para un
miembro de una dimensión es igual a la suma de los valores para todos sus miembros hijos.
• COUNT: Recupera la cuenta de registros en la tabla de hechos. • MIN: Significa que el valor de la medida para un miembro es igual al
valor mínimo encontrado entre sus miembros hijos.• MAX: Significa que el valor de la medida para un miembro es igual al
valor máximo encontrado entre sus miembros hijos.• DISTINCT COUNT: Recupera la cuenta de registros en la tabla de
hechos, eliminando las ocurrencias repetidas.• NONE: No se efectúa ningún tipo de agregación• BY ACCOUNT: Agrega la medida de acuerdo con la función de
agregación asignada a las dimensiones de tipo “Account”.
![Page 83: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/83.jpg)
8383/96/96
Función de agregación• AVERAGE OF CHILDREN: Significa que el valor de la medida para un
miembro de una dimensión es igual al promedio de los valores para todos sus miembros hijos no vacíos.
• FIRST CHILD: Significa que el valor de la medida para un miembro es igual al valor de la medida para su primer miembro hijo.
• LAST CHILD: Significa que el valor de la medida para un miembro es igual al valor de la medida para su último miembro hijo.
• FIRST NON EMPTY: Significa que el valor de la medida para un miembro es igual al valor de la medida para su primer miembro hijo no vacío.
• LAST NON EMPTY: Significa que el valor de la medida para un miembro es igual al valor de la medida para su último miembro hijo no vacío.
![Page 84: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/84.jpg)
8484/96/96
Relaciones entre las dimensiones hechos• Regular• Referenciada• Fact• Many – to – many
![Page 85: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/85.jpg)
8585/96/96
1. Relación regular• Relación uno – muchos con la tabla de hechos.
![Page 86: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/86.jpg)
8686/96/96
Roles de las dimensiones• En ocasiones, una dimensión participa múltiples veces en
el mismo cubo, desempeñando distintos roles.• Ejemplos:
– Una tabla de hechos puede contener tres columnas que lo enlacen con la dimensión de tiempo: una columna para almacenar la fecha de facturación, otra para almacenar la fecha de remisión, y otra para almacenar la fecha de entrega.
– Una tabla de hechos puede contener dos columnas enlazadas con la dimensión de empleados: una columna para representar al empleado que efectuó la venta, y otra para representar al empleado que efectuó el despacho.
![Page 87: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/87.jpg)
8787/96/96
Roles de las dimensiones
![Page 88: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/88.jpg)
8888/96/96
2. Relación referenciada• Se produce cuando la tabla de dimensión no está
directamente relacionada con la tabla de hechos.
![Page 89: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/89.jpg)
8989/96/96
2. Relación referenciada
![Page 90: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/90.jpg)
9090/96/96
3. Relación “Fact”• Frecuentemente, las tablas de hechos contienen, además
de columnas de medidas y foreign keys, columnas adicionales que almacenan información relevante para el negocio.
• En estas situaciones, puede resultar muy útil definir una dimensión a partir de la tabla de hechos. A este tipo de dimensiones se les denomina “dimensiones degeneradas”.
![Page 91: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/91.jpg)
9191/96/96
3. Relación “Fact”• La columna
“SalesOrderNumber” almacena el número del documento de orden de venta.
• Esta información puede ser usada para definir una dimensión.
![Page 92: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/92.jpg)
9292/96/96
4. Relación Muchos – Muchos• Implementan relaciones muchos – muchos entre tabla de
hechos y tabla de dimensión.
![Page 93: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/93.jpg)
9393/96/96
4. Relación Muchos – Muchos• Ejemplos:
– Un motivo de venta (tabla de dimensión) puede tener muchas ventas (tabla de hechos). Una venta específica, a su vez, puede tener muchos motivos.
– La misma ausencia laboral puede deberse a múltiples razones. Cada razón tiene varias ausencias relacionadas.
• Estas relaciones se implementan a través de una tabla de hechos intermedia.
![Page 94: Class 51 OLAP.ppt](https://reader033.fdocumento.com/reader033/viewer/2022061210/5490ec70b4795969178b4fbf/html5/thumbnails/94.jpg)
9494/96/96
4. Relación Muchos – Muchos