Unidad 3 tsbd olap

27
3.- OLAP OLAP es el acrónimo en inglés de procesamiento analítico en línea (On-Line Analytical Processing). Es una solución utilizada en el campo de la llamada Inteligencia empresarial (o Business Intelligence) cuyo objetivo es agilizar la consulta de grandes cantidades de datos. Para ello utiliza estructuras multidimensionales (o Cubos OLAP ) que contienen datos resumidos de grandes Bases de datos o Sistemas Transaccionales (OLTP ). Se usa en informes de negocios de ventas, marketing, informes de dirección, minería de datos y áreas similares. La razón de usar OLAP para las consultas es la velocidad de respuesta. Una base de datos relacional almacena entidades en tablas discretas si han sido normalizadas. Esta estructura es buena en un sistema OLTP pero para las complejas consultas multitabla es relativamente lenta. Un modelo mejor para búsquedas, aunque peor desde el punto de vista operativo, es una base de datos multidimensional . La principal característica que potencia a OLAP, es que es lo más rápido a la hora de ejecutar sentencias SQL de tipo SELECT, en contraposición con OLTP que es la mejor opción para operaciones de tipo INSERT, UPDATE Y DELETE. Funcionalidad En la base de cualquier sistema OLAP se encuentra el concepto de cubo OLAP (también llamado cubo multidimensional o hipercubo ). Se compone de hechos numéricos llamados medidas que se clasifican por dimensiones. El cubo de metadatos es típicamente creado a partir de un esquema en estrella o copo de nieve , esquema de las tablas en una base de datos relacional. Las medidas se obtienen de los registros de una tabla de hechos y las dimensiones se derivan de la dimensión de los cuadros. Tipos de sistemas OLAP

Transcript of Unidad 3 tsbd olap

Page 1: Unidad 3 tsbd olap

3- OLAP

OLAP es el acroacutenimo en ingleacutes de procesamiento analiacutetico en liacutenea (On-Line Analytical Processing) Es una solucioacuten utilizada en el campo de la llamada Inteligencia empresarial (o Business Intelligence) cuyo objetivo es agilizar la consulta de grandes cantidades de datos Para ello utiliza estructuras multidimensionales (o Cubos OLAP) que contienen datos resumidos de grandes Bases de datos o Sistemas Transaccionales (OLTP) Se usa en informes de negocios de ventas marketing informes de direccioacuten mineriacutea de datos y aacutereas similares

La razoacuten de usar OLAP para las consultas es la velocidad de respuesta Una base de datos relacional almacena entidades en tablas discretas si han sido normalizadas Esta estructura es buena en un sistema OLTP pero para las complejas consultas multitabla es relativamente lenta Un modelo mejor para buacutesquedas aunque peor desde el punto de vista operativo es una base de datos multidimensional

La principal caracteriacutestica que potencia a OLAP es que es lo maacutes raacutepido a la hora de ejecutar sentencias SQL de tipo SELECT en contraposicioacuten con OLTP que es la mejor opcioacuten para operaciones de tipo INSERT UPDATE Y DELETE

Funcionalidad

En la base de cualquier sistema OLAP se encuentra el concepto de cubo OLAP (tambieacuten llamado cubo multidimensional o hipercubo) Se compone de hechos numeacutericos llamados medidas que se clasifican por dimensiones El cubo de metadatos es tiacutepicamente creado a partir de un esquema en estrella o copo de nieve esquema de las tablas en una base de datos relacional Las medidas se obtienen de los registros de una tabla de hechos y las dimensiones se derivan de la dimensioacuten de los cuadros

Tipos de sistemas OLAP

Tradicionalmente los sistemas OLAP se clasifican seguacuten las siguientes categoriacuteas

ROLAP

Implementacioacuten OLAP que almacena los datos en un motor relacional Tiacutepicamente los datos son detallados evitando las agregaciones y las tablas se encuentran normalizadas Los esquemas maacutes comunes sobre los que se trabaja son estrella oacute copo de nieve aunque es posible trabajar sobre cualquier base de datos relacional La arquitectura estaacute compuesta por un servidor de banco de datos relacional y el motor OLAP se encuentra en un servidor dedicado La principal ventaja de esta arquitectura es que permite el anaacutelisis de una enorme cantidad de datos

MOLAP

Esta implementacioacuten OLAP almacena los datos en una base de datos multidimensional Para optimizar los tiempos de respuesta el resumen de la informacioacuten es usualmente calculado por adelantado Estos valores precalculados o agregaciones son la base de las ganancias de desempentildeo de este sistema Algunos sistemas utilizan teacutecnicas de compresioacuten de datos para disminuir el espacio de almacenamiento en disco debido a los valores precalculados

HOLAP (Hybrid OLAP)

Almacena algunos datos en un motor relacional y otros en una base de datos multidimensional

Comparacioacuten

Cada sistema OLAP tiene ciertos beneficios (aunque existe desacuerdo acerca de las caracteriacutesticas especiacuteficas de los beneficios entre los proveedores)

Algunas implementaciones MOLAP son propensas a la explosioacuten de la base de datos este fenoacutemeno provoca la necesidad de grandes cantidades de espacio de almacenamiento para el uso de una base de datos MOLAP cuando se dan ciertas condiciones elevado nuacutemero de dimensiones resultados precalculados y escasos datos multidimensionales Las teacutecnicas habituales de atenuacioacuten de la explosioacuten de la base de datos no son todo lo eficientes que seriacutea deseable

Por lo general MOLAP ofrece mejor rendimiento debido a la especializada indexacioacuten y a las optimizaciones de almacenamiento MOLAP tambieacuten necesita menos espacio de almacenamiento en comparacioacuten con los especializados ROLAP porque su almacenamiento especializado normalmente incluye teacutecnicas de compresioacuten

ROLAP es generalmente maacutes escalable Sin embargo el gran volumen de reprocesamiento es difiacutecil de implementar eficientemente por lo que con frecuencia se omiten por tanto el rendimiento de una consulta ROLAP puede verse afectado

Desde la aparicioacuten de ROLAP van apareciendo nuevas versiones de bases de datos preparadas para realizar caacutelculos las funciones especializadas que se pueden utilizar tienen maacuteas limitaciones

HOLAP (OLAP Hiacutebrido) engloba un conjunto de teacutecnicas que tratan de combinar MOLAP y ROLAP de la mejor forma posible Generalmente puede pre-procesar raacutepidamente escala bien y proporciona una buena funcioacuten de apoyo

31 Procesamiento Analiacutetico en Liacutenea

En un almaceacuten de datos a diferencia de un OLTP se realizan operaciones de procesamiento analiacutetico en liacutenea (ldquoOLAP - On-Line Analytical Processingrdquo) cuya operacioacuten consiste principalmente de consultas sobre grandes voluacutemenes de datos y de

proveer una interfaz en liacutenea que ofrece reportes y graacuteficos El procesamiento analiacutetico en liacutenea es una tecnologiacutea que permite a los analistas y administradores visualizar y navegar los datos accediendo a una amplia variedad de vistas posibles de la informacioacuten de manera interactiva raacutepida y eficiente

Como parte de los servicios de explotacioacuten de una arquitectura de anaacutelisis de informacioacuten los datos tienen que ser modelados multidimensionalmente para satisfacer los requerimientos de desempentildeo de este tipo de consultas en liacutenea En este curso se hace una diferencia entre el concepto de almaceacuten de datos y los modelos de datos multidimensionales o cubos puesto que en la arquitectura propuesta los cubos se generan a partir de datos que ya se encuentran en el almaceacuten de datos creando redundancia en algunos casos pero ofreciendo al usuario la posibilidad de hacer consultas al almaceacuten de datos sin necesidad de conocer sobre cubos y su manipulacioacuten Otra opcioacuten arquitectural es que los cubos esteacuten almacenados en un repositorio de datos separado denominado un servidor de procesamiento analiacutetico en liacutenea y el almaceacuten de datos incluya los datos de detalle almacenados en forma de tablas

En las siguientes secciones se describiraacuten los conceptos sobre cubos servidores de procesamiento analiacutetico en liacutenea y la visualizacioacuten y navegacioacuten interactiva de modelos dimensionales

Modelos multidimensionales

Los modelos de datos multidimensionales se han estudiado exhaustivamente en esta seccioacuten se mencionaraacuten las definiciones maacutes importantes para estar en contexto

Un modelo de datos es una representacioacuten de los datos y sus relaciones con otros datos que se utiliza para conocer como se organizaraacuten los datos en bases de datos u otro medio de almacenaje y administracioacuten de datos Por ejemplo en el modelo de datos entidad relacioacuten (ER) uno puede conceptualizar cada entidad de datos sus atributos y sus relaciones En la figura 421 se tiene un modelo o diagrama ER de un sistema operacional para registro de pagos de impuestos de autos

Ejemplo de diagrama ER

Esquemas relacionales para modelado multidimensional

Un modelo de datos multidimensional o cubo es una coleccioacuten de medidas las cuales dependen de un conjunto de dimensiones es una representacioacuten de los datos que permite organizarlos en la forma de hechos dimensiones y agregados los hechos contienen medidas es decir la informacioacuten a nivel transaccioacuten que vamos a analizar por ejemplo compras ventas prestamos etc Las dimensiones contienen informacioacuten descriptiva de esas transacciones por ejemplo fecha cliente producto etc Un modelo multidimensional se utiliza para el anaacutelisis de informacioacuten

Los conceptos de dimensioacuten y hechos

La figura muestra el concepto de modelo multidimensional del tema ldquocomprasrdquo a la izquierda se muestran datos

transaccionales fuente de ejemplo a la derecha y abajo se tiene un diagrama de cubo donde hay 2 medidas a analizar la cantidad y el costo esos atributos o campos formaran la tabla de hechos del cubo y se analizaraacuten por 3 dimensiones

La dimensioacuten ldquoproductordquo que contiene los atributos del producto que se comproacute La dimensioacuten ldquoproveedorrdquo que contiene los atributos del proveedor a quien se le comproacute ese producto y finalmente la dimensioacuten ldquotiempordquo que contiene la fecha en la que se realizoacute esa transaccioacuten de compra

Se tienen diferentes esquemas relacionales para hacer el modelado multidimensional a continuacioacuten se describe cada uno de ellos

Esquemas para representar modelos multidimensionales

a) Modelo o esquema de estrella (ldquostar schemardquo) tradicional

El esquema de estrella es una teacutecnica de modelado de datos usada para hacer corresponder un modelo multidimensional a una base de datos relacional debe su nombre debido a que graacuteficamente parece una estrella El esquema de estrella tiene cuatro componentes hechos dimensiones atributos y jerarquiacuteas de atributos Los hechos y dimensiones son representados por tablas fiacutesicas en el almaceacuten de datos la tabla de hechos estaacute relacionada a cada dimensioacuten en una relacioacuten uno a muchos Las tablas de hechos y dimensiones estaacuten relacionadas por llaves foraacuteneas y estaacuten sujetas a las restricciones de las llaves foraacuteneas y primarias

Modelo de estrella con 3 dimensiones y una tabla de hechos

Para calcular el total de compras realizadas a proveedores de Internet el esquema de estrella tendriacutea que realizar estos pasos

1 De la dimensioacuten Proveedor seleccionar todos los proveedores donde el canal es Internet

2 De la tabla de hechos seleccionar y calcular la suma de todas las cantidades y costos de las transacciones de compra a los proveedores del paso 1

b) Modelo de copo de nieve (ldquosnow flake schemardquo)

El esquema de copo de nieve es una variacioacuten de la estrella tradicional lo que se hace es que en cada dimensioacuten se almacenan jerarquiacuteas de atributos o bien simplemente se separan atributos en otra entidad por razones de desempentildeo y mejor utilizacioacuten del espacio En la figura 425 la dimensioacuten producto se ha modificado separando sus datos generales de sus otras caracteriacutesticas

Modelo de copo de nieve

b) Modelo de constelaciones

El modelo de constelaciones nuevamente es una variacioacuten del esquema de estrella tradicional en este modelo algunos atributos de las dimensiones se separan

formando una nueva entidad que puede ser compartida con otros cubos es decir pueden ser dimensiones de otros cubos (ver la figura 426) La utilidad principal de este modelo es que al tener dimensiones que puede ser compartidas por diferentes cubos se tendraacute un mejor uso del espacio de almacenamiento evitando la redundancia

Esquema de constelaciones

Operaciones con cubos

Una vez que se tienen los cubos se puede realizar diferentes operaciones sobre ellos para visualizar y analizar la informacioacuten las operaciones son

a) Generalizar y especializar o como en la bibliografiacutea se conoce abstraccioacuten y concrecioacuten (generalizar y especializar)

b) Corte y corte de cubos (ldquoSlice amp Dicerdquo)

c) Filtrar

d) Pivotear

Estas operaciones se realizan sobre los cubos (ldquocubingrdquo) y generan como resultados sub-cubos llamados ldquocuboidesrdquo

La especializacioacuten y la generalizacioacuten son operaciones que sirven para navegar un cubo sobre sus dimensiones Las dimensiones que ofrecen diferentes niveles de abstraccioacuten podraacuten ser navegables por ejemplo supongamos que tenemos la dimensioacuten tiempo que tiene los nivel de abstraccioacuten antildeo semestre mes semana y diacutea una operacioacuten de especializacioacuten nos permitiraacute interactivamente visualizar los hechos desde el agregado total por antildeo e ir descendiendo hasta el detalle por diacutea la operacioacuten generalizar permitiraacute lo contrario desde cualquier nivel podraacute generalizar a un nivel superior por ejemplo de semana a mes En resumen las operaciones especializar y generalizar realizan el proceso siguiente

Detalle 1048774 GENERALIZACION 1048774 Alto nivel - generalizar

Alto nivel 1048774 ESPECIALIZACION 1048774 Detalle - especializar

Operaciones sobre cubos especializar y generalizar

Las operaciones de corte y corte de cubo sirven para ver subconjuntos de cubos es maacutes se dice que como resultado generan ldquosubcubosrdquo o ldquocuboidesrdquo La operacioacuten ldquocorterdquo como la palabra lo indica es una operacioacuten que genera una rebanada del cubo por ejemplo si de una dimensioacuten tiempo de un cubo uacutenicamente tomamos el mes de ldquoMarzordquo y dejamos ver el resto de las dimensiones entonces tendremos la rebanada o corte que corresponde al mes de ldquoMarzordquo Si ademaacutes de eso condicionamos la dimensioacuten ldquoproveedorrdquo seleccionando el proveedor ldquoXrdquo de un cubo de ldquocomprasrdquo entonces estaremos obteniendo un ldquosubcubordquo este uacuteltimo es el resultado de una operacioacuten de corte de cubo

311 Servidores de Procesamiento Analiacutetico en Liacutenea

El servidor de procesamiento analiacutetico en liacutenea permite definir y navegar un modelo multidimensional El servidor de procesamiento analiacutetico en liacutenea es un administrador de base de datos especializado en el almacenamiento de cubos y en responder de manera optima a las operaciones sobre ellos El servidor de procesamiento analiacutetico en liacutenea puede ser implementado sobre un DBMS relacional (RDBMS) en cuyo caso se denomina servidor de procesamiento analiacutetico en liacutenea relacional (servidor ROLAP) Este servidor de procesamiento analiacutetico en liacutenea almacena los cubos en tablas relacionales y las operaciones sobre ellos se realizan con SQL o con un SQL extendido para manejar cubos Ademaacutes el RDBMS proporciona lagunas funcionalidades para implementar tanto los cubos como las operaciones sobre ellos por ejemplo las vistas materializadas o los iacutendices ldquobitmaprdquo Cuando se utiliza un servidor especializado para almacenar modelos de datos multidimensionales el servidor se conoce como servidor de procesamiento analiacutetico en liacutenea multidimensional (ldquoServidor MOLAPrdquo) el

cual almacena los datos multidimensionales directamente en estructuras de datos especiales (arreglos) e implementa las operaciones de procesamiento analiacutetico en liacutenea sobre esas estructuras

Existe tambieacuten un tipo hiacutebrido de procesamiento analiacutetico llamado servidor de procesamiento analiacutetico en liacutenea hiacutebrido (HOLAP) que implementa las ventajas de ROLAP y MOLAP utilizando cubos en MOLAP y cuando se quiere ir al detalle de la informacioacuten utiliza la que se encuentran en tablas de relaciones

En cualquiera de los tres casos es necesario almacenar tres tipos de datos datos de tabla de hechos (las transacciones) los agregados y las dimensiones

En un servidor ROLAP cada fila en una tabla de hechos tiene una columna para cada dimensioacuten y medida Las bases de datos MOLAP almacenan los datos de hechos en un formato multidimensional pero si hay muchas dimensiones estos datos estaraacuten dispersos y el formato multidimensional no tendraacute buen desempentildeo Un sistema HOLAP resuelve este problema dejando los datos de mayor granularidad en la base de datos relacional pero almacena los datos en un formato multidimensional

312 Utilizacioacuten de las Herramientas OLAP

Se dice que las herramientas de procesamiento analiacutetico en liacutenea son de naturaleza reactiva puesto que el trabajador de conocimiento o analista la utilizaraacute para ver lo que ha pasado e identificaraacute indicadores que le permitan corregir el rumbo por ejemplo si al darse cuenta que la tendencia ha sido comprar en ldquointernetrdquo probablemente deberiacutea revisar si estaacute recibiendo los descuentos que podriacutea obtener en libreriacuteas o valdriacutea la pena revisar cuanto estaacute pagando por gastos de enviacuteo para saber si realmente estaacute ahorrando

El procesamiento analiacutetico en liacutenea nos ofrece reportes y graacuteficos interactivos que si tuvieran que hacer a partir de las fuentes operacionales seria un proceso complejo de integracioacuten de datos que generariacutea resultados de poca precisioacuten y por lo tanto poca confiabilidad ademaacutes de que se invertiriacutea mucho tiempo en completar la construccioacuten de los reportes tiempo que seriacutea maacutes valioso si se empleara para analizar y tomar decisiones

32 Oracle OLAP

Las herramientas de generacioacuten de informes y consultas adhoc generalmente se despliegan utilizando datawarehouses y herramientas basadas en SQL mientras que aplicaciones maacutes sofisticadas de anaacutelisis y planificacioacuten se despliegan utilizando otras bases de datos y herramientas

Esta separacioacuten entre data warehouses y bases de datos analiacuteticas es sin embargo costosa El coste de mantenimiento de bases de datos separadas supone recursos adicionales hardware y administradores

Oracle elimina estas barreras proporcionando una base de datos preparada para el anaacutelisis Oracle OLAP parte de la base de datos Oracle proporciona la funcionalidad analiacutetica de una base de datos especializada a la vez que elimina la necesidad de gestionar bases de datos separadas

Oracle cambia el planteamiento tradicional ofreciendo una base de datos integrada relacional-multidimensional Oracle RDBMS-MDDS elimina la decisioacuten entre gestionabilidad y rendimiento-poder analiacutetico Oracle simplifica el proceso y reduce el coste de mantenimiento de los datos a la vez que se mantiene la habilidad de hacer complejas consultas analiacuteticas y proporciona un rendimiento excelente

Arquitectura con base de datos Oracle integrada

Oracle OLAP es parte de una plataforma integrada de data warehousing y business intelligence que contiene funcionalidad ETL OLAP y data mining en la base de datos Hay muchos beneficios derivados de tener una base de datos RDBMS-MDDS completamente integrada en comparacioacuten con bases de datos multidimensionales y separados

Gestioacuten maacutes simple Alta disponibilidad

Seguridad mejorada Acceso abierto desde clientes SQL y OLAP API

Ciclo de informacioacuten reducido Mayor fiabilidad de la informacioacuten

La base de datos relacional-multidimensional Oracle se compone de tres tecnologiacuteas

La tecnologiacutea relacional gestiona los objetos de base de datos y proporciona una interfaz SQL a los datos

La tecnologiacutea de objetos permite a la base de datos gestionar datos no relacionales

La tecnologiacutea OLAP proporciona funcionalidad analiacutetica avanzada en el contexto de un modelo multidimensional

Componentes Oracle Database OLAP

SQL puede acceder a datos multidimensionales a traveacutes de funciones de tabla o vistas relacionales Usando aplicaciones PLSQL SQL pueden interactuar directamente con el motor multidimensional

Todas las tecnologiacuteas mdash relacional objetos y OLAP mdash estaacuten contenidas en un solo proceso la base de datos se trata como una sola instancia integrada

Como la tecnologiacutea OLAP es parte de un solo proceso de base de datos proporciona la misma escalabilidad y fiabilidad que el proceso de base de datos Oracle

En Oracle todos los datos mdash relacional y multidimensional mdash se almacenan en los ficheros de datos Oracle No hay ficheros multidimensionales separados que debamos gestionar Los tipos de datos relacional y multidimensional pueden coexistir en los mismos ficheros de datos Los datos multidimensionales se almacenan en la base de datos en lo que se llaman analytic workspaces

Oracle OLAP esta basado en un modelo de datos multidimensional Eacuteste se presenta como un modelo loacutegico a traveacutes de las OLAP API y OLAP DML

MODELO LOacuteGICO EN LA OLAP API

El modelo multidimensional proporciona algunos beneficios al usuario de las aplicaciones analiacuteticas Los maacutes importantes son

o Es faacutecilmente entendible por los usuarios no expertos

o Proporciona el contexto para la seleccioacuten de datos

o Simplifica el proceso de definicioacuten de caacuteluclos hasta que usuarios no

expertos pueden usar el lenguaje de caacutelculo

El modelo multidimensional loacutegico se presenta a traveacutes de las OLAP API y OLAP DML con los siguientes elementos

Medidas

Dimensiones

Niveles

Jerarquiacuteas

Atributos

Una medida representa hechos Ventas en euros y ventas unitarias son ejemplos de medidas Una medida es anaacuteloga a una columna de hechos en una tabla de hechos pero el cataacutelogo OLAP proporciona meta datos maacutes completos para describirlo Las dimensiones proporcionan la estructura a los datos organizaacutendolos en niveles y jerarquiacuteas y proporcionaacutendoles atributos Algunos ejemplos de dimensiones son Producto Geografiacutea Tiempo etc

Como los analytic workspaces almacenan datos se necesita un modelo fiacutesico de base de datos para organizarlos datos Oracle OLAP usa un modelo multidimensional como base para el modelo fiacutesico en los analytic workspaces Este modelo proporciona beneficios importantes

o El modelo fuerza la integridad referencial Por ejemplo no es posible

que las medidas contengan claves que no referencien valores vaacutelidos en una dimensioacuten

o El modelo favorece la consistencia de datos al facilitar la reutilizacioacuten de

dimensiones con muacuteltiples medidas

o El orden de los miembros de las dimensiones se mantiene Esto

simplifica los caacutelculos como por ejemplo el anaacutelisis de series temporales Cuando el orden de los miembros de las dimensiones se mantiene las funciones pueden usar la posicioacuten de un miembro de una dimensioacuten por lo que se simplifica la definicioacuten de los caacutelculos y se reduce la necesidad de atributos dimensionales

o Toda la base de datos se presenta como precalculada sin tener en cuenta

si los datos se han precalculado o se calculan en tiempo ejecucioacuten Las aplicaciones no necesitan especificar reglas de agregacioacuten o joins cuando consultan la base de datos Las aplicaciones SQL no se preocupan de coacutemo los datos estaacuten precalculados simplemente consultan los datos

Oracle OLAP representa un cambio fundamental en la tecnologiacutea OLAP Las bases de datos relacionales y multidimensionales se han unido para proporcionar capacidades analiacuteticas propias de una base de datos multidimensional en el contexto de la base de datos Oracle

Todas estas ventajas se obtienen a la vez que se mantiene la potencia de un servidor OLAP dedicado Oracle OLAP proporciona un conjunto de funciones analiacuteticas a traveacutes de la OLAP API un motor multidimensional y un lenguaje de manipulacioacuten de datos OLAP El resultado es un sistema de menor coste maacutes seguro y fiable que da soporte a aplicaciones analiacuteticas de consulta y de generacioacuten de informes

33 Ejercicio con OLAP

Para realizar la practica de OLAP utilizaremos el software Pentaho lo primero que realizaremos seraacute Descargaremos un archivo desde internet llamando pentaho_demo_mysql Ya que trabajaremos con la base de datos de la unidad pasada El archivo descargado es una carpeta comprimida en la que vienen todos los archivos necesarios para que el portal funcione lo uacutenico que hay que hacer es descomprimir el archivo en el lugar en que mejor nos parezca

Una vez descomprimida la carpeta se debe establecer la contrasentildea de publicacioacuten en el portal Esto se hace entrando en el archivo CProgram Filespentaho_demo_mysql5-160GA863pentaho-demopentaho-solutionssystempublisher_configxml Y escribir la contrasentildea en medio de las etiquetas como se muestra en la figura

Este password se usara en el momento de publicar el cubo en el portal de Pentaho

Una vez realizado descomprimimos la carpeta proporcionada por la profesora y simplemente extraemos los archivos esta es una carpeta comprimida que no necesita proceso de instalacioacuten sino que solo es necesario descomprimirla en el lugar que uno prefiera En este caso se hizo en cProgram Files

Nota Antes de empezar el servicio de la base de datos debe estar activo

Lo primero que debe hacerse es subir el portal de Pentaho lo que se hace corriendo el archivo start-pentahobat que estaacute en la carpeta descomprimida

Una vez esteacute listo Pentaho se inicia el cube designer dando doble click sobra el icono de la carpeta que descomprimimos anteriormente

El primer paso es especificar el origen de los datos daacutendole un nombre seleccionando el driver seguacuten el motor que se esteacute usando en este caso es mySql y el usuario y el password que se usara en la conexioacuten

El siguiente paso es seleccionar los campos de la base de datos que seraacuten usados en el cubo Arrastrando las tablas que aparecen en la parte inferior izquierda y palomeando los atributos de cada tabla deseada

A continuacioacuten seleccionaremos el campo de la base de datos que contiene la unidad de medida que va a ser analizada en el cubo

Seguido de esto viene la creacioacuten de las dimensiones del cubo

Seleccionando el campo y dando clic en Add new dimension

Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo

Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456

Si es exitosa la publicacioacuten debe salir

Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe

Y se ingresa en NavigateSoluciones

Una vez alliacute entramos en Ejemplos de Anaacutelisis

Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos

El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten

Page 2: Unidad 3 tsbd olap

Esta implementacioacuten OLAP almacena los datos en una base de datos multidimensional Para optimizar los tiempos de respuesta el resumen de la informacioacuten es usualmente calculado por adelantado Estos valores precalculados o agregaciones son la base de las ganancias de desempentildeo de este sistema Algunos sistemas utilizan teacutecnicas de compresioacuten de datos para disminuir el espacio de almacenamiento en disco debido a los valores precalculados

HOLAP (Hybrid OLAP)

Almacena algunos datos en un motor relacional y otros en una base de datos multidimensional

Comparacioacuten

Cada sistema OLAP tiene ciertos beneficios (aunque existe desacuerdo acerca de las caracteriacutesticas especiacuteficas de los beneficios entre los proveedores)

Algunas implementaciones MOLAP son propensas a la explosioacuten de la base de datos este fenoacutemeno provoca la necesidad de grandes cantidades de espacio de almacenamiento para el uso de una base de datos MOLAP cuando se dan ciertas condiciones elevado nuacutemero de dimensiones resultados precalculados y escasos datos multidimensionales Las teacutecnicas habituales de atenuacioacuten de la explosioacuten de la base de datos no son todo lo eficientes que seriacutea deseable

Por lo general MOLAP ofrece mejor rendimiento debido a la especializada indexacioacuten y a las optimizaciones de almacenamiento MOLAP tambieacuten necesita menos espacio de almacenamiento en comparacioacuten con los especializados ROLAP porque su almacenamiento especializado normalmente incluye teacutecnicas de compresioacuten

ROLAP es generalmente maacutes escalable Sin embargo el gran volumen de reprocesamiento es difiacutecil de implementar eficientemente por lo que con frecuencia se omiten por tanto el rendimiento de una consulta ROLAP puede verse afectado

Desde la aparicioacuten de ROLAP van apareciendo nuevas versiones de bases de datos preparadas para realizar caacutelculos las funciones especializadas que se pueden utilizar tienen maacuteas limitaciones

HOLAP (OLAP Hiacutebrido) engloba un conjunto de teacutecnicas que tratan de combinar MOLAP y ROLAP de la mejor forma posible Generalmente puede pre-procesar raacutepidamente escala bien y proporciona una buena funcioacuten de apoyo

31 Procesamiento Analiacutetico en Liacutenea

En un almaceacuten de datos a diferencia de un OLTP se realizan operaciones de procesamiento analiacutetico en liacutenea (ldquoOLAP - On-Line Analytical Processingrdquo) cuya operacioacuten consiste principalmente de consultas sobre grandes voluacutemenes de datos y de

proveer una interfaz en liacutenea que ofrece reportes y graacuteficos El procesamiento analiacutetico en liacutenea es una tecnologiacutea que permite a los analistas y administradores visualizar y navegar los datos accediendo a una amplia variedad de vistas posibles de la informacioacuten de manera interactiva raacutepida y eficiente

Como parte de los servicios de explotacioacuten de una arquitectura de anaacutelisis de informacioacuten los datos tienen que ser modelados multidimensionalmente para satisfacer los requerimientos de desempentildeo de este tipo de consultas en liacutenea En este curso se hace una diferencia entre el concepto de almaceacuten de datos y los modelos de datos multidimensionales o cubos puesto que en la arquitectura propuesta los cubos se generan a partir de datos que ya se encuentran en el almaceacuten de datos creando redundancia en algunos casos pero ofreciendo al usuario la posibilidad de hacer consultas al almaceacuten de datos sin necesidad de conocer sobre cubos y su manipulacioacuten Otra opcioacuten arquitectural es que los cubos esteacuten almacenados en un repositorio de datos separado denominado un servidor de procesamiento analiacutetico en liacutenea y el almaceacuten de datos incluya los datos de detalle almacenados en forma de tablas

En las siguientes secciones se describiraacuten los conceptos sobre cubos servidores de procesamiento analiacutetico en liacutenea y la visualizacioacuten y navegacioacuten interactiva de modelos dimensionales

Modelos multidimensionales

Los modelos de datos multidimensionales se han estudiado exhaustivamente en esta seccioacuten se mencionaraacuten las definiciones maacutes importantes para estar en contexto

Un modelo de datos es una representacioacuten de los datos y sus relaciones con otros datos que se utiliza para conocer como se organizaraacuten los datos en bases de datos u otro medio de almacenaje y administracioacuten de datos Por ejemplo en el modelo de datos entidad relacioacuten (ER) uno puede conceptualizar cada entidad de datos sus atributos y sus relaciones En la figura 421 se tiene un modelo o diagrama ER de un sistema operacional para registro de pagos de impuestos de autos

Ejemplo de diagrama ER

Esquemas relacionales para modelado multidimensional

Un modelo de datos multidimensional o cubo es una coleccioacuten de medidas las cuales dependen de un conjunto de dimensiones es una representacioacuten de los datos que permite organizarlos en la forma de hechos dimensiones y agregados los hechos contienen medidas es decir la informacioacuten a nivel transaccioacuten que vamos a analizar por ejemplo compras ventas prestamos etc Las dimensiones contienen informacioacuten descriptiva de esas transacciones por ejemplo fecha cliente producto etc Un modelo multidimensional se utiliza para el anaacutelisis de informacioacuten

Los conceptos de dimensioacuten y hechos

La figura muestra el concepto de modelo multidimensional del tema ldquocomprasrdquo a la izquierda se muestran datos

transaccionales fuente de ejemplo a la derecha y abajo se tiene un diagrama de cubo donde hay 2 medidas a analizar la cantidad y el costo esos atributos o campos formaran la tabla de hechos del cubo y se analizaraacuten por 3 dimensiones

La dimensioacuten ldquoproductordquo que contiene los atributos del producto que se comproacute La dimensioacuten ldquoproveedorrdquo que contiene los atributos del proveedor a quien se le comproacute ese producto y finalmente la dimensioacuten ldquotiempordquo que contiene la fecha en la que se realizoacute esa transaccioacuten de compra

Se tienen diferentes esquemas relacionales para hacer el modelado multidimensional a continuacioacuten se describe cada uno de ellos

Esquemas para representar modelos multidimensionales

a) Modelo o esquema de estrella (ldquostar schemardquo) tradicional

El esquema de estrella es una teacutecnica de modelado de datos usada para hacer corresponder un modelo multidimensional a una base de datos relacional debe su nombre debido a que graacuteficamente parece una estrella El esquema de estrella tiene cuatro componentes hechos dimensiones atributos y jerarquiacuteas de atributos Los hechos y dimensiones son representados por tablas fiacutesicas en el almaceacuten de datos la tabla de hechos estaacute relacionada a cada dimensioacuten en una relacioacuten uno a muchos Las tablas de hechos y dimensiones estaacuten relacionadas por llaves foraacuteneas y estaacuten sujetas a las restricciones de las llaves foraacuteneas y primarias

Modelo de estrella con 3 dimensiones y una tabla de hechos

Para calcular el total de compras realizadas a proveedores de Internet el esquema de estrella tendriacutea que realizar estos pasos

1 De la dimensioacuten Proveedor seleccionar todos los proveedores donde el canal es Internet

2 De la tabla de hechos seleccionar y calcular la suma de todas las cantidades y costos de las transacciones de compra a los proveedores del paso 1

b) Modelo de copo de nieve (ldquosnow flake schemardquo)

El esquema de copo de nieve es una variacioacuten de la estrella tradicional lo que se hace es que en cada dimensioacuten se almacenan jerarquiacuteas de atributos o bien simplemente se separan atributos en otra entidad por razones de desempentildeo y mejor utilizacioacuten del espacio En la figura 425 la dimensioacuten producto se ha modificado separando sus datos generales de sus otras caracteriacutesticas

Modelo de copo de nieve

b) Modelo de constelaciones

El modelo de constelaciones nuevamente es una variacioacuten del esquema de estrella tradicional en este modelo algunos atributos de las dimensiones se separan

formando una nueva entidad que puede ser compartida con otros cubos es decir pueden ser dimensiones de otros cubos (ver la figura 426) La utilidad principal de este modelo es que al tener dimensiones que puede ser compartidas por diferentes cubos se tendraacute un mejor uso del espacio de almacenamiento evitando la redundancia

Esquema de constelaciones

Operaciones con cubos

Una vez que se tienen los cubos se puede realizar diferentes operaciones sobre ellos para visualizar y analizar la informacioacuten las operaciones son

a) Generalizar y especializar o como en la bibliografiacutea se conoce abstraccioacuten y concrecioacuten (generalizar y especializar)

b) Corte y corte de cubos (ldquoSlice amp Dicerdquo)

c) Filtrar

d) Pivotear

Estas operaciones se realizan sobre los cubos (ldquocubingrdquo) y generan como resultados sub-cubos llamados ldquocuboidesrdquo

La especializacioacuten y la generalizacioacuten son operaciones que sirven para navegar un cubo sobre sus dimensiones Las dimensiones que ofrecen diferentes niveles de abstraccioacuten podraacuten ser navegables por ejemplo supongamos que tenemos la dimensioacuten tiempo que tiene los nivel de abstraccioacuten antildeo semestre mes semana y diacutea una operacioacuten de especializacioacuten nos permitiraacute interactivamente visualizar los hechos desde el agregado total por antildeo e ir descendiendo hasta el detalle por diacutea la operacioacuten generalizar permitiraacute lo contrario desde cualquier nivel podraacute generalizar a un nivel superior por ejemplo de semana a mes En resumen las operaciones especializar y generalizar realizan el proceso siguiente

Detalle 1048774 GENERALIZACION 1048774 Alto nivel - generalizar

Alto nivel 1048774 ESPECIALIZACION 1048774 Detalle - especializar

Operaciones sobre cubos especializar y generalizar

Las operaciones de corte y corte de cubo sirven para ver subconjuntos de cubos es maacutes se dice que como resultado generan ldquosubcubosrdquo o ldquocuboidesrdquo La operacioacuten ldquocorterdquo como la palabra lo indica es una operacioacuten que genera una rebanada del cubo por ejemplo si de una dimensioacuten tiempo de un cubo uacutenicamente tomamos el mes de ldquoMarzordquo y dejamos ver el resto de las dimensiones entonces tendremos la rebanada o corte que corresponde al mes de ldquoMarzordquo Si ademaacutes de eso condicionamos la dimensioacuten ldquoproveedorrdquo seleccionando el proveedor ldquoXrdquo de un cubo de ldquocomprasrdquo entonces estaremos obteniendo un ldquosubcubordquo este uacuteltimo es el resultado de una operacioacuten de corte de cubo

311 Servidores de Procesamiento Analiacutetico en Liacutenea

El servidor de procesamiento analiacutetico en liacutenea permite definir y navegar un modelo multidimensional El servidor de procesamiento analiacutetico en liacutenea es un administrador de base de datos especializado en el almacenamiento de cubos y en responder de manera optima a las operaciones sobre ellos El servidor de procesamiento analiacutetico en liacutenea puede ser implementado sobre un DBMS relacional (RDBMS) en cuyo caso se denomina servidor de procesamiento analiacutetico en liacutenea relacional (servidor ROLAP) Este servidor de procesamiento analiacutetico en liacutenea almacena los cubos en tablas relacionales y las operaciones sobre ellos se realizan con SQL o con un SQL extendido para manejar cubos Ademaacutes el RDBMS proporciona lagunas funcionalidades para implementar tanto los cubos como las operaciones sobre ellos por ejemplo las vistas materializadas o los iacutendices ldquobitmaprdquo Cuando se utiliza un servidor especializado para almacenar modelos de datos multidimensionales el servidor se conoce como servidor de procesamiento analiacutetico en liacutenea multidimensional (ldquoServidor MOLAPrdquo) el

cual almacena los datos multidimensionales directamente en estructuras de datos especiales (arreglos) e implementa las operaciones de procesamiento analiacutetico en liacutenea sobre esas estructuras

Existe tambieacuten un tipo hiacutebrido de procesamiento analiacutetico llamado servidor de procesamiento analiacutetico en liacutenea hiacutebrido (HOLAP) que implementa las ventajas de ROLAP y MOLAP utilizando cubos en MOLAP y cuando se quiere ir al detalle de la informacioacuten utiliza la que se encuentran en tablas de relaciones

En cualquiera de los tres casos es necesario almacenar tres tipos de datos datos de tabla de hechos (las transacciones) los agregados y las dimensiones

En un servidor ROLAP cada fila en una tabla de hechos tiene una columna para cada dimensioacuten y medida Las bases de datos MOLAP almacenan los datos de hechos en un formato multidimensional pero si hay muchas dimensiones estos datos estaraacuten dispersos y el formato multidimensional no tendraacute buen desempentildeo Un sistema HOLAP resuelve este problema dejando los datos de mayor granularidad en la base de datos relacional pero almacena los datos en un formato multidimensional

312 Utilizacioacuten de las Herramientas OLAP

Se dice que las herramientas de procesamiento analiacutetico en liacutenea son de naturaleza reactiva puesto que el trabajador de conocimiento o analista la utilizaraacute para ver lo que ha pasado e identificaraacute indicadores que le permitan corregir el rumbo por ejemplo si al darse cuenta que la tendencia ha sido comprar en ldquointernetrdquo probablemente deberiacutea revisar si estaacute recibiendo los descuentos que podriacutea obtener en libreriacuteas o valdriacutea la pena revisar cuanto estaacute pagando por gastos de enviacuteo para saber si realmente estaacute ahorrando

El procesamiento analiacutetico en liacutenea nos ofrece reportes y graacuteficos interactivos que si tuvieran que hacer a partir de las fuentes operacionales seria un proceso complejo de integracioacuten de datos que generariacutea resultados de poca precisioacuten y por lo tanto poca confiabilidad ademaacutes de que se invertiriacutea mucho tiempo en completar la construccioacuten de los reportes tiempo que seriacutea maacutes valioso si se empleara para analizar y tomar decisiones

32 Oracle OLAP

Las herramientas de generacioacuten de informes y consultas adhoc generalmente se despliegan utilizando datawarehouses y herramientas basadas en SQL mientras que aplicaciones maacutes sofisticadas de anaacutelisis y planificacioacuten se despliegan utilizando otras bases de datos y herramientas

Esta separacioacuten entre data warehouses y bases de datos analiacuteticas es sin embargo costosa El coste de mantenimiento de bases de datos separadas supone recursos adicionales hardware y administradores

Oracle elimina estas barreras proporcionando una base de datos preparada para el anaacutelisis Oracle OLAP parte de la base de datos Oracle proporciona la funcionalidad analiacutetica de una base de datos especializada a la vez que elimina la necesidad de gestionar bases de datos separadas

Oracle cambia el planteamiento tradicional ofreciendo una base de datos integrada relacional-multidimensional Oracle RDBMS-MDDS elimina la decisioacuten entre gestionabilidad y rendimiento-poder analiacutetico Oracle simplifica el proceso y reduce el coste de mantenimiento de los datos a la vez que se mantiene la habilidad de hacer complejas consultas analiacuteticas y proporciona un rendimiento excelente

Arquitectura con base de datos Oracle integrada

Oracle OLAP es parte de una plataforma integrada de data warehousing y business intelligence que contiene funcionalidad ETL OLAP y data mining en la base de datos Hay muchos beneficios derivados de tener una base de datos RDBMS-MDDS completamente integrada en comparacioacuten con bases de datos multidimensionales y separados

Gestioacuten maacutes simple Alta disponibilidad

Seguridad mejorada Acceso abierto desde clientes SQL y OLAP API

Ciclo de informacioacuten reducido Mayor fiabilidad de la informacioacuten

La base de datos relacional-multidimensional Oracle se compone de tres tecnologiacuteas

La tecnologiacutea relacional gestiona los objetos de base de datos y proporciona una interfaz SQL a los datos

La tecnologiacutea de objetos permite a la base de datos gestionar datos no relacionales

La tecnologiacutea OLAP proporciona funcionalidad analiacutetica avanzada en el contexto de un modelo multidimensional

Componentes Oracle Database OLAP

SQL puede acceder a datos multidimensionales a traveacutes de funciones de tabla o vistas relacionales Usando aplicaciones PLSQL SQL pueden interactuar directamente con el motor multidimensional

Todas las tecnologiacuteas mdash relacional objetos y OLAP mdash estaacuten contenidas en un solo proceso la base de datos se trata como una sola instancia integrada

Como la tecnologiacutea OLAP es parte de un solo proceso de base de datos proporciona la misma escalabilidad y fiabilidad que el proceso de base de datos Oracle

En Oracle todos los datos mdash relacional y multidimensional mdash se almacenan en los ficheros de datos Oracle No hay ficheros multidimensionales separados que debamos gestionar Los tipos de datos relacional y multidimensional pueden coexistir en los mismos ficheros de datos Los datos multidimensionales se almacenan en la base de datos en lo que se llaman analytic workspaces

Oracle OLAP esta basado en un modelo de datos multidimensional Eacuteste se presenta como un modelo loacutegico a traveacutes de las OLAP API y OLAP DML

MODELO LOacuteGICO EN LA OLAP API

El modelo multidimensional proporciona algunos beneficios al usuario de las aplicaciones analiacuteticas Los maacutes importantes son

o Es faacutecilmente entendible por los usuarios no expertos

o Proporciona el contexto para la seleccioacuten de datos

o Simplifica el proceso de definicioacuten de caacuteluclos hasta que usuarios no

expertos pueden usar el lenguaje de caacutelculo

El modelo multidimensional loacutegico se presenta a traveacutes de las OLAP API y OLAP DML con los siguientes elementos

Medidas

Dimensiones

Niveles

Jerarquiacuteas

Atributos

Una medida representa hechos Ventas en euros y ventas unitarias son ejemplos de medidas Una medida es anaacuteloga a una columna de hechos en una tabla de hechos pero el cataacutelogo OLAP proporciona meta datos maacutes completos para describirlo Las dimensiones proporcionan la estructura a los datos organizaacutendolos en niveles y jerarquiacuteas y proporcionaacutendoles atributos Algunos ejemplos de dimensiones son Producto Geografiacutea Tiempo etc

Como los analytic workspaces almacenan datos se necesita un modelo fiacutesico de base de datos para organizarlos datos Oracle OLAP usa un modelo multidimensional como base para el modelo fiacutesico en los analytic workspaces Este modelo proporciona beneficios importantes

o El modelo fuerza la integridad referencial Por ejemplo no es posible

que las medidas contengan claves que no referencien valores vaacutelidos en una dimensioacuten

o El modelo favorece la consistencia de datos al facilitar la reutilizacioacuten de

dimensiones con muacuteltiples medidas

o El orden de los miembros de las dimensiones se mantiene Esto

simplifica los caacutelculos como por ejemplo el anaacutelisis de series temporales Cuando el orden de los miembros de las dimensiones se mantiene las funciones pueden usar la posicioacuten de un miembro de una dimensioacuten por lo que se simplifica la definicioacuten de los caacutelculos y se reduce la necesidad de atributos dimensionales

o Toda la base de datos se presenta como precalculada sin tener en cuenta

si los datos se han precalculado o se calculan en tiempo ejecucioacuten Las aplicaciones no necesitan especificar reglas de agregacioacuten o joins cuando consultan la base de datos Las aplicaciones SQL no se preocupan de coacutemo los datos estaacuten precalculados simplemente consultan los datos

Oracle OLAP representa un cambio fundamental en la tecnologiacutea OLAP Las bases de datos relacionales y multidimensionales se han unido para proporcionar capacidades analiacuteticas propias de una base de datos multidimensional en el contexto de la base de datos Oracle

Todas estas ventajas se obtienen a la vez que se mantiene la potencia de un servidor OLAP dedicado Oracle OLAP proporciona un conjunto de funciones analiacuteticas a traveacutes de la OLAP API un motor multidimensional y un lenguaje de manipulacioacuten de datos OLAP El resultado es un sistema de menor coste maacutes seguro y fiable que da soporte a aplicaciones analiacuteticas de consulta y de generacioacuten de informes

33 Ejercicio con OLAP

Para realizar la practica de OLAP utilizaremos el software Pentaho lo primero que realizaremos seraacute Descargaremos un archivo desde internet llamando pentaho_demo_mysql Ya que trabajaremos con la base de datos de la unidad pasada El archivo descargado es una carpeta comprimida en la que vienen todos los archivos necesarios para que el portal funcione lo uacutenico que hay que hacer es descomprimir el archivo en el lugar en que mejor nos parezca

Una vez descomprimida la carpeta se debe establecer la contrasentildea de publicacioacuten en el portal Esto se hace entrando en el archivo CProgram Filespentaho_demo_mysql5-160GA863pentaho-demopentaho-solutionssystempublisher_configxml Y escribir la contrasentildea en medio de las etiquetas como se muestra en la figura

Este password se usara en el momento de publicar el cubo en el portal de Pentaho

Una vez realizado descomprimimos la carpeta proporcionada por la profesora y simplemente extraemos los archivos esta es una carpeta comprimida que no necesita proceso de instalacioacuten sino que solo es necesario descomprimirla en el lugar que uno prefiera En este caso se hizo en cProgram Files

Nota Antes de empezar el servicio de la base de datos debe estar activo

Lo primero que debe hacerse es subir el portal de Pentaho lo que se hace corriendo el archivo start-pentahobat que estaacute en la carpeta descomprimida

Una vez esteacute listo Pentaho se inicia el cube designer dando doble click sobra el icono de la carpeta que descomprimimos anteriormente

El primer paso es especificar el origen de los datos daacutendole un nombre seleccionando el driver seguacuten el motor que se esteacute usando en este caso es mySql y el usuario y el password que se usara en la conexioacuten

El siguiente paso es seleccionar los campos de la base de datos que seraacuten usados en el cubo Arrastrando las tablas que aparecen en la parte inferior izquierda y palomeando los atributos de cada tabla deseada

A continuacioacuten seleccionaremos el campo de la base de datos que contiene la unidad de medida que va a ser analizada en el cubo

Seguido de esto viene la creacioacuten de las dimensiones del cubo

Seleccionando el campo y dando clic en Add new dimension

Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo

Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456

Si es exitosa la publicacioacuten debe salir

Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe

Y se ingresa en NavigateSoluciones

Una vez alliacute entramos en Ejemplos de Anaacutelisis

Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos

El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten

Page 3: Unidad 3 tsbd olap

proveer una interfaz en liacutenea que ofrece reportes y graacuteficos El procesamiento analiacutetico en liacutenea es una tecnologiacutea que permite a los analistas y administradores visualizar y navegar los datos accediendo a una amplia variedad de vistas posibles de la informacioacuten de manera interactiva raacutepida y eficiente

Como parte de los servicios de explotacioacuten de una arquitectura de anaacutelisis de informacioacuten los datos tienen que ser modelados multidimensionalmente para satisfacer los requerimientos de desempentildeo de este tipo de consultas en liacutenea En este curso se hace una diferencia entre el concepto de almaceacuten de datos y los modelos de datos multidimensionales o cubos puesto que en la arquitectura propuesta los cubos se generan a partir de datos que ya se encuentran en el almaceacuten de datos creando redundancia en algunos casos pero ofreciendo al usuario la posibilidad de hacer consultas al almaceacuten de datos sin necesidad de conocer sobre cubos y su manipulacioacuten Otra opcioacuten arquitectural es que los cubos esteacuten almacenados en un repositorio de datos separado denominado un servidor de procesamiento analiacutetico en liacutenea y el almaceacuten de datos incluya los datos de detalle almacenados en forma de tablas

En las siguientes secciones se describiraacuten los conceptos sobre cubos servidores de procesamiento analiacutetico en liacutenea y la visualizacioacuten y navegacioacuten interactiva de modelos dimensionales

Modelos multidimensionales

Los modelos de datos multidimensionales se han estudiado exhaustivamente en esta seccioacuten se mencionaraacuten las definiciones maacutes importantes para estar en contexto

Un modelo de datos es una representacioacuten de los datos y sus relaciones con otros datos que se utiliza para conocer como se organizaraacuten los datos en bases de datos u otro medio de almacenaje y administracioacuten de datos Por ejemplo en el modelo de datos entidad relacioacuten (ER) uno puede conceptualizar cada entidad de datos sus atributos y sus relaciones En la figura 421 se tiene un modelo o diagrama ER de un sistema operacional para registro de pagos de impuestos de autos

Ejemplo de diagrama ER

Esquemas relacionales para modelado multidimensional

Un modelo de datos multidimensional o cubo es una coleccioacuten de medidas las cuales dependen de un conjunto de dimensiones es una representacioacuten de los datos que permite organizarlos en la forma de hechos dimensiones y agregados los hechos contienen medidas es decir la informacioacuten a nivel transaccioacuten que vamos a analizar por ejemplo compras ventas prestamos etc Las dimensiones contienen informacioacuten descriptiva de esas transacciones por ejemplo fecha cliente producto etc Un modelo multidimensional se utiliza para el anaacutelisis de informacioacuten

Los conceptos de dimensioacuten y hechos

La figura muestra el concepto de modelo multidimensional del tema ldquocomprasrdquo a la izquierda se muestran datos

transaccionales fuente de ejemplo a la derecha y abajo se tiene un diagrama de cubo donde hay 2 medidas a analizar la cantidad y el costo esos atributos o campos formaran la tabla de hechos del cubo y se analizaraacuten por 3 dimensiones

La dimensioacuten ldquoproductordquo que contiene los atributos del producto que se comproacute La dimensioacuten ldquoproveedorrdquo que contiene los atributos del proveedor a quien se le comproacute ese producto y finalmente la dimensioacuten ldquotiempordquo que contiene la fecha en la que se realizoacute esa transaccioacuten de compra

Se tienen diferentes esquemas relacionales para hacer el modelado multidimensional a continuacioacuten se describe cada uno de ellos

Esquemas para representar modelos multidimensionales

a) Modelo o esquema de estrella (ldquostar schemardquo) tradicional

El esquema de estrella es una teacutecnica de modelado de datos usada para hacer corresponder un modelo multidimensional a una base de datos relacional debe su nombre debido a que graacuteficamente parece una estrella El esquema de estrella tiene cuatro componentes hechos dimensiones atributos y jerarquiacuteas de atributos Los hechos y dimensiones son representados por tablas fiacutesicas en el almaceacuten de datos la tabla de hechos estaacute relacionada a cada dimensioacuten en una relacioacuten uno a muchos Las tablas de hechos y dimensiones estaacuten relacionadas por llaves foraacuteneas y estaacuten sujetas a las restricciones de las llaves foraacuteneas y primarias

Modelo de estrella con 3 dimensiones y una tabla de hechos

Para calcular el total de compras realizadas a proveedores de Internet el esquema de estrella tendriacutea que realizar estos pasos

1 De la dimensioacuten Proveedor seleccionar todos los proveedores donde el canal es Internet

2 De la tabla de hechos seleccionar y calcular la suma de todas las cantidades y costos de las transacciones de compra a los proveedores del paso 1

b) Modelo de copo de nieve (ldquosnow flake schemardquo)

El esquema de copo de nieve es una variacioacuten de la estrella tradicional lo que se hace es que en cada dimensioacuten se almacenan jerarquiacuteas de atributos o bien simplemente se separan atributos en otra entidad por razones de desempentildeo y mejor utilizacioacuten del espacio En la figura 425 la dimensioacuten producto se ha modificado separando sus datos generales de sus otras caracteriacutesticas

Modelo de copo de nieve

b) Modelo de constelaciones

El modelo de constelaciones nuevamente es una variacioacuten del esquema de estrella tradicional en este modelo algunos atributos de las dimensiones se separan

formando una nueva entidad que puede ser compartida con otros cubos es decir pueden ser dimensiones de otros cubos (ver la figura 426) La utilidad principal de este modelo es que al tener dimensiones que puede ser compartidas por diferentes cubos se tendraacute un mejor uso del espacio de almacenamiento evitando la redundancia

Esquema de constelaciones

Operaciones con cubos

Una vez que se tienen los cubos se puede realizar diferentes operaciones sobre ellos para visualizar y analizar la informacioacuten las operaciones son

a) Generalizar y especializar o como en la bibliografiacutea se conoce abstraccioacuten y concrecioacuten (generalizar y especializar)

b) Corte y corte de cubos (ldquoSlice amp Dicerdquo)

c) Filtrar

d) Pivotear

Estas operaciones se realizan sobre los cubos (ldquocubingrdquo) y generan como resultados sub-cubos llamados ldquocuboidesrdquo

La especializacioacuten y la generalizacioacuten son operaciones que sirven para navegar un cubo sobre sus dimensiones Las dimensiones que ofrecen diferentes niveles de abstraccioacuten podraacuten ser navegables por ejemplo supongamos que tenemos la dimensioacuten tiempo que tiene los nivel de abstraccioacuten antildeo semestre mes semana y diacutea una operacioacuten de especializacioacuten nos permitiraacute interactivamente visualizar los hechos desde el agregado total por antildeo e ir descendiendo hasta el detalle por diacutea la operacioacuten generalizar permitiraacute lo contrario desde cualquier nivel podraacute generalizar a un nivel superior por ejemplo de semana a mes En resumen las operaciones especializar y generalizar realizan el proceso siguiente

Detalle 1048774 GENERALIZACION 1048774 Alto nivel - generalizar

Alto nivel 1048774 ESPECIALIZACION 1048774 Detalle - especializar

Operaciones sobre cubos especializar y generalizar

Las operaciones de corte y corte de cubo sirven para ver subconjuntos de cubos es maacutes se dice que como resultado generan ldquosubcubosrdquo o ldquocuboidesrdquo La operacioacuten ldquocorterdquo como la palabra lo indica es una operacioacuten que genera una rebanada del cubo por ejemplo si de una dimensioacuten tiempo de un cubo uacutenicamente tomamos el mes de ldquoMarzordquo y dejamos ver el resto de las dimensiones entonces tendremos la rebanada o corte que corresponde al mes de ldquoMarzordquo Si ademaacutes de eso condicionamos la dimensioacuten ldquoproveedorrdquo seleccionando el proveedor ldquoXrdquo de un cubo de ldquocomprasrdquo entonces estaremos obteniendo un ldquosubcubordquo este uacuteltimo es el resultado de una operacioacuten de corte de cubo

311 Servidores de Procesamiento Analiacutetico en Liacutenea

El servidor de procesamiento analiacutetico en liacutenea permite definir y navegar un modelo multidimensional El servidor de procesamiento analiacutetico en liacutenea es un administrador de base de datos especializado en el almacenamiento de cubos y en responder de manera optima a las operaciones sobre ellos El servidor de procesamiento analiacutetico en liacutenea puede ser implementado sobre un DBMS relacional (RDBMS) en cuyo caso se denomina servidor de procesamiento analiacutetico en liacutenea relacional (servidor ROLAP) Este servidor de procesamiento analiacutetico en liacutenea almacena los cubos en tablas relacionales y las operaciones sobre ellos se realizan con SQL o con un SQL extendido para manejar cubos Ademaacutes el RDBMS proporciona lagunas funcionalidades para implementar tanto los cubos como las operaciones sobre ellos por ejemplo las vistas materializadas o los iacutendices ldquobitmaprdquo Cuando se utiliza un servidor especializado para almacenar modelos de datos multidimensionales el servidor se conoce como servidor de procesamiento analiacutetico en liacutenea multidimensional (ldquoServidor MOLAPrdquo) el

cual almacena los datos multidimensionales directamente en estructuras de datos especiales (arreglos) e implementa las operaciones de procesamiento analiacutetico en liacutenea sobre esas estructuras

Existe tambieacuten un tipo hiacutebrido de procesamiento analiacutetico llamado servidor de procesamiento analiacutetico en liacutenea hiacutebrido (HOLAP) que implementa las ventajas de ROLAP y MOLAP utilizando cubos en MOLAP y cuando se quiere ir al detalle de la informacioacuten utiliza la que se encuentran en tablas de relaciones

En cualquiera de los tres casos es necesario almacenar tres tipos de datos datos de tabla de hechos (las transacciones) los agregados y las dimensiones

En un servidor ROLAP cada fila en una tabla de hechos tiene una columna para cada dimensioacuten y medida Las bases de datos MOLAP almacenan los datos de hechos en un formato multidimensional pero si hay muchas dimensiones estos datos estaraacuten dispersos y el formato multidimensional no tendraacute buen desempentildeo Un sistema HOLAP resuelve este problema dejando los datos de mayor granularidad en la base de datos relacional pero almacena los datos en un formato multidimensional

312 Utilizacioacuten de las Herramientas OLAP

Se dice que las herramientas de procesamiento analiacutetico en liacutenea son de naturaleza reactiva puesto que el trabajador de conocimiento o analista la utilizaraacute para ver lo que ha pasado e identificaraacute indicadores que le permitan corregir el rumbo por ejemplo si al darse cuenta que la tendencia ha sido comprar en ldquointernetrdquo probablemente deberiacutea revisar si estaacute recibiendo los descuentos que podriacutea obtener en libreriacuteas o valdriacutea la pena revisar cuanto estaacute pagando por gastos de enviacuteo para saber si realmente estaacute ahorrando

El procesamiento analiacutetico en liacutenea nos ofrece reportes y graacuteficos interactivos que si tuvieran que hacer a partir de las fuentes operacionales seria un proceso complejo de integracioacuten de datos que generariacutea resultados de poca precisioacuten y por lo tanto poca confiabilidad ademaacutes de que se invertiriacutea mucho tiempo en completar la construccioacuten de los reportes tiempo que seriacutea maacutes valioso si se empleara para analizar y tomar decisiones

32 Oracle OLAP

Las herramientas de generacioacuten de informes y consultas adhoc generalmente se despliegan utilizando datawarehouses y herramientas basadas en SQL mientras que aplicaciones maacutes sofisticadas de anaacutelisis y planificacioacuten se despliegan utilizando otras bases de datos y herramientas

Esta separacioacuten entre data warehouses y bases de datos analiacuteticas es sin embargo costosa El coste de mantenimiento de bases de datos separadas supone recursos adicionales hardware y administradores

Oracle elimina estas barreras proporcionando una base de datos preparada para el anaacutelisis Oracle OLAP parte de la base de datos Oracle proporciona la funcionalidad analiacutetica de una base de datos especializada a la vez que elimina la necesidad de gestionar bases de datos separadas

Oracle cambia el planteamiento tradicional ofreciendo una base de datos integrada relacional-multidimensional Oracle RDBMS-MDDS elimina la decisioacuten entre gestionabilidad y rendimiento-poder analiacutetico Oracle simplifica el proceso y reduce el coste de mantenimiento de los datos a la vez que se mantiene la habilidad de hacer complejas consultas analiacuteticas y proporciona un rendimiento excelente

Arquitectura con base de datos Oracle integrada

Oracle OLAP es parte de una plataforma integrada de data warehousing y business intelligence que contiene funcionalidad ETL OLAP y data mining en la base de datos Hay muchos beneficios derivados de tener una base de datos RDBMS-MDDS completamente integrada en comparacioacuten con bases de datos multidimensionales y separados

Gestioacuten maacutes simple Alta disponibilidad

Seguridad mejorada Acceso abierto desde clientes SQL y OLAP API

Ciclo de informacioacuten reducido Mayor fiabilidad de la informacioacuten

La base de datos relacional-multidimensional Oracle se compone de tres tecnologiacuteas

La tecnologiacutea relacional gestiona los objetos de base de datos y proporciona una interfaz SQL a los datos

La tecnologiacutea de objetos permite a la base de datos gestionar datos no relacionales

La tecnologiacutea OLAP proporciona funcionalidad analiacutetica avanzada en el contexto de un modelo multidimensional

Componentes Oracle Database OLAP

SQL puede acceder a datos multidimensionales a traveacutes de funciones de tabla o vistas relacionales Usando aplicaciones PLSQL SQL pueden interactuar directamente con el motor multidimensional

Todas las tecnologiacuteas mdash relacional objetos y OLAP mdash estaacuten contenidas en un solo proceso la base de datos se trata como una sola instancia integrada

Como la tecnologiacutea OLAP es parte de un solo proceso de base de datos proporciona la misma escalabilidad y fiabilidad que el proceso de base de datos Oracle

En Oracle todos los datos mdash relacional y multidimensional mdash se almacenan en los ficheros de datos Oracle No hay ficheros multidimensionales separados que debamos gestionar Los tipos de datos relacional y multidimensional pueden coexistir en los mismos ficheros de datos Los datos multidimensionales se almacenan en la base de datos en lo que se llaman analytic workspaces

Oracle OLAP esta basado en un modelo de datos multidimensional Eacuteste se presenta como un modelo loacutegico a traveacutes de las OLAP API y OLAP DML

MODELO LOacuteGICO EN LA OLAP API

El modelo multidimensional proporciona algunos beneficios al usuario de las aplicaciones analiacuteticas Los maacutes importantes son

o Es faacutecilmente entendible por los usuarios no expertos

o Proporciona el contexto para la seleccioacuten de datos

o Simplifica el proceso de definicioacuten de caacuteluclos hasta que usuarios no

expertos pueden usar el lenguaje de caacutelculo

El modelo multidimensional loacutegico se presenta a traveacutes de las OLAP API y OLAP DML con los siguientes elementos

Medidas

Dimensiones

Niveles

Jerarquiacuteas

Atributos

Una medida representa hechos Ventas en euros y ventas unitarias son ejemplos de medidas Una medida es anaacuteloga a una columna de hechos en una tabla de hechos pero el cataacutelogo OLAP proporciona meta datos maacutes completos para describirlo Las dimensiones proporcionan la estructura a los datos organizaacutendolos en niveles y jerarquiacuteas y proporcionaacutendoles atributos Algunos ejemplos de dimensiones son Producto Geografiacutea Tiempo etc

Como los analytic workspaces almacenan datos se necesita un modelo fiacutesico de base de datos para organizarlos datos Oracle OLAP usa un modelo multidimensional como base para el modelo fiacutesico en los analytic workspaces Este modelo proporciona beneficios importantes

o El modelo fuerza la integridad referencial Por ejemplo no es posible

que las medidas contengan claves que no referencien valores vaacutelidos en una dimensioacuten

o El modelo favorece la consistencia de datos al facilitar la reutilizacioacuten de

dimensiones con muacuteltiples medidas

o El orden de los miembros de las dimensiones se mantiene Esto

simplifica los caacutelculos como por ejemplo el anaacutelisis de series temporales Cuando el orden de los miembros de las dimensiones se mantiene las funciones pueden usar la posicioacuten de un miembro de una dimensioacuten por lo que se simplifica la definicioacuten de los caacutelculos y se reduce la necesidad de atributos dimensionales

o Toda la base de datos se presenta como precalculada sin tener en cuenta

si los datos se han precalculado o se calculan en tiempo ejecucioacuten Las aplicaciones no necesitan especificar reglas de agregacioacuten o joins cuando consultan la base de datos Las aplicaciones SQL no se preocupan de coacutemo los datos estaacuten precalculados simplemente consultan los datos

Oracle OLAP representa un cambio fundamental en la tecnologiacutea OLAP Las bases de datos relacionales y multidimensionales se han unido para proporcionar capacidades analiacuteticas propias de una base de datos multidimensional en el contexto de la base de datos Oracle

Todas estas ventajas se obtienen a la vez que se mantiene la potencia de un servidor OLAP dedicado Oracle OLAP proporciona un conjunto de funciones analiacuteticas a traveacutes de la OLAP API un motor multidimensional y un lenguaje de manipulacioacuten de datos OLAP El resultado es un sistema de menor coste maacutes seguro y fiable que da soporte a aplicaciones analiacuteticas de consulta y de generacioacuten de informes

33 Ejercicio con OLAP

Para realizar la practica de OLAP utilizaremos el software Pentaho lo primero que realizaremos seraacute Descargaremos un archivo desde internet llamando pentaho_demo_mysql Ya que trabajaremos con la base de datos de la unidad pasada El archivo descargado es una carpeta comprimida en la que vienen todos los archivos necesarios para que el portal funcione lo uacutenico que hay que hacer es descomprimir el archivo en el lugar en que mejor nos parezca

Una vez descomprimida la carpeta se debe establecer la contrasentildea de publicacioacuten en el portal Esto se hace entrando en el archivo CProgram Filespentaho_demo_mysql5-160GA863pentaho-demopentaho-solutionssystempublisher_configxml Y escribir la contrasentildea en medio de las etiquetas como se muestra en la figura

Este password se usara en el momento de publicar el cubo en el portal de Pentaho

Una vez realizado descomprimimos la carpeta proporcionada por la profesora y simplemente extraemos los archivos esta es una carpeta comprimida que no necesita proceso de instalacioacuten sino que solo es necesario descomprimirla en el lugar que uno prefiera En este caso se hizo en cProgram Files

Nota Antes de empezar el servicio de la base de datos debe estar activo

Lo primero que debe hacerse es subir el portal de Pentaho lo que se hace corriendo el archivo start-pentahobat que estaacute en la carpeta descomprimida

Una vez esteacute listo Pentaho se inicia el cube designer dando doble click sobra el icono de la carpeta que descomprimimos anteriormente

El primer paso es especificar el origen de los datos daacutendole un nombre seleccionando el driver seguacuten el motor que se esteacute usando en este caso es mySql y el usuario y el password que se usara en la conexioacuten

El siguiente paso es seleccionar los campos de la base de datos que seraacuten usados en el cubo Arrastrando las tablas que aparecen en la parte inferior izquierda y palomeando los atributos de cada tabla deseada

A continuacioacuten seleccionaremos el campo de la base de datos que contiene la unidad de medida que va a ser analizada en el cubo

Seguido de esto viene la creacioacuten de las dimensiones del cubo

Seleccionando el campo y dando clic en Add new dimension

Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo

Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456

Si es exitosa la publicacioacuten debe salir

Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe

Y se ingresa en NavigateSoluciones

Una vez alliacute entramos en Ejemplos de Anaacutelisis

Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos

El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten

Page 4: Unidad 3 tsbd olap

Ejemplo de diagrama ER

Esquemas relacionales para modelado multidimensional

Un modelo de datos multidimensional o cubo es una coleccioacuten de medidas las cuales dependen de un conjunto de dimensiones es una representacioacuten de los datos que permite organizarlos en la forma de hechos dimensiones y agregados los hechos contienen medidas es decir la informacioacuten a nivel transaccioacuten que vamos a analizar por ejemplo compras ventas prestamos etc Las dimensiones contienen informacioacuten descriptiva de esas transacciones por ejemplo fecha cliente producto etc Un modelo multidimensional se utiliza para el anaacutelisis de informacioacuten

Los conceptos de dimensioacuten y hechos

La figura muestra el concepto de modelo multidimensional del tema ldquocomprasrdquo a la izquierda se muestran datos

transaccionales fuente de ejemplo a la derecha y abajo se tiene un diagrama de cubo donde hay 2 medidas a analizar la cantidad y el costo esos atributos o campos formaran la tabla de hechos del cubo y se analizaraacuten por 3 dimensiones

La dimensioacuten ldquoproductordquo que contiene los atributos del producto que se comproacute La dimensioacuten ldquoproveedorrdquo que contiene los atributos del proveedor a quien se le comproacute ese producto y finalmente la dimensioacuten ldquotiempordquo que contiene la fecha en la que se realizoacute esa transaccioacuten de compra

Se tienen diferentes esquemas relacionales para hacer el modelado multidimensional a continuacioacuten se describe cada uno de ellos

Esquemas para representar modelos multidimensionales

a) Modelo o esquema de estrella (ldquostar schemardquo) tradicional

El esquema de estrella es una teacutecnica de modelado de datos usada para hacer corresponder un modelo multidimensional a una base de datos relacional debe su nombre debido a que graacuteficamente parece una estrella El esquema de estrella tiene cuatro componentes hechos dimensiones atributos y jerarquiacuteas de atributos Los hechos y dimensiones son representados por tablas fiacutesicas en el almaceacuten de datos la tabla de hechos estaacute relacionada a cada dimensioacuten en una relacioacuten uno a muchos Las tablas de hechos y dimensiones estaacuten relacionadas por llaves foraacuteneas y estaacuten sujetas a las restricciones de las llaves foraacuteneas y primarias

Modelo de estrella con 3 dimensiones y una tabla de hechos

Para calcular el total de compras realizadas a proveedores de Internet el esquema de estrella tendriacutea que realizar estos pasos

1 De la dimensioacuten Proveedor seleccionar todos los proveedores donde el canal es Internet

2 De la tabla de hechos seleccionar y calcular la suma de todas las cantidades y costos de las transacciones de compra a los proveedores del paso 1

b) Modelo de copo de nieve (ldquosnow flake schemardquo)

El esquema de copo de nieve es una variacioacuten de la estrella tradicional lo que se hace es que en cada dimensioacuten se almacenan jerarquiacuteas de atributos o bien simplemente se separan atributos en otra entidad por razones de desempentildeo y mejor utilizacioacuten del espacio En la figura 425 la dimensioacuten producto se ha modificado separando sus datos generales de sus otras caracteriacutesticas

Modelo de copo de nieve

b) Modelo de constelaciones

El modelo de constelaciones nuevamente es una variacioacuten del esquema de estrella tradicional en este modelo algunos atributos de las dimensiones se separan

formando una nueva entidad que puede ser compartida con otros cubos es decir pueden ser dimensiones de otros cubos (ver la figura 426) La utilidad principal de este modelo es que al tener dimensiones que puede ser compartidas por diferentes cubos se tendraacute un mejor uso del espacio de almacenamiento evitando la redundancia

Esquema de constelaciones

Operaciones con cubos

Una vez que se tienen los cubos se puede realizar diferentes operaciones sobre ellos para visualizar y analizar la informacioacuten las operaciones son

a) Generalizar y especializar o como en la bibliografiacutea se conoce abstraccioacuten y concrecioacuten (generalizar y especializar)

b) Corte y corte de cubos (ldquoSlice amp Dicerdquo)

c) Filtrar

d) Pivotear

Estas operaciones se realizan sobre los cubos (ldquocubingrdquo) y generan como resultados sub-cubos llamados ldquocuboidesrdquo

La especializacioacuten y la generalizacioacuten son operaciones que sirven para navegar un cubo sobre sus dimensiones Las dimensiones que ofrecen diferentes niveles de abstraccioacuten podraacuten ser navegables por ejemplo supongamos que tenemos la dimensioacuten tiempo que tiene los nivel de abstraccioacuten antildeo semestre mes semana y diacutea una operacioacuten de especializacioacuten nos permitiraacute interactivamente visualizar los hechos desde el agregado total por antildeo e ir descendiendo hasta el detalle por diacutea la operacioacuten generalizar permitiraacute lo contrario desde cualquier nivel podraacute generalizar a un nivel superior por ejemplo de semana a mes En resumen las operaciones especializar y generalizar realizan el proceso siguiente

Detalle 1048774 GENERALIZACION 1048774 Alto nivel - generalizar

Alto nivel 1048774 ESPECIALIZACION 1048774 Detalle - especializar

Operaciones sobre cubos especializar y generalizar

Las operaciones de corte y corte de cubo sirven para ver subconjuntos de cubos es maacutes se dice que como resultado generan ldquosubcubosrdquo o ldquocuboidesrdquo La operacioacuten ldquocorterdquo como la palabra lo indica es una operacioacuten que genera una rebanada del cubo por ejemplo si de una dimensioacuten tiempo de un cubo uacutenicamente tomamos el mes de ldquoMarzordquo y dejamos ver el resto de las dimensiones entonces tendremos la rebanada o corte que corresponde al mes de ldquoMarzordquo Si ademaacutes de eso condicionamos la dimensioacuten ldquoproveedorrdquo seleccionando el proveedor ldquoXrdquo de un cubo de ldquocomprasrdquo entonces estaremos obteniendo un ldquosubcubordquo este uacuteltimo es el resultado de una operacioacuten de corte de cubo

311 Servidores de Procesamiento Analiacutetico en Liacutenea

El servidor de procesamiento analiacutetico en liacutenea permite definir y navegar un modelo multidimensional El servidor de procesamiento analiacutetico en liacutenea es un administrador de base de datos especializado en el almacenamiento de cubos y en responder de manera optima a las operaciones sobre ellos El servidor de procesamiento analiacutetico en liacutenea puede ser implementado sobre un DBMS relacional (RDBMS) en cuyo caso se denomina servidor de procesamiento analiacutetico en liacutenea relacional (servidor ROLAP) Este servidor de procesamiento analiacutetico en liacutenea almacena los cubos en tablas relacionales y las operaciones sobre ellos se realizan con SQL o con un SQL extendido para manejar cubos Ademaacutes el RDBMS proporciona lagunas funcionalidades para implementar tanto los cubos como las operaciones sobre ellos por ejemplo las vistas materializadas o los iacutendices ldquobitmaprdquo Cuando se utiliza un servidor especializado para almacenar modelos de datos multidimensionales el servidor se conoce como servidor de procesamiento analiacutetico en liacutenea multidimensional (ldquoServidor MOLAPrdquo) el

cual almacena los datos multidimensionales directamente en estructuras de datos especiales (arreglos) e implementa las operaciones de procesamiento analiacutetico en liacutenea sobre esas estructuras

Existe tambieacuten un tipo hiacutebrido de procesamiento analiacutetico llamado servidor de procesamiento analiacutetico en liacutenea hiacutebrido (HOLAP) que implementa las ventajas de ROLAP y MOLAP utilizando cubos en MOLAP y cuando se quiere ir al detalle de la informacioacuten utiliza la que se encuentran en tablas de relaciones

En cualquiera de los tres casos es necesario almacenar tres tipos de datos datos de tabla de hechos (las transacciones) los agregados y las dimensiones

En un servidor ROLAP cada fila en una tabla de hechos tiene una columna para cada dimensioacuten y medida Las bases de datos MOLAP almacenan los datos de hechos en un formato multidimensional pero si hay muchas dimensiones estos datos estaraacuten dispersos y el formato multidimensional no tendraacute buen desempentildeo Un sistema HOLAP resuelve este problema dejando los datos de mayor granularidad en la base de datos relacional pero almacena los datos en un formato multidimensional

312 Utilizacioacuten de las Herramientas OLAP

Se dice que las herramientas de procesamiento analiacutetico en liacutenea son de naturaleza reactiva puesto que el trabajador de conocimiento o analista la utilizaraacute para ver lo que ha pasado e identificaraacute indicadores que le permitan corregir el rumbo por ejemplo si al darse cuenta que la tendencia ha sido comprar en ldquointernetrdquo probablemente deberiacutea revisar si estaacute recibiendo los descuentos que podriacutea obtener en libreriacuteas o valdriacutea la pena revisar cuanto estaacute pagando por gastos de enviacuteo para saber si realmente estaacute ahorrando

El procesamiento analiacutetico en liacutenea nos ofrece reportes y graacuteficos interactivos que si tuvieran que hacer a partir de las fuentes operacionales seria un proceso complejo de integracioacuten de datos que generariacutea resultados de poca precisioacuten y por lo tanto poca confiabilidad ademaacutes de que se invertiriacutea mucho tiempo en completar la construccioacuten de los reportes tiempo que seriacutea maacutes valioso si se empleara para analizar y tomar decisiones

32 Oracle OLAP

Las herramientas de generacioacuten de informes y consultas adhoc generalmente se despliegan utilizando datawarehouses y herramientas basadas en SQL mientras que aplicaciones maacutes sofisticadas de anaacutelisis y planificacioacuten se despliegan utilizando otras bases de datos y herramientas

Esta separacioacuten entre data warehouses y bases de datos analiacuteticas es sin embargo costosa El coste de mantenimiento de bases de datos separadas supone recursos adicionales hardware y administradores

Oracle elimina estas barreras proporcionando una base de datos preparada para el anaacutelisis Oracle OLAP parte de la base de datos Oracle proporciona la funcionalidad analiacutetica de una base de datos especializada a la vez que elimina la necesidad de gestionar bases de datos separadas

Oracle cambia el planteamiento tradicional ofreciendo una base de datos integrada relacional-multidimensional Oracle RDBMS-MDDS elimina la decisioacuten entre gestionabilidad y rendimiento-poder analiacutetico Oracle simplifica el proceso y reduce el coste de mantenimiento de los datos a la vez que se mantiene la habilidad de hacer complejas consultas analiacuteticas y proporciona un rendimiento excelente

Arquitectura con base de datos Oracle integrada

Oracle OLAP es parte de una plataforma integrada de data warehousing y business intelligence que contiene funcionalidad ETL OLAP y data mining en la base de datos Hay muchos beneficios derivados de tener una base de datos RDBMS-MDDS completamente integrada en comparacioacuten con bases de datos multidimensionales y separados

Gestioacuten maacutes simple Alta disponibilidad

Seguridad mejorada Acceso abierto desde clientes SQL y OLAP API

Ciclo de informacioacuten reducido Mayor fiabilidad de la informacioacuten

La base de datos relacional-multidimensional Oracle se compone de tres tecnologiacuteas

La tecnologiacutea relacional gestiona los objetos de base de datos y proporciona una interfaz SQL a los datos

La tecnologiacutea de objetos permite a la base de datos gestionar datos no relacionales

La tecnologiacutea OLAP proporciona funcionalidad analiacutetica avanzada en el contexto de un modelo multidimensional

Componentes Oracle Database OLAP

SQL puede acceder a datos multidimensionales a traveacutes de funciones de tabla o vistas relacionales Usando aplicaciones PLSQL SQL pueden interactuar directamente con el motor multidimensional

Todas las tecnologiacuteas mdash relacional objetos y OLAP mdash estaacuten contenidas en un solo proceso la base de datos se trata como una sola instancia integrada

Como la tecnologiacutea OLAP es parte de un solo proceso de base de datos proporciona la misma escalabilidad y fiabilidad que el proceso de base de datos Oracle

En Oracle todos los datos mdash relacional y multidimensional mdash se almacenan en los ficheros de datos Oracle No hay ficheros multidimensionales separados que debamos gestionar Los tipos de datos relacional y multidimensional pueden coexistir en los mismos ficheros de datos Los datos multidimensionales se almacenan en la base de datos en lo que se llaman analytic workspaces

Oracle OLAP esta basado en un modelo de datos multidimensional Eacuteste se presenta como un modelo loacutegico a traveacutes de las OLAP API y OLAP DML

MODELO LOacuteGICO EN LA OLAP API

El modelo multidimensional proporciona algunos beneficios al usuario de las aplicaciones analiacuteticas Los maacutes importantes son

o Es faacutecilmente entendible por los usuarios no expertos

o Proporciona el contexto para la seleccioacuten de datos

o Simplifica el proceso de definicioacuten de caacuteluclos hasta que usuarios no

expertos pueden usar el lenguaje de caacutelculo

El modelo multidimensional loacutegico se presenta a traveacutes de las OLAP API y OLAP DML con los siguientes elementos

Medidas

Dimensiones

Niveles

Jerarquiacuteas

Atributos

Una medida representa hechos Ventas en euros y ventas unitarias son ejemplos de medidas Una medida es anaacuteloga a una columna de hechos en una tabla de hechos pero el cataacutelogo OLAP proporciona meta datos maacutes completos para describirlo Las dimensiones proporcionan la estructura a los datos organizaacutendolos en niveles y jerarquiacuteas y proporcionaacutendoles atributos Algunos ejemplos de dimensiones son Producto Geografiacutea Tiempo etc

Como los analytic workspaces almacenan datos se necesita un modelo fiacutesico de base de datos para organizarlos datos Oracle OLAP usa un modelo multidimensional como base para el modelo fiacutesico en los analytic workspaces Este modelo proporciona beneficios importantes

o El modelo fuerza la integridad referencial Por ejemplo no es posible

que las medidas contengan claves que no referencien valores vaacutelidos en una dimensioacuten

o El modelo favorece la consistencia de datos al facilitar la reutilizacioacuten de

dimensiones con muacuteltiples medidas

o El orden de los miembros de las dimensiones se mantiene Esto

simplifica los caacutelculos como por ejemplo el anaacutelisis de series temporales Cuando el orden de los miembros de las dimensiones se mantiene las funciones pueden usar la posicioacuten de un miembro de una dimensioacuten por lo que se simplifica la definicioacuten de los caacutelculos y se reduce la necesidad de atributos dimensionales

o Toda la base de datos se presenta como precalculada sin tener en cuenta

si los datos se han precalculado o se calculan en tiempo ejecucioacuten Las aplicaciones no necesitan especificar reglas de agregacioacuten o joins cuando consultan la base de datos Las aplicaciones SQL no se preocupan de coacutemo los datos estaacuten precalculados simplemente consultan los datos

Oracle OLAP representa un cambio fundamental en la tecnologiacutea OLAP Las bases de datos relacionales y multidimensionales se han unido para proporcionar capacidades analiacuteticas propias de una base de datos multidimensional en el contexto de la base de datos Oracle

Todas estas ventajas se obtienen a la vez que se mantiene la potencia de un servidor OLAP dedicado Oracle OLAP proporciona un conjunto de funciones analiacuteticas a traveacutes de la OLAP API un motor multidimensional y un lenguaje de manipulacioacuten de datos OLAP El resultado es un sistema de menor coste maacutes seguro y fiable que da soporte a aplicaciones analiacuteticas de consulta y de generacioacuten de informes

33 Ejercicio con OLAP

Para realizar la practica de OLAP utilizaremos el software Pentaho lo primero que realizaremos seraacute Descargaremos un archivo desde internet llamando pentaho_demo_mysql Ya que trabajaremos con la base de datos de la unidad pasada El archivo descargado es una carpeta comprimida en la que vienen todos los archivos necesarios para que el portal funcione lo uacutenico que hay que hacer es descomprimir el archivo en el lugar en que mejor nos parezca

Una vez descomprimida la carpeta se debe establecer la contrasentildea de publicacioacuten en el portal Esto se hace entrando en el archivo CProgram Filespentaho_demo_mysql5-160GA863pentaho-demopentaho-solutionssystempublisher_configxml Y escribir la contrasentildea en medio de las etiquetas como se muestra en la figura

Este password se usara en el momento de publicar el cubo en el portal de Pentaho

Una vez realizado descomprimimos la carpeta proporcionada por la profesora y simplemente extraemos los archivos esta es una carpeta comprimida que no necesita proceso de instalacioacuten sino que solo es necesario descomprimirla en el lugar que uno prefiera En este caso se hizo en cProgram Files

Nota Antes de empezar el servicio de la base de datos debe estar activo

Lo primero que debe hacerse es subir el portal de Pentaho lo que se hace corriendo el archivo start-pentahobat que estaacute en la carpeta descomprimida

Una vez esteacute listo Pentaho se inicia el cube designer dando doble click sobra el icono de la carpeta que descomprimimos anteriormente

El primer paso es especificar el origen de los datos daacutendole un nombre seleccionando el driver seguacuten el motor que se esteacute usando en este caso es mySql y el usuario y el password que se usara en la conexioacuten

El siguiente paso es seleccionar los campos de la base de datos que seraacuten usados en el cubo Arrastrando las tablas que aparecen en la parte inferior izquierda y palomeando los atributos de cada tabla deseada

A continuacioacuten seleccionaremos el campo de la base de datos que contiene la unidad de medida que va a ser analizada en el cubo

Seguido de esto viene la creacioacuten de las dimensiones del cubo

Seleccionando el campo y dando clic en Add new dimension

Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo

Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456

Si es exitosa la publicacioacuten debe salir

Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe

Y se ingresa en NavigateSoluciones

Una vez alliacute entramos en Ejemplos de Anaacutelisis

Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos

El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten

Page 5: Unidad 3 tsbd olap

transaccionales fuente de ejemplo a la derecha y abajo se tiene un diagrama de cubo donde hay 2 medidas a analizar la cantidad y el costo esos atributos o campos formaran la tabla de hechos del cubo y se analizaraacuten por 3 dimensiones

La dimensioacuten ldquoproductordquo que contiene los atributos del producto que se comproacute La dimensioacuten ldquoproveedorrdquo que contiene los atributos del proveedor a quien se le comproacute ese producto y finalmente la dimensioacuten ldquotiempordquo que contiene la fecha en la que se realizoacute esa transaccioacuten de compra

Se tienen diferentes esquemas relacionales para hacer el modelado multidimensional a continuacioacuten se describe cada uno de ellos

Esquemas para representar modelos multidimensionales

a) Modelo o esquema de estrella (ldquostar schemardquo) tradicional

El esquema de estrella es una teacutecnica de modelado de datos usada para hacer corresponder un modelo multidimensional a una base de datos relacional debe su nombre debido a que graacuteficamente parece una estrella El esquema de estrella tiene cuatro componentes hechos dimensiones atributos y jerarquiacuteas de atributos Los hechos y dimensiones son representados por tablas fiacutesicas en el almaceacuten de datos la tabla de hechos estaacute relacionada a cada dimensioacuten en una relacioacuten uno a muchos Las tablas de hechos y dimensiones estaacuten relacionadas por llaves foraacuteneas y estaacuten sujetas a las restricciones de las llaves foraacuteneas y primarias

Modelo de estrella con 3 dimensiones y una tabla de hechos

Para calcular el total de compras realizadas a proveedores de Internet el esquema de estrella tendriacutea que realizar estos pasos

1 De la dimensioacuten Proveedor seleccionar todos los proveedores donde el canal es Internet

2 De la tabla de hechos seleccionar y calcular la suma de todas las cantidades y costos de las transacciones de compra a los proveedores del paso 1

b) Modelo de copo de nieve (ldquosnow flake schemardquo)

El esquema de copo de nieve es una variacioacuten de la estrella tradicional lo que se hace es que en cada dimensioacuten se almacenan jerarquiacuteas de atributos o bien simplemente se separan atributos en otra entidad por razones de desempentildeo y mejor utilizacioacuten del espacio En la figura 425 la dimensioacuten producto se ha modificado separando sus datos generales de sus otras caracteriacutesticas

Modelo de copo de nieve

b) Modelo de constelaciones

El modelo de constelaciones nuevamente es una variacioacuten del esquema de estrella tradicional en este modelo algunos atributos de las dimensiones se separan

formando una nueva entidad que puede ser compartida con otros cubos es decir pueden ser dimensiones de otros cubos (ver la figura 426) La utilidad principal de este modelo es que al tener dimensiones que puede ser compartidas por diferentes cubos se tendraacute un mejor uso del espacio de almacenamiento evitando la redundancia

Esquema de constelaciones

Operaciones con cubos

Una vez que se tienen los cubos se puede realizar diferentes operaciones sobre ellos para visualizar y analizar la informacioacuten las operaciones son

a) Generalizar y especializar o como en la bibliografiacutea se conoce abstraccioacuten y concrecioacuten (generalizar y especializar)

b) Corte y corte de cubos (ldquoSlice amp Dicerdquo)

c) Filtrar

d) Pivotear

Estas operaciones se realizan sobre los cubos (ldquocubingrdquo) y generan como resultados sub-cubos llamados ldquocuboidesrdquo

La especializacioacuten y la generalizacioacuten son operaciones que sirven para navegar un cubo sobre sus dimensiones Las dimensiones que ofrecen diferentes niveles de abstraccioacuten podraacuten ser navegables por ejemplo supongamos que tenemos la dimensioacuten tiempo que tiene los nivel de abstraccioacuten antildeo semestre mes semana y diacutea una operacioacuten de especializacioacuten nos permitiraacute interactivamente visualizar los hechos desde el agregado total por antildeo e ir descendiendo hasta el detalle por diacutea la operacioacuten generalizar permitiraacute lo contrario desde cualquier nivel podraacute generalizar a un nivel superior por ejemplo de semana a mes En resumen las operaciones especializar y generalizar realizan el proceso siguiente

Detalle 1048774 GENERALIZACION 1048774 Alto nivel - generalizar

Alto nivel 1048774 ESPECIALIZACION 1048774 Detalle - especializar

Operaciones sobre cubos especializar y generalizar

Las operaciones de corte y corte de cubo sirven para ver subconjuntos de cubos es maacutes se dice que como resultado generan ldquosubcubosrdquo o ldquocuboidesrdquo La operacioacuten ldquocorterdquo como la palabra lo indica es una operacioacuten que genera una rebanada del cubo por ejemplo si de una dimensioacuten tiempo de un cubo uacutenicamente tomamos el mes de ldquoMarzordquo y dejamos ver el resto de las dimensiones entonces tendremos la rebanada o corte que corresponde al mes de ldquoMarzordquo Si ademaacutes de eso condicionamos la dimensioacuten ldquoproveedorrdquo seleccionando el proveedor ldquoXrdquo de un cubo de ldquocomprasrdquo entonces estaremos obteniendo un ldquosubcubordquo este uacuteltimo es el resultado de una operacioacuten de corte de cubo

311 Servidores de Procesamiento Analiacutetico en Liacutenea

El servidor de procesamiento analiacutetico en liacutenea permite definir y navegar un modelo multidimensional El servidor de procesamiento analiacutetico en liacutenea es un administrador de base de datos especializado en el almacenamiento de cubos y en responder de manera optima a las operaciones sobre ellos El servidor de procesamiento analiacutetico en liacutenea puede ser implementado sobre un DBMS relacional (RDBMS) en cuyo caso se denomina servidor de procesamiento analiacutetico en liacutenea relacional (servidor ROLAP) Este servidor de procesamiento analiacutetico en liacutenea almacena los cubos en tablas relacionales y las operaciones sobre ellos se realizan con SQL o con un SQL extendido para manejar cubos Ademaacutes el RDBMS proporciona lagunas funcionalidades para implementar tanto los cubos como las operaciones sobre ellos por ejemplo las vistas materializadas o los iacutendices ldquobitmaprdquo Cuando se utiliza un servidor especializado para almacenar modelos de datos multidimensionales el servidor se conoce como servidor de procesamiento analiacutetico en liacutenea multidimensional (ldquoServidor MOLAPrdquo) el

cual almacena los datos multidimensionales directamente en estructuras de datos especiales (arreglos) e implementa las operaciones de procesamiento analiacutetico en liacutenea sobre esas estructuras

Existe tambieacuten un tipo hiacutebrido de procesamiento analiacutetico llamado servidor de procesamiento analiacutetico en liacutenea hiacutebrido (HOLAP) que implementa las ventajas de ROLAP y MOLAP utilizando cubos en MOLAP y cuando se quiere ir al detalle de la informacioacuten utiliza la que se encuentran en tablas de relaciones

En cualquiera de los tres casos es necesario almacenar tres tipos de datos datos de tabla de hechos (las transacciones) los agregados y las dimensiones

En un servidor ROLAP cada fila en una tabla de hechos tiene una columna para cada dimensioacuten y medida Las bases de datos MOLAP almacenan los datos de hechos en un formato multidimensional pero si hay muchas dimensiones estos datos estaraacuten dispersos y el formato multidimensional no tendraacute buen desempentildeo Un sistema HOLAP resuelve este problema dejando los datos de mayor granularidad en la base de datos relacional pero almacena los datos en un formato multidimensional

312 Utilizacioacuten de las Herramientas OLAP

Se dice que las herramientas de procesamiento analiacutetico en liacutenea son de naturaleza reactiva puesto que el trabajador de conocimiento o analista la utilizaraacute para ver lo que ha pasado e identificaraacute indicadores que le permitan corregir el rumbo por ejemplo si al darse cuenta que la tendencia ha sido comprar en ldquointernetrdquo probablemente deberiacutea revisar si estaacute recibiendo los descuentos que podriacutea obtener en libreriacuteas o valdriacutea la pena revisar cuanto estaacute pagando por gastos de enviacuteo para saber si realmente estaacute ahorrando

El procesamiento analiacutetico en liacutenea nos ofrece reportes y graacuteficos interactivos que si tuvieran que hacer a partir de las fuentes operacionales seria un proceso complejo de integracioacuten de datos que generariacutea resultados de poca precisioacuten y por lo tanto poca confiabilidad ademaacutes de que se invertiriacutea mucho tiempo en completar la construccioacuten de los reportes tiempo que seriacutea maacutes valioso si se empleara para analizar y tomar decisiones

32 Oracle OLAP

Las herramientas de generacioacuten de informes y consultas adhoc generalmente se despliegan utilizando datawarehouses y herramientas basadas en SQL mientras que aplicaciones maacutes sofisticadas de anaacutelisis y planificacioacuten se despliegan utilizando otras bases de datos y herramientas

Esta separacioacuten entre data warehouses y bases de datos analiacuteticas es sin embargo costosa El coste de mantenimiento de bases de datos separadas supone recursos adicionales hardware y administradores

Oracle elimina estas barreras proporcionando una base de datos preparada para el anaacutelisis Oracle OLAP parte de la base de datos Oracle proporciona la funcionalidad analiacutetica de una base de datos especializada a la vez que elimina la necesidad de gestionar bases de datos separadas

Oracle cambia el planteamiento tradicional ofreciendo una base de datos integrada relacional-multidimensional Oracle RDBMS-MDDS elimina la decisioacuten entre gestionabilidad y rendimiento-poder analiacutetico Oracle simplifica el proceso y reduce el coste de mantenimiento de los datos a la vez que se mantiene la habilidad de hacer complejas consultas analiacuteticas y proporciona un rendimiento excelente

Arquitectura con base de datos Oracle integrada

Oracle OLAP es parte de una plataforma integrada de data warehousing y business intelligence que contiene funcionalidad ETL OLAP y data mining en la base de datos Hay muchos beneficios derivados de tener una base de datos RDBMS-MDDS completamente integrada en comparacioacuten con bases de datos multidimensionales y separados

Gestioacuten maacutes simple Alta disponibilidad

Seguridad mejorada Acceso abierto desde clientes SQL y OLAP API

Ciclo de informacioacuten reducido Mayor fiabilidad de la informacioacuten

La base de datos relacional-multidimensional Oracle se compone de tres tecnologiacuteas

La tecnologiacutea relacional gestiona los objetos de base de datos y proporciona una interfaz SQL a los datos

La tecnologiacutea de objetos permite a la base de datos gestionar datos no relacionales

La tecnologiacutea OLAP proporciona funcionalidad analiacutetica avanzada en el contexto de un modelo multidimensional

Componentes Oracle Database OLAP

SQL puede acceder a datos multidimensionales a traveacutes de funciones de tabla o vistas relacionales Usando aplicaciones PLSQL SQL pueden interactuar directamente con el motor multidimensional

Todas las tecnologiacuteas mdash relacional objetos y OLAP mdash estaacuten contenidas en un solo proceso la base de datos se trata como una sola instancia integrada

Como la tecnologiacutea OLAP es parte de un solo proceso de base de datos proporciona la misma escalabilidad y fiabilidad que el proceso de base de datos Oracle

En Oracle todos los datos mdash relacional y multidimensional mdash se almacenan en los ficheros de datos Oracle No hay ficheros multidimensionales separados que debamos gestionar Los tipos de datos relacional y multidimensional pueden coexistir en los mismos ficheros de datos Los datos multidimensionales se almacenan en la base de datos en lo que se llaman analytic workspaces

Oracle OLAP esta basado en un modelo de datos multidimensional Eacuteste se presenta como un modelo loacutegico a traveacutes de las OLAP API y OLAP DML

MODELO LOacuteGICO EN LA OLAP API

El modelo multidimensional proporciona algunos beneficios al usuario de las aplicaciones analiacuteticas Los maacutes importantes son

o Es faacutecilmente entendible por los usuarios no expertos

o Proporciona el contexto para la seleccioacuten de datos

o Simplifica el proceso de definicioacuten de caacuteluclos hasta que usuarios no

expertos pueden usar el lenguaje de caacutelculo

El modelo multidimensional loacutegico se presenta a traveacutes de las OLAP API y OLAP DML con los siguientes elementos

Medidas

Dimensiones

Niveles

Jerarquiacuteas

Atributos

Una medida representa hechos Ventas en euros y ventas unitarias son ejemplos de medidas Una medida es anaacuteloga a una columna de hechos en una tabla de hechos pero el cataacutelogo OLAP proporciona meta datos maacutes completos para describirlo Las dimensiones proporcionan la estructura a los datos organizaacutendolos en niveles y jerarquiacuteas y proporcionaacutendoles atributos Algunos ejemplos de dimensiones son Producto Geografiacutea Tiempo etc

Como los analytic workspaces almacenan datos se necesita un modelo fiacutesico de base de datos para organizarlos datos Oracle OLAP usa un modelo multidimensional como base para el modelo fiacutesico en los analytic workspaces Este modelo proporciona beneficios importantes

o El modelo fuerza la integridad referencial Por ejemplo no es posible

que las medidas contengan claves que no referencien valores vaacutelidos en una dimensioacuten

o El modelo favorece la consistencia de datos al facilitar la reutilizacioacuten de

dimensiones con muacuteltiples medidas

o El orden de los miembros de las dimensiones se mantiene Esto

simplifica los caacutelculos como por ejemplo el anaacutelisis de series temporales Cuando el orden de los miembros de las dimensiones se mantiene las funciones pueden usar la posicioacuten de un miembro de una dimensioacuten por lo que se simplifica la definicioacuten de los caacutelculos y se reduce la necesidad de atributos dimensionales

o Toda la base de datos se presenta como precalculada sin tener en cuenta

si los datos se han precalculado o se calculan en tiempo ejecucioacuten Las aplicaciones no necesitan especificar reglas de agregacioacuten o joins cuando consultan la base de datos Las aplicaciones SQL no se preocupan de coacutemo los datos estaacuten precalculados simplemente consultan los datos

Oracle OLAP representa un cambio fundamental en la tecnologiacutea OLAP Las bases de datos relacionales y multidimensionales se han unido para proporcionar capacidades analiacuteticas propias de una base de datos multidimensional en el contexto de la base de datos Oracle

Todas estas ventajas se obtienen a la vez que se mantiene la potencia de un servidor OLAP dedicado Oracle OLAP proporciona un conjunto de funciones analiacuteticas a traveacutes de la OLAP API un motor multidimensional y un lenguaje de manipulacioacuten de datos OLAP El resultado es un sistema de menor coste maacutes seguro y fiable que da soporte a aplicaciones analiacuteticas de consulta y de generacioacuten de informes

33 Ejercicio con OLAP

Para realizar la practica de OLAP utilizaremos el software Pentaho lo primero que realizaremos seraacute Descargaremos un archivo desde internet llamando pentaho_demo_mysql Ya que trabajaremos con la base de datos de la unidad pasada El archivo descargado es una carpeta comprimida en la que vienen todos los archivos necesarios para que el portal funcione lo uacutenico que hay que hacer es descomprimir el archivo en el lugar en que mejor nos parezca

Una vez descomprimida la carpeta se debe establecer la contrasentildea de publicacioacuten en el portal Esto se hace entrando en el archivo CProgram Filespentaho_demo_mysql5-160GA863pentaho-demopentaho-solutionssystempublisher_configxml Y escribir la contrasentildea en medio de las etiquetas como se muestra en la figura

Este password se usara en el momento de publicar el cubo en el portal de Pentaho

Una vez realizado descomprimimos la carpeta proporcionada por la profesora y simplemente extraemos los archivos esta es una carpeta comprimida que no necesita proceso de instalacioacuten sino que solo es necesario descomprimirla en el lugar que uno prefiera En este caso se hizo en cProgram Files

Nota Antes de empezar el servicio de la base de datos debe estar activo

Lo primero que debe hacerse es subir el portal de Pentaho lo que se hace corriendo el archivo start-pentahobat que estaacute en la carpeta descomprimida

Una vez esteacute listo Pentaho se inicia el cube designer dando doble click sobra el icono de la carpeta que descomprimimos anteriormente

El primer paso es especificar el origen de los datos daacutendole un nombre seleccionando el driver seguacuten el motor que se esteacute usando en este caso es mySql y el usuario y el password que se usara en la conexioacuten

El siguiente paso es seleccionar los campos de la base de datos que seraacuten usados en el cubo Arrastrando las tablas que aparecen en la parte inferior izquierda y palomeando los atributos de cada tabla deseada

A continuacioacuten seleccionaremos el campo de la base de datos que contiene la unidad de medida que va a ser analizada en el cubo

Seguido de esto viene la creacioacuten de las dimensiones del cubo

Seleccionando el campo y dando clic en Add new dimension

Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo

Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456

Si es exitosa la publicacioacuten debe salir

Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe

Y se ingresa en NavigateSoluciones

Una vez alliacute entramos en Ejemplos de Anaacutelisis

Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos

El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten

Page 6: Unidad 3 tsbd olap

Modelo de estrella con 3 dimensiones y una tabla de hechos

Para calcular el total de compras realizadas a proveedores de Internet el esquema de estrella tendriacutea que realizar estos pasos

1 De la dimensioacuten Proveedor seleccionar todos los proveedores donde el canal es Internet

2 De la tabla de hechos seleccionar y calcular la suma de todas las cantidades y costos de las transacciones de compra a los proveedores del paso 1

b) Modelo de copo de nieve (ldquosnow flake schemardquo)

El esquema de copo de nieve es una variacioacuten de la estrella tradicional lo que se hace es que en cada dimensioacuten se almacenan jerarquiacuteas de atributos o bien simplemente se separan atributos en otra entidad por razones de desempentildeo y mejor utilizacioacuten del espacio En la figura 425 la dimensioacuten producto se ha modificado separando sus datos generales de sus otras caracteriacutesticas

Modelo de copo de nieve

b) Modelo de constelaciones

El modelo de constelaciones nuevamente es una variacioacuten del esquema de estrella tradicional en este modelo algunos atributos de las dimensiones se separan

formando una nueva entidad que puede ser compartida con otros cubos es decir pueden ser dimensiones de otros cubos (ver la figura 426) La utilidad principal de este modelo es que al tener dimensiones que puede ser compartidas por diferentes cubos se tendraacute un mejor uso del espacio de almacenamiento evitando la redundancia

Esquema de constelaciones

Operaciones con cubos

Una vez que se tienen los cubos se puede realizar diferentes operaciones sobre ellos para visualizar y analizar la informacioacuten las operaciones son

a) Generalizar y especializar o como en la bibliografiacutea se conoce abstraccioacuten y concrecioacuten (generalizar y especializar)

b) Corte y corte de cubos (ldquoSlice amp Dicerdquo)

c) Filtrar

d) Pivotear

Estas operaciones se realizan sobre los cubos (ldquocubingrdquo) y generan como resultados sub-cubos llamados ldquocuboidesrdquo

La especializacioacuten y la generalizacioacuten son operaciones que sirven para navegar un cubo sobre sus dimensiones Las dimensiones que ofrecen diferentes niveles de abstraccioacuten podraacuten ser navegables por ejemplo supongamos que tenemos la dimensioacuten tiempo que tiene los nivel de abstraccioacuten antildeo semestre mes semana y diacutea una operacioacuten de especializacioacuten nos permitiraacute interactivamente visualizar los hechos desde el agregado total por antildeo e ir descendiendo hasta el detalle por diacutea la operacioacuten generalizar permitiraacute lo contrario desde cualquier nivel podraacute generalizar a un nivel superior por ejemplo de semana a mes En resumen las operaciones especializar y generalizar realizan el proceso siguiente

Detalle 1048774 GENERALIZACION 1048774 Alto nivel - generalizar

Alto nivel 1048774 ESPECIALIZACION 1048774 Detalle - especializar

Operaciones sobre cubos especializar y generalizar

Las operaciones de corte y corte de cubo sirven para ver subconjuntos de cubos es maacutes se dice que como resultado generan ldquosubcubosrdquo o ldquocuboidesrdquo La operacioacuten ldquocorterdquo como la palabra lo indica es una operacioacuten que genera una rebanada del cubo por ejemplo si de una dimensioacuten tiempo de un cubo uacutenicamente tomamos el mes de ldquoMarzordquo y dejamos ver el resto de las dimensiones entonces tendremos la rebanada o corte que corresponde al mes de ldquoMarzordquo Si ademaacutes de eso condicionamos la dimensioacuten ldquoproveedorrdquo seleccionando el proveedor ldquoXrdquo de un cubo de ldquocomprasrdquo entonces estaremos obteniendo un ldquosubcubordquo este uacuteltimo es el resultado de una operacioacuten de corte de cubo

311 Servidores de Procesamiento Analiacutetico en Liacutenea

El servidor de procesamiento analiacutetico en liacutenea permite definir y navegar un modelo multidimensional El servidor de procesamiento analiacutetico en liacutenea es un administrador de base de datos especializado en el almacenamiento de cubos y en responder de manera optima a las operaciones sobre ellos El servidor de procesamiento analiacutetico en liacutenea puede ser implementado sobre un DBMS relacional (RDBMS) en cuyo caso se denomina servidor de procesamiento analiacutetico en liacutenea relacional (servidor ROLAP) Este servidor de procesamiento analiacutetico en liacutenea almacena los cubos en tablas relacionales y las operaciones sobre ellos se realizan con SQL o con un SQL extendido para manejar cubos Ademaacutes el RDBMS proporciona lagunas funcionalidades para implementar tanto los cubos como las operaciones sobre ellos por ejemplo las vistas materializadas o los iacutendices ldquobitmaprdquo Cuando se utiliza un servidor especializado para almacenar modelos de datos multidimensionales el servidor se conoce como servidor de procesamiento analiacutetico en liacutenea multidimensional (ldquoServidor MOLAPrdquo) el

cual almacena los datos multidimensionales directamente en estructuras de datos especiales (arreglos) e implementa las operaciones de procesamiento analiacutetico en liacutenea sobre esas estructuras

Existe tambieacuten un tipo hiacutebrido de procesamiento analiacutetico llamado servidor de procesamiento analiacutetico en liacutenea hiacutebrido (HOLAP) que implementa las ventajas de ROLAP y MOLAP utilizando cubos en MOLAP y cuando se quiere ir al detalle de la informacioacuten utiliza la que se encuentran en tablas de relaciones

En cualquiera de los tres casos es necesario almacenar tres tipos de datos datos de tabla de hechos (las transacciones) los agregados y las dimensiones

En un servidor ROLAP cada fila en una tabla de hechos tiene una columna para cada dimensioacuten y medida Las bases de datos MOLAP almacenan los datos de hechos en un formato multidimensional pero si hay muchas dimensiones estos datos estaraacuten dispersos y el formato multidimensional no tendraacute buen desempentildeo Un sistema HOLAP resuelve este problema dejando los datos de mayor granularidad en la base de datos relacional pero almacena los datos en un formato multidimensional

312 Utilizacioacuten de las Herramientas OLAP

Se dice que las herramientas de procesamiento analiacutetico en liacutenea son de naturaleza reactiva puesto que el trabajador de conocimiento o analista la utilizaraacute para ver lo que ha pasado e identificaraacute indicadores que le permitan corregir el rumbo por ejemplo si al darse cuenta que la tendencia ha sido comprar en ldquointernetrdquo probablemente deberiacutea revisar si estaacute recibiendo los descuentos que podriacutea obtener en libreriacuteas o valdriacutea la pena revisar cuanto estaacute pagando por gastos de enviacuteo para saber si realmente estaacute ahorrando

El procesamiento analiacutetico en liacutenea nos ofrece reportes y graacuteficos interactivos que si tuvieran que hacer a partir de las fuentes operacionales seria un proceso complejo de integracioacuten de datos que generariacutea resultados de poca precisioacuten y por lo tanto poca confiabilidad ademaacutes de que se invertiriacutea mucho tiempo en completar la construccioacuten de los reportes tiempo que seriacutea maacutes valioso si se empleara para analizar y tomar decisiones

32 Oracle OLAP

Las herramientas de generacioacuten de informes y consultas adhoc generalmente se despliegan utilizando datawarehouses y herramientas basadas en SQL mientras que aplicaciones maacutes sofisticadas de anaacutelisis y planificacioacuten se despliegan utilizando otras bases de datos y herramientas

Esta separacioacuten entre data warehouses y bases de datos analiacuteticas es sin embargo costosa El coste de mantenimiento de bases de datos separadas supone recursos adicionales hardware y administradores

Oracle elimina estas barreras proporcionando una base de datos preparada para el anaacutelisis Oracle OLAP parte de la base de datos Oracle proporciona la funcionalidad analiacutetica de una base de datos especializada a la vez que elimina la necesidad de gestionar bases de datos separadas

Oracle cambia el planteamiento tradicional ofreciendo una base de datos integrada relacional-multidimensional Oracle RDBMS-MDDS elimina la decisioacuten entre gestionabilidad y rendimiento-poder analiacutetico Oracle simplifica el proceso y reduce el coste de mantenimiento de los datos a la vez que se mantiene la habilidad de hacer complejas consultas analiacuteticas y proporciona un rendimiento excelente

Arquitectura con base de datos Oracle integrada

Oracle OLAP es parte de una plataforma integrada de data warehousing y business intelligence que contiene funcionalidad ETL OLAP y data mining en la base de datos Hay muchos beneficios derivados de tener una base de datos RDBMS-MDDS completamente integrada en comparacioacuten con bases de datos multidimensionales y separados

Gestioacuten maacutes simple Alta disponibilidad

Seguridad mejorada Acceso abierto desde clientes SQL y OLAP API

Ciclo de informacioacuten reducido Mayor fiabilidad de la informacioacuten

La base de datos relacional-multidimensional Oracle se compone de tres tecnologiacuteas

La tecnologiacutea relacional gestiona los objetos de base de datos y proporciona una interfaz SQL a los datos

La tecnologiacutea de objetos permite a la base de datos gestionar datos no relacionales

La tecnologiacutea OLAP proporciona funcionalidad analiacutetica avanzada en el contexto de un modelo multidimensional

Componentes Oracle Database OLAP

SQL puede acceder a datos multidimensionales a traveacutes de funciones de tabla o vistas relacionales Usando aplicaciones PLSQL SQL pueden interactuar directamente con el motor multidimensional

Todas las tecnologiacuteas mdash relacional objetos y OLAP mdash estaacuten contenidas en un solo proceso la base de datos se trata como una sola instancia integrada

Como la tecnologiacutea OLAP es parte de un solo proceso de base de datos proporciona la misma escalabilidad y fiabilidad que el proceso de base de datos Oracle

En Oracle todos los datos mdash relacional y multidimensional mdash se almacenan en los ficheros de datos Oracle No hay ficheros multidimensionales separados que debamos gestionar Los tipos de datos relacional y multidimensional pueden coexistir en los mismos ficheros de datos Los datos multidimensionales se almacenan en la base de datos en lo que se llaman analytic workspaces

Oracle OLAP esta basado en un modelo de datos multidimensional Eacuteste se presenta como un modelo loacutegico a traveacutes de las OLAP API y OLAP DML

MODELO LOacuteGICO EN LA OLAP API

El modelo multidimensional proporciona algunos beneficios al usuario de las aplicaciones analiacuteticas Los maacutes importantes son

o Es faacutecilmente entendible por los usuarios no expertos

o Proporciona el contexto para la seleccioacuten de datos

o Simplifica el proceso de definicioacuten de caacuteluclos hasta que usuarios no

expertos pueden usar el lenguaje de caacutelculo

El modelo multidimensional loacutegico se presenta a traveacutes de las OLAP API y OLAP DML con los siguientes elementos

Medidas

Dimensiones

Niveles

Jerarquiacuteas

Atributos

Una medida representa hechos Ventas en euros y ventas unitarias son ejemplos de medidas Una medida es anaacuteloga a una columna de hechos en una tabla de hechos pero el cataacutelogo OLAP proporciona meta datos maacutes completos para describirlo Las dimensiones proporcionan la estructura a los datos organizaacutendolos en niveles y jerarquiacuteas y proporcionaacutendoles atributos Algunos ejemplos de dimensiones son Producto Geografiacutea Tiempo etc

Como los analytic workspaces almacenan datos se necesita un modelo fiacutesico de base de datos para organizarlos datos Oracle OLAP usa un modelo multidimensional como base para el modelo fiacutesico en los analytic workspaces Este modelo proporciona beneficios importantes

o El modelo fuerza la integridad referencial Por ejemplo no es posible

que las medidas contengan claves que no referencien valores vaacutelidos en una dimensioacuten

o El modelo favorece la consistencia de datos al facilitar la reutilizacioacuten de

dimensiones con muacuteltiples medidas

o El orden de los miembros de las dimensiones se mantiene Esto

simplifica los caacutelculos como por ejemplo el anaacutelisis de series temporales Cuando el orden de los miembros de las dimensiones se mantiene las funciones pueden usar la posicioacuten de un miembro de una dimensioacuten por lo que se simplifica la definicioacuten de los caacutelculos y se reduce la necesidad de atributos dimensionales

o Toda la base de datos se presenta como precalculada sin tener en cuenta

si los datos se han precalculado o se calculan en tiempo ejecucioacuten Las aplicaciones no necesitan especificar reglas de agregacioacuten o joins cuando consultan la base de datos Las aplicaciones SQL no se preocupan de coacutemo los datos estaacuten precalculados simplemente consultan los datos

Oracle OLAP representa un cambio fundamental en la tecnologiacutea OLAP Las bases de datos relacionales y multidimensionales se han unido para proporcionar capacidades analiacuteticas propias de una base de datos multidimensional en el contexto de la base de datos Oracle

Todas estas ventajas se obtienen a la vez que se mantiene la potencia de un servidor OLAP dedicado Oracle OLAP proporciona un conjunto de funciones analiacuteticas a traveacutes de la OLAP API un motor multidimensional y un lenguaje de manipulacioacuten de datos OLAP El resultado es un sistema de menor coste maacutes seguro y fiable que da soporte a aplicaciones analiacuteticas de consulta y de generacioacuten de informes

33 Ejercicio con OLAP

Para realizar la practica de OLAP utilizaremos el software Pentaho lo primero que realizaremos seraacute Descargaremos un archivo desde internet llamando pentaho_demo_mysql Ya que trabajaremos con la base de datos de la unidad pasada El archivo descargado es una carpeta comprimida en la que vienen todos los archivos necesarios para que el portal funcione lo uacutenico que hay que hacer es descomprimir el archivo en el lugar en que mejor nos parezca

Una vez descomprimida la carpeta se debe establecer la contrasentildea de publicacioacuten en el portal Esto se hace entrando en el archivo CProgram Filespentaho_demo_mysql5-160GA863pentaho-demopentaho-solutionssystempublisher_configxml Y escribir la contrasentildea en medio de las etiquetas como se muestra en la figura

Este password se usara en el momento de publicar el cubo en el portal de Pentaho

Una vez realizado descomprimimos la carpeta proporcionada por la profesora y simplemente extraemos los archivos esta es una carpeta comprimida que no necesita proceso de instalacioacuten sino que solo es necesario descomprimirla en el lugar que uno prefiera En este caso se hizo en cProgram Files

Nota Antes de empezar el servicio de la base de datos debe estar activo

Lo primero que debe hacerse es subir el portal de Pentaho lo que se hace corriendo el archivo start-pentahobat que estaacute en la carpeta descomprimida

Una vez esteacute listo Pentaho se inicia el cube designer dando doble click sobra el icono de la carpeta que descomprimimos anteriormente

El primer paso es especificar el origen de los datos daacutendole un nombre seleccionando el driver seguacuten el motor que se esteacute usando en este caso es mySql y el usuario y el password que se usara en la conexioacuten

El siguiente paso es seleccionar los campos de la base de datos que seraacuten usados en el cubo Arrastrando las tablas que aparecen en la parte inferior izquierda y palomeando los atributos de cada tabla deseada

A continuacioacuten seleccionaremos el campo de la base de datos que contiene la unidad de medida que va a ser analizada en el cubo

Seguido de esto viene la creacioacuten de las dimensiones del cubo

Seleccionando el campo y dando clic en Add new dimension

Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo

Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456

Si es exitosa la publicacioacuten debe salir

Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe

Y se ingresa en NavigateSoluciones

Una vez alliacute entramos en Ejemplos de Anaacutelisis

Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos

El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten

Page 7: Unidad 3 tsbd olap

formando una nueva entidad que puede ser compartida con otros cubos es decir pueden ser dimensiones de otros cubos (ver la figura 426) La utilidad principal de este modelo es que al tener dimensiones que puede ser compartidas por diferentes cubos se tendraacute un mejor uso del espacio de almacenamiento evitando la redundancia

Esquema de constelaciones

Operaciones con cubos

Una vez que se tienen los cubos se puede realizar diferentes operaciones sobre ellos para visualizar y analizar la informacioacuten las operaciones son

a) Generalizar y especializar o como en la bibliografiacutea se conoce abstraccioacuten y concrecioacuten (generalizar y especializar)

b) Corte y corte de cubos (ldquoSlice amp Dicerdquo)

c) Filtrar

d) Pivotear

Estas operaciones se realizan sobre los cubos (ldquocubingrdquo) y generan como resultados sub-cubos llamados ldquocuboidesrdquo

La especializacioacuten y la generalizacioacuten son operaciones que sirven para navegar un cubo sobre sus dimensiones Las dimensiones que ofrecen diferentes niveles de abstraccioacuten podraacuten ser navegables por ejemplo supongamos que tenemos la dimensioacuten tiempo que tiene los nivel de abstraccioacuten antildeo semestre mes semana y diacutea una operacioacuten de especializacioacuten nos permitiraacute interactivamente visualizar los hechos desde el agregado total por antildeo e ir descendiendo hasta el detalle por diacutea la operacioacuten generalizar permitiraacute lo contrario desde cualquier nivel podraacute generalizar a un nivel superior por ejemplo de semana a mes En resumen las operaciones especializar y generalizar realizan el proceso siguiente

Detalle 1048774 GENERALIZACION 1048774 Alto nivel - generalizar

Alto nivel 1048774 ESPECIALIZACION 1048774 Detalle - especializar

Operaciones sobre cubos especializar y generalizar

Las operaciones de corte y corte de cubo sirven para ver subconjuntos de cubos es maacutes se dice que como resultado generan ldquosubcubosrdquo o ldquocuboidesrdquo La operacioacuten ldquocorterdquo como la palabra lo indica es una operacioacuten que genera una rebanada del cubo por ejemplo si de una dimensioacuten tiempo de un cubo uacutenicamente tomamos el mes de ldquoMarzordquo y dejamos ver el resto de las dimensiones entonces tendremos la rebanada o corte que corresponde al mes de ldquoMarzordquo Si ademaacutes de eso condicionamos la dimensioacuten ldquoproveedorrdquo seleccionando el proveedor ldquoXrdquo de un cubo de ldquocomprasrdquo entonces estaremos obteniendo un ldquosubcubordquo este uacuteltimo es el resultado de una operacioacuten de corte de cubo

311 Servidores de Procesamiento Analiacutetico en Liacutenea

El servidor de procesamiento analiacutetico en liacutenea permite definir y navegar un modelo multidimensional El servidor de procesamiento analiacutetico en liacutenea es un administrador de base de datos especializado en el almacenamiento de cubos y en responder de manera optima a las operaciones sobre ellos El servidor de procesamiento analiacutetico en liacutenea puede ser implementado sobre un DBMS relacional (RDBMS) en cuyo caso se denomina servidor de procesamiento analiacutetico en liacutenea relacional (servidor ROLAP) Este servidor de procesamiento analiacutetico en liacutenea almacena los cubos en tablas relacionales y las operaciones sobre ellos se realizan con SQL o con un SQL extendido para manejar cubos Ademaacutes el RDBMS proporciona lagunas funcionalidades para implementar tanto los cubos como las operaciones sobre ellos por ejemplo las vistas materializadas o los iacutendices ldquobitmaprdquo Cuando se utiliza un servidor especializado para almacenar modelos de datos multidimensionales el servidor se conoce como servidor de procesamiento analiacutetico en liacutenea multidimensional (ldquoServidor MOLAPrdquo) el

cual almacena los datos multidimensionales directamente en estructuras de datos especiales (arreglos) e implementa las operaciones de procesamiento analiacutetico en liacutenea sobre esas estructuras

Existe tambieacuten un tipo hiacutebrido de procesamiento analiacutetico llamado servidor de procesamiento analiacutetico en liacutenea hiacutebrido (HOLAP) que implementa las ventajas de ROLAP y MOLAP utilizando cubos en MOLAP y cuando se quiere ir al detalle de la informacioacuten utiliza la que se encuentran en tablas de relaciones

En cualquiera de los tres casos es necesario almacenar tres tipos de datos datos de tabla de hechos (las transacciones) los agregados y las dimensiones

En un servidor ROLAP cada fila en una tabla de hechos tiene una columna para cada dimensioacuten y medida Las bases de datos MOLAP almacenan los datos de hechos en un formato multidimensional pero si hay muchas dimensiones estos datos estaraacuten dispersos y el formato multidimensional no tendraacute buen desempentildeo Un sistema HOLAP resuelve este problema dejando los datos de mayor granularidad en la base de datos relacional pero almacena los datos en un formato multidimensional

312 Utilizacioacuten de las Herramientas OLAP

Se dice que las herramientas de procesamiento analiacutetico en liacutenea son de naturaleza reactiva puesto que el trabajador de conocimiento o analista la utilizaraacute para ver lo que ha pasado e identificaraacute indicadores que le permitan corregir el rumbo por ejemplo si al darse cuenta que la tendencia ha sido comprar en ldquointernetrdquo probablemente deberiacutea revisar si estaacute recibiendo los descuentos que podriacutea obtener en libreriacuteas o valdriacutea la pena revisar cuanto estaacute pagando por gastos de enviacuteo para saber si realmente estaacute ahorrando

El procesamiento analiacutetico en liacutenea nos ofrece reportes y graacuteficos interactivos que si tuvieran que hacer a partir de las fuentes operacionales seria un proceso complejo de integracioacuten de datos que generariacutea resultados de poca precisioacuten y por lo tanto poca confiabilidad ademaacutes de que se invertiriacutea mucho tiempo en completar la construccioacuten de los reportes tiempo que seriacutea maacutes valioso si se empleara para analizar y tomar decisiones

32 Oracle OLAP

Las herramientas de generacioacuten de informes y consultas adhoc generalmente se despliegan utilizando datawarehouses y herramientas basadas en SQL mientras que aplicaciones maacutes sofisticadas de anaacutelisis y planificacioacuten se despliegan utilizando otras bases de datos y herramientas

Esta separacioacuten entre data warehouses y bases de datos analiacuteticas es sin embargo costosa El coste de mantenimiento de bases de datos separadas supone recursos adicionales hardware y administradores

Oracle elimina estas barreras proporcionando una base de datos preparada para el anaacutelisis Oracle OLAP parte de la base de datos Oracle proporciona la funcionalidad analiacutetica de una base de datos especializada a la vez que elimina la necesidad de gestionar bases de datos separadas

Oracle cambia el planteamiento tradicional ofreciendo una base de datos integrada relacional-multidimensional Oracle RDBMS-MDDS elimina la decisioacuten entre gestionabilidad y rendimiento-poder analiacutetico Oracle simplifica el proceso y reduce el coste de mantenimiento de los datos a la vez que se mantiene la habilidad de hacer complejas consultas analiacuteticas y proporciona un rendimiento excelente

Arquitectura con base de datos Oracle integrada

Oracle OLAP es parte de una plataforma integrada de data warehousing y business intelligence que contiene funcionalidad ETL OLAP y data mining en la base de datos Hay muchos beneficios derivados de tener una base de datos RDBMS-MDDS completamente integrada en comparacioacuten con bases de datos multidimensionales y separados

Gestioacuten maacutes simple Alta disponibilidad

Seguridad mejorada Acceso abierto desde clientes SQL y OLAP API

Ciclo de informacioacuten reducido Mayor fiabilidad de la informacioacuten

La base de datos relacional-multidimensional Oracle se compone de tres tecnologiacuteas

La tecnologiacutea relacional gestiona los objetos de base de datos y proporciona una interfaz SQL a los datos

La tecnologiacutea de objetos permite a la base de datos gestionar datos no relacionales

La tecnologiacutea OLAP proporciona funcionalidad analiacutetica avanzada en el contexto de un modelo multidimensional

Componentes Oracle Database OLAP

SQL puede acceder a datos multidimensionales a traveacutes de funciones de tabla o vistas relacionales Usando aplicaciones PLSQL SQL pueden interactuar directamente con el motor multidimensional

Todas las tecnologiacuteas mdash relacional objetos y OLAP mdash estaacuten contenidas en un solo proceso la base de datos se trata como una sola instancia integrada

Como la tecnologiacutea OLAP es parte de un solo proceso de base de datos proporciona la misma escalabilidad y fiabilidad que el proceso de base de datos Oracle

En Oracle todos los datos mdash relacional y multidimensional mdash se almacenan en los ficheros de datos Oracle No hay ficheros multidimensionales separados que debamos gestionar Los tipos de datos relacional y multidimensional pueden coexistir en los mismos ficheros de datos Los datos multidimensionales se almacenan en la base de datos en lo que se llaman analytic workspaces

Oracle OLAP esta basado en un modelo de datos multidimensional Eacuteste se presenta como un modelo loacutegico a traveacutes de las OLAP API y OLAP DML

MODELO LOacuteGICO EN LA OLAP API

El modelo multidimensional proporciona algunos beneficios al usuario de las aplicaciones analiacuteticas Los maacutes importantes son

o Es faacutecilmente entendible por los usuarios no expertos

o Proporciona el contexto para la seleccioacuten de datos

o Simplifica el proceso de definicioacuten de caacuteluclos hasta que usuarios no

expertos pueden usar el lenguaje de caacutelculo

El modelo multidimensional loacutegico se presenta a traveacutes de las OLAP API y OLAP DML con los siguientes elementos

Medidas

Dimensiones

Niveles

Jerarquiacuteas

Atributos

Una medida representa hechos Ventas en euros y ventas unitarias son ejemplos de medidas Una medida es anaacuteloga a una columna de hechos en una tabla de hechos pero el cataacutelogo OLAP proporciona meta datos maacutes completos para describirlo Las dimensiones proporcionan la estructura a los datos organizaacutendolos en niveles y jerarquiacuteas y proporcionaacutendoles atributos Algunos ejemplos de dimensiones son Producto Geografiacutea Tiempo etc

Como los analytic workspaces almacenan datos se necesita un modelo fiacutesico de base de datos para organizarlos datos Oracle OLAP usa un modelo multidimensional como base para el modelo fiacutesico en los analytic workspaces Este modelo proporciona beneficios importantes

o El modelo fuerza la integridad referencial Por ejemplo no es posible

que las medidas contengan claves que no referencien valores vaacutelidos en una dimensioacuten

o El modelo favorece la consistencia de datos al facilitar la reutilizacioacuten de

dimensiones con muacuteltiples medidas

o El orden de los miembros de las dimensiones se mantiene Esto

simplifica los caacutelculos como por ejemplo el anaacutelisis de series temporales Cuando el orden de los miembros de las dimensiones se mantiene las funciones pueden usar la posicioacuten de un miembro de una dimensioacuten por lo que se simplifica la definicioacuten de los caacutelculos y se reduce la necesidad de atributos dimensionales

o Toda la base de datos se presenta como precalculada sin tener en cuenta

si los datos se han precalculado o se calculan en tiempo ejecucioacuten Las aplicaciones no necesitan especificar reglas de agregacioacuten o joins cuando consultan la base de datos Las aplicaciones SQL no se preocupan de coacutemo los datos estaacuten precalculados simplemente consultan los datos

Oracle OLAP representa un cambio fundamental en la tecnologiacutea OLAP Las bases de datos relacionales y multidimensionales se han unido para proporcionar capacidades analiacuteticas propias de una base de datos multidimensional en el contexto de la base de datos Oracle

Todas estas ventajas se obtienen a la vez que se mantiene la potencia de un servidor OLAP dedicado Oracle OLAP proporciona un conjunto de funciones analiacuteticas a traveacutes de la OLAP API un motor multidimensional y un lenguaje de manipulacioacuten de datos OLAP El resultado es un sistema de menor coste maacutes seguro y fiable que da soporte a aplicaciones analiacuteticas de consulta y de generacioacuten de informes

33 Ejercicio con OLAP

Para realizar la practica de OLAP utilizaremos el software Pentaho lo primero que realizaremos seraacute Descargaremos un archivo desde internet llamando pentaho_demo_mysql Ya que trabajaremos con la base de datos de la unidad pasada El archivo descargado es una carpeta comprimida en la que vienen todos los archivos necesarios para que el portal funcione lo uacutenico que hay que hacer es descomprimir el archivo en el lugar en que mejor nos parezca

Una vez descomprimida la carpeta se debe establecer la contrasentildea de publicacioacuten en el portal Esto se hace entrando en el archivo CProgram Filespentaho_demo_mysql5-160GA863pentaho-demopentaho-solutionssystempublisher_configxml Y escribir la contrasentildea en medio de las etiquetas como se muestra en la figura

Este password se usara en el momento de publicar el cubo en el portal de Pentaho

Una vez realizado descomprimimos la carpeta proporcionada por la profesora y simplemente extraemos los archivos esta es una carpeta comprimida que no necesita proceso de instalacioacuten sino que solo es necesario descomprimirla en el lugar que uno prefiera En este caso se hizo en cProgram Files

Nota Antes de empezar el servicio de la base de datos debe estar activo

Lo primero que debe hacerse es subir el portal de Pentaho lo que se hace corriendo el archivo start-pentahobat que estaacute en la carpeta descomprimida

Una vez esteacute listo Pentaho se inicia el cube designer dando doble click sobra el icono de la carpeta que descomprimimos anteriormente

El primer paso es especificar el origen de los datos daacutendole un nombre seleccionando el driver seguacuten el motor que se esteacute usando en este caso es mySql y el usuario y el password que se usara en la conexioacuten

El siguiente paso es seleccionar los campos de la base de datos que seraacuten usados en el cubo Arrastrando las tablas que aparecen en la parte inferior izquierda y palomeando los atributos de cada tabla deseada

A continuacioacuten seleccionaremos el campo de la base de datos que contiene la unidad de medida que va a ser analizada en el cubo

Seguido de esto viene la creacioacuten de las dimensiones del cubo

Seleccionando el campo y dando clic en Add new dimension

Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo

Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456

Si es exitosa la publicacioacuten debe salir

Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe

Y se ingresa en NavigateSoluciones

Una vez alliacute entramos en Ejemplos de Anaacutelisis

Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos

El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten

Page 8: Unidad 3 tsbd olap

Alto nivel 1048774 ESPECIALIZACION 1048774 Detalle - especializar

Operaciones sobre cubos especializar y generalizar

Las operaciones de corte y corte de cubo sirven para ver subconjuntos de cubos es maacutes se dice que como resultado generan ldquosubcubosrdquo o ldquocuboidesrdquo La operacioacuten ldquocorterdquo como la palabra lo indica es una operacioacuten que genera una rebanada del cubo por ejemplo si de una dimensioacuten tiempo de un cubo uacutenicamente tomamos el mes de ldquoMarzordquo y dejamos ver el resto de las dimensiones entonces tendremos la rebanada o corte que corresponde al mes de ldquoMarzordquo Si ademaacutes de eso condicionamos la dimensioacuten ldquoproveedorrdquo seleccionando el proveedor ldquoXrdquo de un cubo de ldquocomprasrdquo entonces estaremos obteniendo un ldquosubcubordquo este uacuteltimo es el resultado de una operacioacuten de corte de cubo

311 Servidores de Procesamiento Analiacutetico en Liacutenea

El servidor de procesamiento analiacutetico en liacutenea permite definir y navegar un modelo multidimensional El servidor de procesamiento analiacutetico en liacutenea es un administrador de base de datos especializado en el almacenamiento de cubos y en responder de manera optima a las operaciones sobre ellos El servidor de procesamiento analiacutetico en liacutenea puede ser implementado sobre un DBMS relacional (RDBMS) en cuyo caso se denomina servidor de procesamiento analiacutetico en liacutenea relacional (servidor ROLAP) Este servidor de procesamiento analiacutetico en liacutenea almacena los cubos en tablas relacionales y las operaciones sobre ellos se realizan con SQL o con un SQL extendido para manejar cubos Ademaacutes el RDBMS proporciona lagunas funcionalidades para implementar tanto los cubos como las operaciones sobre ellos por ejemplo las vistas materializadas o los iacutendices ldquobitmaprdquo Cuando se utiliza un servidor especializado para almacenar modelos de datos multidimensionales el servidor se conoce como servidor de procesamiento analiacutetico en liacutenea multidimensional (ldquoServidor MOLAPrdquo) el

cual almacena los datos multidimensionales directamente en estructuras de datos especiales (arreglos) e implementa las operaciones de procesamiento analiacutetico en liacutenea sobre esas estructuras

Existe tambieacuten un tipo hiacutebrido de procesamiento analiacutetico llamado servidor de procesamiento analiacutetico en liacutenea hiacutebrido (HOLAP) que implementa las ventajas de ROLAP y MOLAP utilizando cubos en MOLAP y cuando se quiere ir al detalle de la informacioacuten utiliza la que se encuentran en tablas de relaciones

En cualquiera de los tres casos es necesario almacenar tres tipos de datos datos de tabla de hechos (las transacciones) los agregados y las dimensiones

En un servidor ROLAP cada fila en una tabla de hechos tiene una columna para cada dimensioacuten y medida Las bases de datos MOLAP almacenan los datos de hechos en un formato multidimensional pero si hay muchas dimensiones estos datos estaraacuten dispersos y el formato multidimensional no tendraacute buen desempentildeo Un sistema HOLAP resuelve este problema dejando los datos de mayor granularidad en la base de datos relacional pero almacena los datos en un formato multidimensional

312 Utilizacioacuten de las Herramientas OLAP

Se dice que las herramientas de procesamiento analiacutetico en liacutenea son de naturaleza reactiva puesto que el trabajador de conocimiento o analista la utilizaraacute para ver lo que ha pasado e identificaraacute indicadores que le permitan corregir el rumbo por ejemplo si al darse cuenta que la tendencia ha sido comprar en ldquointernetrdquo probablemente deberiacutea revisar si estaacute recibiendo los descuentos que podriacutea obtener en libreriacuteas o valdriacutea la pena revisar cuanto estaacute pagando por gastos de enviacuteo para saber si realmente estaacute ahorrando

El procesamiento analiacutetico en liacutenea nos ofrece reportes y graacuteficos interactivos que si tuvieran que hacer a partir de las fuentes operacionales seria un proceso complejo de integracioacuten de datos que generariacutea resultados de poca precisioacuten y por lo tanto poca confiabilidad ademaacutes de que se invertiriacutea mucho tiempo en completar la construccioacuten de los reportes tiempo que seriacutea maacutes valioso si se empleara para analizar y tomar decisiones

32 Oracle OLAP

Las herramientas de generacioacuten de informes y consultas adhoc generalmente se despliegan utilizando datawarehouses y herramientas basadas en SQL mientras que aplicaciones maacutes sofisticadas de anaacutelisis y planificacioacuten se despliegan utilizando otras bases de datos y herramientas

Esta separacioacuten entre data warehouses y bases de datos analiacuteticas es sin embargo costosa El coste de mantenimiento de bases de datos separadas supone recursos adicionales hardware y administradores

Oracle elimina estas barreras proporcionando una base de datos preparada para el anaacutelisis Oracle OLAP parte de la base de datos Oracle proporciona la funcionalidad analiacutetica de una base de datos especializada a la vez que elimina la necesidad de gestionar bases de datos separadas

Oracle cambia el planteamiento tradicional ofreciendo una base de datos integrada relacional-multidimensional Oracle RDBMS-MDDS elimina la decisioacuten entre gestionabilidad y rendimiento-poder analiacutetico Oracle simplifica el proceso y reduce el coste de mantenimiento de los datos a la vez que se mantiene la habilidad de hacer complejas consultas analiacuteticas y proporciona un rendimiento excelente

Arquitectura con base de datos Oracle integrada

Oracle OLAP es parte de una plataforma integrada de data warehousing y business intelligence que contiene funcionalidad ETL OLAP y data mining en la base de datos Hay muchos beneficios derivados de tener una base de datos RDBMS-MDDS completamente integrada en comparacioacuten con bases de datos multidimensionales y separados

Gestioacuten maacutes simple Alta disponibilidad

Seguridad mejorada Acceso abierto desde clientes SQL y OLAP API

Ciclo de informacioacuten reducido Mayor fiabilidad de la informacioacuten

La base de datos relacional-multidimensional Oracle se compone de tres tecnologiacuteas

La tecnologiacutea relacional gestiona los objetos de base de datos y proporciona una interfaz SQL a los datos

La tecnologiacutea de objetos permite a la base de datos gestionar datos no relacionales

La tecnologiacutea OLAP proporciona funcionalidad analiacutetica avanzada en el contexto de un modelo multidimensional

Componentes Oracle Database OLAP

SQL puede acceder a datos multidimensionales a traveacutes de funciones de tabla o vistas relacionales Usando aplicaciones PLSQL SQL pueden interactuar directamente con el motor multidimensional

Todas las tecnologiacuteas mdash relacional objetos y OLAP mdash estaacuten contenidas en un solo proceso la base de datos se trata como una sola instancia integrada

Como la tecnologiacutea OLAP es parte de un solo proceso de base de datos proporciona la misma escalabilidad y fiabilidad que el proceso de base de datos Oracle

En Oracle todos los datos mdash relacional y multidimensional mdash se almacenan en los ficheros de datos Oracle No hay ficheros multidimensionales separados que debamos gestionar Los tipos de datos relacional y multidimensional pueden coexistir en los mismos ficheros de datos Los datos multidimensionales se almacenan en la base de datos en lo que se llaman analytic workspaces

Oracle OLAP esta basado en un modelo de datos multidimensional Eacuteste se presenta como un modelo loacutegico a traveacutes de las OLAP API y OLAP DML

MODELO LOacuteGICO EN LA OLAP API

El modelo multidimensional proporciona algunos beneficios al usuario de las aplicaciones analiacuteticas Los maacutes importantes son

o Es faacutecilmente entendible por los usuarios no expertos

o Proporciona el contexto para la seleccioacuten de datos

o Simplifica el proceso de definicioacuten de caacuteluclos hasta que usuarios no

expertos pueden usar el lenguaje de caacutelculo

El modelo multidimensional loacutegico se presenta a traveacutes de las OLAP API y OLAP DML con los siguientes elementos

Medidas

Dimensiones

Niveles

Jerarquiacuteas

Atributos

Una medida representa hechos Ventas en euros y ventas unitarias son ejemplos de medidas Una medida es anaacuteloga a una columna de hechos en una tabla de hechos pero el cataacutelogo OLAP proporciona meta datos maacutes completos para describirlo Las dimensiones proporcionan la estructura a los datos organizaacutendolos en niveles y jerarquiacuteas y proporcionaacutendoles atributos Algunos ejemplos de dimensiones son Producto Geografiacutea Tiempo etc

Como los analytic workspaces almacenan datos se necesita un modelo fiacutesico de base de datos para organizarlos datos Oracle OLAP usa un modelo multidimensional como base para el modelo fiacutesico en los analytic workspaces Este modelo proporciona beneficios importantes

o El modelo fuerza la integridad referencial Por ejemplo no es posible

que las medidas contengan claves que no referencien valores vaacutelidos en una dimensioacuten

o El modelo favorece la consistencia de datos al facilitar la reutilizacioacuten de

dimensiones con muacuteltiples medidas

o El orden de los miembros de las dimensiones se mantiene Esto

simplifica los caacutelculos como por ejemplo el anaacutelisis de series temporales Cuando el orden de los miembros de las dimensiones se mantiene las funciones pueden usar la posicioacuten de un miembro de una dimensioacuten por lo que se simplifica la definicioacuten de los caacutelculos y se reduce la necesidad de atributos dimensionales

o Toda la base de datos se presenta como precalculada sin tener en cuenta

si los datos se han precalculado o se calculan en tiempo ejecucioacuten Las aplicaciones no necesitan especificar reglas de agregacioacuten o joins cuando consultan la base de datos Las aplicaciones SQL no se preocupan de coacutemo los datos estaacuten precalculados simplemente consultan los datos

Oracle OLAP representa un cambio fundamental en la tecnologiacutea OLAP Las bases de datos relacionales y multidimensionales se han unido para proporcionar capacidades analiacuteticas propias de una base de datos multidimensional en el contexto de la base de datos Oracle

Todas estas ventajas se obtienen a la vez que se mantiene la potencia de un servidor OLAP dedicado Oracle OLAP proporciona un conjunto de funciones analiacuteticas a traveacutes de la OLAP API un motor multidimensional y un lenguaje de manipulacioacuten de datos OLAP El resultado es un sistema de menor coste maacutes seguro y fiable que da soporte a aplicaciones analiacuteticas de consulta y de generacioacuten de informes

33 Ejercicio con OLAP

Para realizar la practica de OLAP utilizaremos el software Pentaho lo primero que realizaremos seraacute Descargaremos un archivo desde internet llamando pentaho_demo_mysql Ya que trabajaremos con la base de datos de la unidad pasada El archivo descargado es una carpeta comprimida en la que vienen todos los archivos necesarios para que el portal funcione lo uacutenico que hay que hacer es descomprimir el archivo en el lugar en que mejor nos parezca

Una vez descomprimida la carpeta se debe establecer la contrasentildea de publicacioacuten en el portal Esto se hace entrando en el archivo CProgram Filespentaho_demo_mysql5-160GA863pentaho-demopentaho-solutionssystempublisher_configxml Y escribir la contrasentildea en medio de las etiquetas como se muestra en la figura

Este password se usara en el momento de publicar el cubo en el portal de Pentaho

Una vez realizado descomprimimos la carpeta proporcionada por la profesora y simplemente extraemos los archivos esta es una carpeta comprimida que no necesita proceso de instalacioacuten sino que solo es necesario descomprimirla en el lugar que uno prefiera En este caso se hizo en cProgram Files

Nota Antes de empezar el servicio de la base de datos debe estar activo

Lo primero que debe hacerse es subir el portal de Pentaho lo que se hace corriendo el archivo start-pentahobat que estaacute en la carpeta descomprimida

Una vez esteacute listo Pentaho se inicia el cube designer dando doble click sobra el icono de la carpeta que descomprimimos anteriormente

El primer paso es especificar el origen de los datos daacutendole un nombre seleccionando el driver seguacuten el motor que se esteacute usando en este caso es mySql y el usuario y el password que se usara en la conexioacuten

El siguiente paso es seleccionar los campos de la base de datos que seraacuten usados en el cubo Arrastrando las tablas que aparecen en la parte inferior izquierda y palomeando los atributos de cada tabla deseada

A continuacioacuten seleccionaremos el campo de la base de datos que contiene la unidad de medida que va a ser analizada en el cubo

Seguido de esto viene la creacioacuten de las dimensiones del cubo

Seleccionando el campo y dando clic en Add new dimension

Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo

Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456

Si es exitosa la publicacioacuten debe salir

Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe

Y se ingresa en NavigateSoluciones

Una vez alliacute entramos en Ejemplos de Anaacutelisis

Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos

El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten

Page 9: Unidad 3 tsbd olap

cual almacena los datos multidimensionales directamente en estructuras de datos especiales (arreglos) e implementa las operaciones de procesamiento analiacutetico en liacutenea sobre esas estructuras

Existe tambieacuten un tipo hiacutebrido de procesamiento analiacutetico llamado servidor de procesamiento analiacutetico en liacutenea hiacutebrido (HOLAP) que implementa las ventajas de ROLAP y MOLAP utilizando cubos en MOLAP y cuando se quiere ir al detalle de la informacioacuten utiliza la que se encuentran en tablas de relaciones

En cualquiera de los tres casos es necesario almacenar tres tipos de datos datos de tabla de hechos (las transacciones) los agregados y las dimensiones

En un servidor ROLAP cada fila en una tabla de hechos tiene una columna para cada dimensioacuten y medida Las bases de datos MOLAP almacenan los datos de hechos en un formato multidimensional pero si hay muchas dimensiones estos datos estaraacuten dispersos y el formato multidimensional no tendraacute buen desempentildeo Un sistema HOLAP resuelve este problema dejando los datos de mayor granularidad en la base de datos relacional pero almacena los datos en un formato multidimensional

312 Utilizacioacuten de las Herramientas OLAP

Se dice que las herramientas de procesamiento analiacutetico en liacutenea son de naturaleza reactiva puesto que el trabajador de conocimiento o analista la utilizaraacute para ver lo que ha pasado e identificaraacute indicadores que le permitan corregir el rumbo por ejemplo si al darse cuenta que la tendencia ha sido comprar en ldquointernetrdquo probablemente deberiacutea revisar si estaacute recibiendo los descuentos que podriacutea obtener en libreriacuteas o valdriacutea la pena revisar cuanto estaacute pagando por gastos de enviacuteo para saber si realmente estaacute ahorrando

El procesamiento analiacutetico en liacutenea nos ofrece reportes y graacuteficos interactivos que si tuvieran que hacer a partir de las fuentes operacionales seria un proceso complejo de integracioacuten de datos que generariacutea resultados de poca precisioacuten y por lo tanto poca confiabilidad ademaacutes de que se invertiriacutea mucho tiempo en completar la construccioacuten de los reportes tiempo que seriacutea maacutes valioso si se empleara para analizar y tomar decisiones

32 Oracle OLAP

Las herramientas de generacioacuten de informes y consultas adhoc generalmente se despliegan utilizando datawarehouses y herramientas basadas en SQL mientras que aplicaciones maacutes sofisticadas de anaacutelisis y planificacioacuten se despliegan utilizando otras bases de datos y herramientas

Esta separacioacuten entre data warehouses y bases de datos analiacuteticas es sin embargo costosa El coste de mantenimiento de bases de datos separadas supone recursos adicionales hardware y administradores

Oracle elimina estas barreras proporcionando una base de datos preparada para el anaacutelisis Oracle OLAP parte de la base de datos Oracle proporciona la funcionalidad analiacutetica de una base de datos especializada a la vez que elimina la necesidad de gestionar bases de datos separadas

Oracle cambia el planteamiento tradicional ofreciendo una base de datos integrada relacional-multidimensional Oracle RDBMS-MDDS elimina la decisioacuten entre gestionabilidad y rendimiento-poder analiacutetico Oracle simplifica el proceso y reduce el coste de mantenimiento de los datos a la vez que se mantiene la habilidad de hacer complejas consultas analiacuteticas y proporciona un rendimiento excelente

Arquitectura con base de datos Oracle integrada

Oracle OLAP es parte de una plataforma integrada de data warehousing y business intelligence que contiene funcionalidad ETL OLAP y data mining en la base de datos Hay muchos beneficios derivados de tener una base de datos RDBMS-MDDS completamente integrada en comparacioacuten con bases de datos multidimensionales y separados

Gestioacuten maacutes simple Alta disponibilidad

Seguridad mejorada Acceso abierto desde clientes SQL y OLAP API

Ciclo de informacioacuten reducido Mayor fiabilidad de la informacioacuten

La base de datos relacional-multidimensional Oracle se compone de tres tecnologiacuteas

La tecnologiacutea relacional gestiona los objetos de base de datos y proporciona una interfaz SQL a los datos

La tecnologiacutea de objetos permite a la base de datos gestionar datos no relacionales

La tecnologiacutea OLAP proporciona funcionalidad analiacutetica avanzada en el contexto de un modelo multidimensional

Componentes Oracle Database OLAP

SQL puede acceder a datos multidimensionales a traveacutes de funciones de tabla o vistas relacionales Usando aplicaciones PLSQL SQL pueden interactuar directamente con el motor multidimensional

Todas las tecnologiacuteas mdash relacional objetos y OLAP mdash estaacuten contenidas en un solo proceso la base de datos se trata como una sola instancia integrada

Como la tecnologiacutea OLAP es parte de un solo proceso de base de datos proporciona la misma escalabilidad y fiabilidad que el proceso de base de datos Oracle

En Oracle todos los datos mdash relacional y multidimensional mdash se almacenan en los ficheros de datos Oracle No hay ficheros multidimensionales separados que debamos gestionar Los tipos de datos relacional y multidimensional pueden coexistir en los mismos ficheros de datos Los datos multidimensionales se almacenan en la base de datos en lo que se llaman analytic workspaces

Oracle OLAP esta basado en un modelo de datos multidimensional Eacuteste se presenta como un modelo loacutegico a traveacutes de las OLAP API y OLAP DML

MODELO LOacuteGICO EN LA OLAP API

El modelo multidimensional proporciona algunos beneficios al usuario de las aplicaciones analiacuteticas Los maacutes importantes son

o Es faacutecilmente entendible por los usuarios no expertos

o Proporciona el contexto para la seleccioacuten de datos

o Simplifica el proceso de definicioacuten de caacuteluclos hasta que usuarios no

expertos pueden usar el lenguaje de caacutelculo

El modelo multidimensional loacutegico se presenta a traveacutes de las OLAP API y OLAP DML con los siguientes elementos

Medidas

Dimensiones

Niveles

Jerarquiacuteas

Atributos

Una medida representa hechos Ventas en euros y ventas unitarias son ejemplos de medidas Una medida es anaacuteloga a una columna de hechos en una tabla de hechos pero el cataacutelogo OLAP proporciona meta datos maacutes completos para describirlo Las dimensiones proporcionan la estructura a los datos organizaacutendolos en niveles y jerarquiacuteas y proporcionaacutendoles atributos Algunos ejemplos de dimensiones son Producto Geografiacutea Tiempo etc

Como los analytic workspaces almacenan datos se necesita un modelo fiacutesico de base de datos para organizarlos datos Oracle OLAP usa un modelo multidimensional como base para el modelo fiacutesico en los analytic workspaces Este modelo proporciona beneficios importantes

o El modelo fuerza la integridad referencial Por ejemplo no es posible

que las medidas contengan claves que no referencien valores vaacutelidos en una dimensioacuten

o El modelo favorece la consistencia de datos al facilitar la reutilizacioacuten de

dimensiones con muacuteltiples medidas

o El orden de los miembros de las dimensiones se mantiene Esto

simplifica los caacutelculos como por ejemplo el anaacutelisis de series temporales Cuando el orden de los miembros de las dimensiones se mantiene las funciones pueden usar la posicioacuten de un miembro de una dimensioacuten por lo que se simplifica la definicioacuten de los caacutelculos y se reduce la necesidad de atributos dimensionales

o Toda la base de datos se presenta como precalculada sin tener en cuenta

si los datos se han precalculado o se calculan en tiempo ejecucioacuten Las aplicaciones no necesitan especificar reglas de agregacioacuten o joins cuando consultan la base de datos Las aplicaciones SQL no se preocupan de coacutemo los datos estaacuten precalculados simplemente consultan los datos

Oracle OLAP representa un cambio fundamental en la tecnologiacutea OLAP Las bases de datos relacionales y multidimensionales se han unido para proporcionar capacidades analiacuteticas propias de una base de datos multidimensional en el contexto de la base de datos Oracle

Todas estas ventajas se obtienen a la vez que se mantiene la potencia de un servidor OLAP dedicado Oracle OLAP proporciona un conjunto de funciones analiacuteticas a traveacutes de la OLAP API un motor multidimensional y un lenguaje de manipulacioacuten de datos OLAP El resultado es un sistema de menor coste maacutes seguro y fiable que da soporte a aplicaciones analiacuteticas de consulta y de generacioacuten de informes

33 Ejercicio con OLAP

Para realizar la practica de OLAP utilizaremos el software Pentaho lo primero que realizaremos seraacute Descargaremos un archivo desde internet llamando pentaho_demo_mysql Ya que trabajaremos con la base de datos de la unidad pasada El archivo descargado es una carpeta comprimida en la que vienen todos los archivos necesarios para que el portal funcione lo uacutenico que hay que hacer es descomprimir el archivo en el lugar en que mejor nos parezca

Una vez descomprimida la carpeta se debe establecer la contrasentildea de publicacioacuten en el portal Esto se hace entrando en el archivo CProgram Filespentaho_demo_mysql5-160GA863pentaho-demopentaho-solutionssystempublisher_configxml Y escribir la contrasentildea en medio de las etiquetas como se muestra en la figura

Este password se usara en el momento de publicar el cubo en el portal de Pentaho

Una vez realizado descomprimimos la carpeta proporcionada por la profesora y simplemente extraemos los archivos esta es una carpeta comprimida que no necesita proceso de instalacioacuten sino que solo es necesario descomprimirla en el lugar que uno prefiera En este caso se hizo en cProgram Files

Nota Antes de empezar el servicio de la base de datos debe estar activo

Lo primero que debe hacerse es subir el portal de Pentaho lo que se hace corriendo el archivo start-pentahobat que estaacute en la carpeta descomprimida

Una vez esteacute listo Pentaho se inicia el cube designer dando doble click sobra el icono de la carpeta que descomprimimos anteriormente

El primer paso es especificar el origen de los datos daacutendole un nombre seleccionando el driver seguacuten el motor que se esteacute usando en este caso es mySql y el usuario y el password que se usara en la conexioacuten

El siguiente paso es seleccionar los campos de la base de datos que seraacuten usados en el cubo Arrastrando las tablas que aparecen en la parte inferior izquierda y palomeando los atributos de cada tabla deseada

A continuacioacuten seleccionaremos el campo de la base de datos que contiene la unidad de medida que va a ser analizada en el cubo

Seguido de esto viene la creacioacuten de las dimensiones del cubo

Seleccionando el campo y dando clic en Add new dimension

Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo

Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456

Si es exitosa la publicacioacuten debe salir

Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe

Y se ingresa en NavigateSoluciones

Una vez alliacute entramos en Ejemplos de Anaacutelisis

Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos

El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten

Page 10: Unidad 3 tsbd olap

Esta separacioacuten entre data warehouses y bases de datos analiacuteticas es sin embargo costosa El coste de mantenimiento de bases de datos separadas supone recursos adicionales hardware y administradores

Oracle elimina estas barreras proporcionando una base de datos preparada para el anaacutelisis Oracle OLAP parte de la base de datos Oracle proporciona la funcionalidad analiacutetica de una base de datos especializada a la vez que elimina la necesidad de gestionar bases de datos separadas

Oracle cambia el planteamiento tradicional ofreciendo una base de datos integrada relacional-multidimensional Oracle RDBMS-MDDS elimina la decisioacuten entre gestionabilidad y rendimiento-poder analiacutetico Oracle simplifica el proceso y reduce el coste de mantenimiento de los datos a la vez que se mantiene la habilidad de hacer complejas consultas analiacuteticas y proporciona un rendimiento excelente

Arquitectura con base de datos Oracle integrada

Oracle OLAP es parte de una plataforma integrada de data warehousing y business intelligence que contiene funcionalidad ETL OLAP y data mining en la base de datos Hay muchos beneficios derivados de tener una base de datos RDBMS-MDDS completamente integrada en comparacioacuten con bases de datos multidimensionales y separados

Gestioacuten maacutes simple Alta disponibilidad

Seguridad mejorada Acceso abierto desde clientes SQL y OLAP API

Ciclo de informacioacuten reducido Mayor fiabilidad de la informacioacuten

La base de datos relacional-multidimensional Oracle se compone de tres tecnologiacuteas

La tecnologiacutea relacional gestiona los objetos de base de datos y proporciona una interfaz SQL a los datos

La tecnologiacutea de objetos permite a la base de datos gestionar datos no relacionales

La tecnologiacutea OLAP proporciona funcionalidad analiacutetica avanzada en el contexto de un modelo multidimensional

Componentes Oracle Database OLAP

SQL puede acceder a datos multidimensionales a traveacutes de funciones de tabla o vistas relacionales Usando aplicaciones PLSQL SQL pueden interactuar directamente con el motor multidimensional

Todas las tecnologiacuteas mdash relacional objetos y OLAP mdash estaacuten contenidas en un solo proceso la base de datos se trata como una sola instancia integrada

Como la tecnologiacutea OLAP es parte de un solo proceso de base de datos proporciona la misma escalabilidad y fiabilidad que el proceso de base de datos Oracle

En Oracle todos los datos mdash relacional y multidimensional mdash se almacenan en los ficheros de datos Oracle No hay ficheros multidimensionales separados que debamos gestionar Los tipos de datos relacional y multidimensional pueden coexistir en los mismos ficheros de datos Los datos multidimensionales se almacenan en la base de datos en lo que se llaman analytic workspaces

Oracle OLAP esta basado en un modelo de datos multidimensional Eacuteste se presenta como un modelo loacutegico a traveacutes de las OLAP API y OLAP DML

MODELO LOacuteGICO EN LA OLAP API

El modelo multidimensional proporciona algunos beneficios al usuario de las aplicaciones analiacuteticas Los maacutes importantes son

o Es faacutecilmente entendible por los usuarios no expertos

o Proporciona el contexto para la seleccioacuten de datos

o Simplifica el proceso de definicioacuten de caacuteluclos hasta que usuarios no

expertos pueden usar el lenguaje de caacutelculo

El modelo multidimensional loacutegico se presenta a traveacutes de las OLAP API y OLAP DML con los siguientes elementos

Medidas

Dimensiones

Niveles

Jerarquiacuteas

Atributos

Una medida representa hechos Ventas en euros y ventas unitarias son ejemplos de medidas Una medida es anaacuteloga a una columna de hechos en una tabla de hechos pero el cataacutelogo OLAP proporciona meta datos maacutes completos para describirlo Las dimensiones proporcionan la estructura a los datos organizaacutendolos en niveles y jerarquiacuteas y proporcionaacutendoles atributos Algunos ejemplos de dimensiones son Producto Geografiacutea Tiempo etc

Como los analytic workspaces almacenan datos se necesita un modelo fiacutesico de base de datos para organizarlos datos Oracle OLAP usa un modelo multidimensional como base para el modelo fiacutesico en los analytic workspaces Este modelo proporciona beneficios importantes

o El modelo fuerza la integridad referencial Por ejemplo no es posible

que las medidas contengan claves que no referencien valores vaacutelidos en una dimensioacuten

o El modelo favorece la consistencia de datos al facilitar la reutilizacioacuten de

dimensiones con muacuteltiples medidas

o El orden de los miembros de las dimensiones se mantiene Esto

simplifica los caacutelculos como por ejemplo el anaacutelisis de series temporales Cuando el orden de los miembros de las dimensiones se mantiene las funciones pueden usar la posicioacuten de un miembro de una dimensioacuten por lo que se simplifica la definicioacuten de los caacutelculos y se reduce la necesidad de atributos dimensionales

o Toda la base de datos se presenta como precalculada sin tener en cuenta

si los datos se han precalculado o se calculan en tiempo ejecucioacuten Las aplicaciones no necesitan especificar reglas de agregacioacuten o joins cuando consultan la base de datos Las aplicaciones SQL no se preocupan de coacutemo los datos estaacuten precalculados simplemente consultan los datos

Oracle OLAP representa un cambio fundamental en la tecnologiacutea OLAP Las bases de datos relacionales y multidimensionales se han unido para proporcionar capacidades analiacuteticas propias de una base de datos multidimensional en el contexto de la base de datos Oracle

Todas estas ventajas se obtienen a la vez que se mantiene la potencia de un servidor OLAP dedicado Oracle OLAP proporciona un conjunto de funciones analiacuteticas a traveacutes de la OLAP API un motor multidimensional y un lenguaje de manipulacioacuten de datos OLAP El resultado es un sistema de menor coste maacutes seguro y fiable que da soporte a aplicaciones analiacuteticas de consulta y de generacioacuten de informes

33 Ejercicio con OLAP

Para realizar la practica de OLAP utilizaremos el software Pentaho lo primero que realizaremos seraacute Descargaremos un archivo desde internet llamando pentaho_demo_mysql Ya que trabajaremos con la base de datos de la unidad pasada El archivo descargado es una carpeta comprimida en la que vienen todos los archivos necesarios para que el portal funcione lo uacutenico que hay que hacer es descomprimir el archivo en el lugar en que mejor nos parezca

Una vez descomprimida la carpeta se debe establecer la contrasentildea de publicacioacuten en el portal Esto se hace entrando en el archivo CProgram Filespentaho_demo_mysql5-160GA863pentaho-demopentaho-solutionssystempublisher_configxml Y escribir la contrasentildea en medio de las etiquetas como se muestra en la figura

Este password se usara en el momento de publicar el cubo en el portal de Pentaho

Una vez realizado descomprimimos la carpeta proporcionada por la profesora y simplemente extraemos los archivos esta es una carpeta comprimida que no necesita proceso de instalacioacuten sino que solo es necesario descomprimirla en el lugar que uno prefiera En este caso se hizo en cProgram Files

Nota Antes de empezar el servicio de la base de datos debe estar activo

Lo primero que debe hacerse es subir el portal de Pentaho lo que se hace corriendo el archivo start-pentahobat que estaacute en la carpeta descomprimida

Una vez esteacute listo Pentaho se inicia el cube designer dando doble click sobra el icono de la carpeta que descomprimimos anteriormente

El primer paso es especificar el origen de los datos daacutendole un nombre seleccionando el driver seguacuten el motor que se esteacute usando en este caso es mySql y el usuario y el password que se usara en la conexioacuten

El siguiente paso es seleccionar los campos de la base de datos que seraacuten usados en el cubo Arrastrando las tablas que aparecen en la parte inferior izquierda y palomeando los atributos de cada tabla deseada

A continuacioacuten seleccionaremos el campo de la base de datos que contiene la unidad de medida que va a ser analizada en el cubo

Seguido de esto viene la creacioacuten de las dimensiones del cubo

Seleccionando el campo y dando clic en Add new dimension

Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo

Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456

Si es exitosa la publicacioacuten debe salir

Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe

Y se ingresa en NavigateSoluciones

Una vez alliacute entramos en Ejemplos de Anaacutelisis

Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos

El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten

Page 11: Unidad 3 tsbd olap

La tecnologiacutea OLAP proporciona funcionalidad analiacutetica avanzada en el contexto de un modelo multidimensional

Componentes Oracle Database OLAP

SQL puede acceder a datos multidimensionales a traveacutes de funciones de tabla o vistas relacionales Usando aplicaciones PLSQL SQL pueden interactuar directamente con el motor multidimensional

Todas las tecnologiacuteas mdash relacional objetos y OLAP mdash estaacuten contenidas en un solo proceso la base de datos se trata como una sola instancia integrada

Como la tecnologiacutea OLAP es parte de un solo proceso de base de datos proporciona la misma escalabilidad y fiabilidad que el proceso de base de datos Oracle

En Oracle todos los datos mdash relacional y multidimensional mdash se almacenan en los ficheros de datos Oracle No hay ficheros multidimensionales separados que debamos gestionar Los tipos de datos relacional y multidimensional pueden coexistir en los mismos ficheros de datos Los datos multidimensionales se almacenan en la base de datos en lo que se llaman analytic workspaces

Oracle OLAP esta basado en un modelo de datos multidimensional Eacuteste se presenta como un modelo loacutegico a traveacutes de las OLAP API y OLAP DML

MODELO LOacuteGICO EN LA OLAP API

El modelo multidimensional proporciona algunos beneficios al usuario de las aplicaciones analiacuteticas Los maacutes importantes son

o Es faacutecilmente entendible por los usuarios no expertos

o Proporciona el contexto para la seleccioacuten de datos

o Simplifica el proceso de definicioacuten de caacuteluclos hasta que usuarios no

expertos pueden usar el lenguaje de caacutelculo

El modelo multidimensional loacutegico se presenta a traveacutes de las OLAP API y OLAP DML con los siguientes elementos

Medidas

Dimensiones

Niveles

Jerarquiacuteas

Atributos

Una medida representa hechos Ventas en euros y ventas unitarias son ejemplos de medidas Una medida es anaacuteloga a una columna de hechos en una tabla de hechos pero el cataacutelogo OLAP proporciona meta datos maacutes completos para describirlo Las dimensiones proporcionan la estructura a los datos organizaacutendolos en niveles y jerarquiacuteas y proporcionaacutendoles atributos Algunos ejemplos de dimensiones son Producto Geografiacutea Tiempo etc

Como los analytic workspaces almacenan datos se necesita un modelo fiacutesico de base de datos para organizarlos datos Oracle OLAP usa un modelo multidimensional como base para el modelo fiacutesico en los analytic workspaces Este modelo proporciona beneficios importantes

o El modelo fuerza la integridad referencial Por ejemplo no es posible

que las medidas contengan claves que no referencien valores vaacutelidos en una dimensioacuten

o El modelo favorece la consistencia de datos al facilitar la reutilizacioacuten de

dimensiones con muacuteltiples medidas

o El orden de los miembros de las dimensiones se mantiene Esto

simplifica los caacutelculos como por ejemplo el anaacutelisis de series temporales Cuando el orden de los miembros de las dimensiones se mantiene las funciones pueden usar la posicioacuten de un miembro de una dimensioacuten por lo que se simplifica la definicioacuten de los caacutelculos y se reduce la necesidad de atributos dimensionales

o Toda la base de datos se presenta como precalculada sin tener en cuenta

si los datos se han precalculado o se calculan en tiempo ejecucioacuten Las aplicaciones no necesitan especificar reglas de agregacioacuten o joins cuando consultan la base de datos Las aplicaciones SQL no se preocupan de coacutemo los datos estaacuten precalculados simplemente consultan los datos

Oracle OLAP representa un cambio fundamental en la tecnologiacutea OLAP Las bases de datos relacionales y multidimensionales se han unido para proporcionar capacidades analiacuteticas propias de una base de datos multidimensional en el contexto de la base de datos Oracle

Todas estas ventajas se obtienen a la vez que se mantiene la potencia de un servidor OLAP dedicado Oracle OLAP proporciona un conjunto de funciones analiacuteticas a traveacutes de la OLAP API un motor multidimensional y un lenguaje de manipulacioacuten de datos OLAP El resultado es un sistema de menor coste maacutes seguro y fiable que da soporte a aplicaciones analiacuteticas de consulta y de generacioacuten de informes

33 Ejercicio con OLAP

Para realizar la practica de OLAP utilizaremos el software Pentaho lo primero que realizaremos seraacute Descargaremos un archivo desde internet llamando pentaho_demo_mysql Ya que trabajaremos con la base de datos de la unidad pasada El archivo descargado es una carpeta comprimida en la que vienen todos los archivos necesarios para que el portal funcione lo uacutenico que hay que hacer es descomprimir el archivo en el lugar en que mejor nos parezca

Una vez descomprimida la carpeta se debe establecer la contrasentildea de publicacioacuten en el portal Esto se hace entrando en el archivo CProgram Filespentaho_demo_mysql5-160GA863pentaho-demopentaho-solutionssystempublisher_configxml Y escribir la contrasentildea en medio de las etiquetas como se muestra en la figura

Este password se usara en el momento de publicar el cubo en el portal de Pentaho

Una vez realizado descomprimimos la carpeta proporcionada por la profesora y simplemente extraemos los archivos esta es una carpeta comprimida que no necesita proceso de instalacioacuten sino que solo es necesario descomprimirla en el lugar que uno prefiera En este caso se hizo en cProgram Files

Nota Antes de empezar el servicio de la base de datos debe estar activo

Lo primero que debe hacerse es subir el portal de Pentaho lo que se hace corriendo el archivo start-pentahobat que estaacute en la carpeta descomprimida

Una vez esteacute listo Pentaho se inicia el cube designer dando doble click sobra el icono de la carpeta que descomprimimos anteriormente

El primer paso es especificar el origen de los datos daacutendole un nombre seleccionando el driver seguacuten el motor que se esteacute usando en este caso es mySql y el usuario y el password que se usara en la conexioacuten

El siguiente paso es seleccionar los campos de la base de datos que seraacuten usados en el cubo Arrastrando las tablas que aparecen en la parte inferior izquierda y palomeando los atributos de cada tabla deseada

A continuacioacuten seleccionaremos el campo de la base de datos que contiene la unidad de medida que va a ser analizada en el cubo

Seguido de esto viene la creacioacuten de las dimensiones del cubo

Seleccionando el campo y dando clic en Add new dimension

Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo

Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456

Si es exitosa la publicacioacuten debe salir

Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe

Y se ingresa en NavigateSoluciones

Una vez alliacute entramos en Ejemplos de Anaacutelisis

Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos

El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten

Page 12: Unidad 3 tsbd olap

o Simplifica el proceso de definicioacuten de caacuteluclos hasta que usuarios no

expertos pueden usar el lenguaje de caacutelculo

El modelo multidimensional loacutegico se presenta a traveacutes de las OLAP API y OLAP DML con los siguientes elementos

Medidas

Dimensiones

Niveles

Jerarquiacuteas

Atributos

Una medida representa hechos Ventas en euros y ventas unitarias son ejemplos de medidas Una medida es anaacuteloga a una columna de hechos en una tabla de hechos pero el cataacutelogo OLAP proporciona meta datos maacutes completos para describirlo Las dimensiones proporcionan la estructura a los datos organizaacutendolos en niveles y jerarquiacuteas y proporcionaacutendoles atributos Algunos ejemplos de dimensiones son Producto Geografiacutea Tiempo etc

Como los analytic workspaces almacenan datos se necesita un modelo fiacutesico de base de datos para organizarlos datos Oracle OLAP usa un modelo multidimensional como base para el modelo fiacutesico en los analytic workspaces Este modelo proporciona beneficios importantes

o El modelo fuerza la integridad referencial Por ejemplo no es posible

que las medidas contengan claves que no referencien valores vaacutelidos en una dimensioacuten

o El modelo favorece la consistencia de datos al facilitar la reutilizacioacuten de

dimensiones con muacuteltiples medidas

o El orden de los miembros de las dimensiones se mantiene Esto

simplifica los caacutelculos como por ejemplo el anaacutelisis de series temporales Cuando el orden de los miembros de las dimensiones se mantiene las funciones pueden usar la posicioacuten de un miembro de una dimensioacuten por lo que se simplifica la definicioacuten de los caacutelculos y se reduce la necesidad de atributos dimensionales

o Toda la base de datos se presenta como precalculada sin tener en cuenta

si los datos se han precalculado o se calculan en tiempo ejecucioacuten Las aplicaciones no necesitan especificar reglas de agregacioacuten o joins cuando consultan la base de datos Las aplicaciones SQL no se preocupan de coacutemo los datos estaacuten precalculados simplemente consultan los datos

Oracle OLAP representa un cambio fundamental en la tecnologiacutea OLAP Las bases de datos relacionales y multidimensionales se han unido para proporcionar capacidades analiacuteticas propias de una base de datos multidimensional en el contexto de la base de datos Oracle

Todas estas ventajas se obtienen a la vez que se mantiene la potencia de un servidor OLAP dedicado Oracle OLAP proporciona un conjunto de funciones analiacuteticas a traveacutes de la OLAP API un motor multidimensional y un lenguaje de manipulacioacuten de datos OLAP El resultado es un sistema de menor coste maacutes seguro y fiable que da soporte a aplicaciones analiacuteticas de consulta y de generacioacuten de informes

33 Ejercicio con OLAP

Para realizar la practica de OLAP utilizaremos el software Pentaho lo primero que realizaremos seraacute Descargaremos un archivo desde internet llamando pentaho_demo_mysql Ya que trabajaremos con la base de datos de la unidad pasada El archivo descargado es una carpeta comprimida en la que vienen todos los archivos necesarios para que el portal funcione lo uacutenico que hay que hacer es descomprimir el archivo en el lugar en que mejor nos parezca

Una vez descomprimida la carpeta se debe establecer la contrasentildea de publicacioacuten en el portal Esto se hace entrando en el archivo CProgram Filespentaho_demo_mysql5-160GA863pentaho-demopentaho-solutionssystempublisher_configxml Y escribir la contrasentildea en medio de las etiquetas como se muestra en la figura

Este password se usara en el momento de publicar el cubo en el portal de Pentaho

Una vez realizado descomprimimos la carpeta proporcionada por la profesora y simplemente extraemos los archivos esta es una carpeta comprimida que no necesita proceso de instalacioacuten sino que solo es necesario descomprimirla en el lugar que uno prefiera En este caso se hizo en cProgram Files

Nota Antes de empezar el servicio de la base de datos debe estar activo

Lo primero que debe hacerse es subir el portal de Pentaho lo que se hace corriendo el archivo start-pentahobat que estaacute en la carpeta descomprimida

Una vez esteacute listo Pentaho se inicia el cube designer dando doble click sobra el icono de la carpeta que descomprimimos anteriormente

El primer paso es especificar el origen de los datos daacutendole un nombre seleccionando el driver seguacuten el motor que se esteacute usando en este caso es mySql y el usuario y el password que se usara en la conexioacuten

El siguiente paso es seleccionar los campos de la base de datos que seraacuten usados en el cubo Arrastrando las tablas que aparecen en la parte inferior izquierda y palomeando los atributos de cada tabla deseada

A continuacioacuten seleccionaremos el campo de la base de datos que contiene la unidad de medida que va a ser analizada en el cubo

Seguido de esto viene la creacioacuten de las dimensiones del cubo

Seleccionando el campo y dando clic en Add new dimension

Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo

Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456

Si es exitosa la publicacioacuten debe salir

Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe

Y se ingresa en NavigateSoluciones

Una vez alliacute entramos en Ejemplos de Anaacutelisis

Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos

El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten

Page 13: Unidad 3 tsbd olap

Oracle OLAP representa un cambio fundamental en la tecnologiacutea OLAP Las bases de datos relacionales y multidimensionales se han unido para proporcionar capacidades analiacuteticas propias de una base de datos multidimensional en el contexto de la base de datos Oracle

Todas estas ventajas se obtienen a la vez que se mantiene la potencia de un servidor OLAP dedicado Oracle OLAP proporciona un conjunto de funciones analiacuteticas a traveacutes de la OLAP API un motor multidimensional y un lenguaje de manipulacioacuten de datos OLAP El resultado es un sistema de menor coste maacutes seguro y fiable que da soporte a aplicaciones analiacuteticas de consulta y de generacioacuten de informes

33 Ejercicio con OLAP

Para realizar la practica de OLAP utilizaremos el software Pentaho lo primero que realizaremos seraacute Descargaremos un archivo desde internet llamando pentaho_demo_mysql Ya que trabajaremos con la base de datos de la unidad pasada El archivo descargado es una carpeta comprimida en la que vienen todos los archivos necesarios para que el portal funcione lo uacutenico que hay que hacer es descomprimir el archivo en el lugar en que mejor nos parezca

Una vez descomprimida la carpeta se debe establecer la contrasentildea de publicacioacuten en el portal Esto se hace entrando en el archivo CProgram Filespentaho_demo_mysql5-160GA863pentaho-demopentaho-solutionssystempublisher_configxml Y escribir la contrasentildea en medio de las etiquetas como se muestra en la figura

Este password se usara en el momento de publicar el cubo en el portal de Pentaho

Una vez realizado descomprimimos la carpeta proporcionada por la profesora y simplemente extraemos los archivos esta es una carpeta comprimida que no necesita proceso de instalacioacuten sino que solo es necesario descomprimirla en el lugar que uno prefiera En este caso se hizo en cProgram Files

Nota Antes de empezar el servicio de la base de datos debe estar activo

Lo primero que debe hacerse es subir el portal de Pentaho lo que se hace corriendo el archivo start-pentahobat que estaacute en la carpeta descomprimida

Una vez esteacute listo Pentaho se inicia el cube designer dando doble click sobra el icono de la carpeta que descomprimimos anteriormente

El primer paso es especificar el origen de los datos daacutendole un nombre seleccionando el driver seguacuten el motor que se esteacute usando en este caso es mySql y el usuario y el password que se usara en la conexioacuten

El siguiente paso es seleccionar los campos de la base de datos que seraacuten usados en el cubo Arrastrando las tablas que aparecen en la parte inferior izquierda y palomeando los atributos de cada tabla deseada

A continuacioacuten seleccionaremos el campo de la base de datos que contiene la unidad de medida que va a ser analizada en el cubo

Seguido de esto viene la creacioacuten de las dimensiones del cubo

Seleccionando el campo y dando clic en Add new dimension

Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo

Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456

Si es exitosa la publicacioacuten debe salir

Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe

Y se ingresa en NavigateSoluciones

Una vez alliacute entramos en Ejemplos de Anaacutelisis

Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos

El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten

Page 14: Unidad 3 tsbd olap

Este password se usara en el momento de publicar el cubo en el portal de Pentaho

Una vez realizado descomprimimos la carpeta proporcionada por la profesora y simplemente extraemos los archivos esta es una carpeta comprimida que no necesita proceso de instalacioacuten sino que solo es necesario descomprimirla en el lugar que uno prefiera En este caso se hizo en cProgram Files

Nota Antes de empezar el servicio de la base de datos debe estar activo

Lo primero que debe hacerse es subir el portal de Pentaho lo que se hace corriendo el archivo start-pentahobat que estaacute en la carpeta descomprimida

Una vez esteacute listo Pentaho se inicia el cube designer dando doble click sobra el icono de la carpeta que descomprimimos anteriormente

El primer paso es especificar el origen de los datos daacutendole un nombre seleccionando el driver seguacuten el motor que se esteacute usando en este caso es mySql y el usuario y el password que se usara en la conexioacuten

El siguiente paso es seleccionar los campos de la base de datos que seraacuten usados en el cubo Arrastrando las tablas que aparecen en la parte inferior izquierda y palomeando los atributos de cada tabla deseada

A continuacioacuten seleccionaremos el campo de la base de datos que contiene la unidad de medida que va a ser analizada en el cubo

Seguido de esto viene la creacioacuten de las dimensiones del cubo

Seleccionando el campo y dando clic en Add new dimension

Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo

Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456

Si es exitosa la publicacioacuten debe salir

Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe

Y se ingresa en NavigateSoluciones

Una vez alliacute entramos en Ejemplos de Anaacutelisis

Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos

El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten

Page 15: Unidad 3 tsbd olap

Una vez esteacute listo Pentaho se inicia el cube designer dando doble click sobra el icono de la carpeta que descomprimimos anteriormente

El primer paso es especificar el origen de los datos daacutendole un nombre seleccionando el driver seguacuten el motor que se esteacute usando en este caso es mySql y el usuario y el password que se usara en la conexioacuten

El siguiente paso es seleccionar los campos de la base de datos que seraacuten usados en el cubo Arrastrando las tablas que aparecen en la parte inferior izquierda y palomeando los atributos de cada tabla deseada

A continuacioacuten seleccionaremos el campo de la base de datos que contiene la unidad de medida que va a ser analizada en el cubo

Seguido de esto viene la creacioacuten de las dimensiones del cubo

Seleccionando el campo y dando clic en Add new dimension

Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo

Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456

Si es exitosa la publicacioacuten debe salir

Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe

Y se ingresa en NavigateSoluciones

Una vez alliacute entramos en Ejemplos de Anaacutelisis

Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos

El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten

Page 16: Unidad 3 tsbd olap

El siguiente paso es seleccionar los campos de la base de datos que seraacuten usados en el cubo Arrastrando las tablas que aparecen en la parte inferior izquierda y palomeando los atributos de cada tabla deseada

A continuacioacuten seleccionaremos el campo de la base de datos que contiene la unidad de medida que va a ser analizada en el cubo

Seguido de esto viene la creacioacuten de las dimensiones del cubo

Seleccionando el campo y dando clic en Add new dimension

Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo

Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456

Si es exitosa la publicacioacuten debe salir

Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe

Y se ingresa en NavigateSoluciones

Una vez alliacute entramos en Ejemplos de Anaacutelisis

Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos

El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten

Page 17: Unidad 3 tsbd olap

Seguido de esto viene la creacioacuten de las dimensiones del cubo

Seleccionando el campo y dando clic en Add new dimension

Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo

Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456

Si es exitosa la publicacioacuten debe salir

Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe

Y se ingresa en NavigateSoluciones

Una vez alliacute entramos en Ejemplos de Anaacutelisis

Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos

El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten

Page 18: Unidad 3 tsbd olap

Por uacuteltimo podemos ver el coacutedigo del cubo en XML publicarlo en el portal y finalmente verlo

Al momento de publicarlo nos pide un usuario y un password del portal el usuario del portal el Joe y la contrasentildea es password La contrasentildea de publicacioacuten fue la misma que se configuro en el archivo XML en este caso es 123456

Si es exitosa la publicacioacuten debe salir

Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe

Y se ingresa en NavigateSoluciones

Una vez alliacute entramos en Ejemplos de Anaacutelisis

Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos

El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten

Page 19: Unidad 3 tsbd olap

Si es exitosa la publicacioacuten debe salir

Ahora si podemos entrar a ver el cubo en el portal de Pentaho para entrar ingresamos por el browser a httplocalhost8080 y elegimos cualquiera de los usuarios predeterminados por ejemplo Joe

Y se ingresa en NavigateSoluciones

Una vez alliacute entramos en Ejemplos de Anaacutelisis

Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos

El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten

Page 20: Unidad 3 tsbd olap

Y se ingresa en NavigateSoluciones

Una vez alliacute entramos en Ejemplos de Anaacutelisis

Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos

El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten

Page 21: Unidad 3 tsbd olap

Y buscamos el cubo por el nombre que le pusimos en el primer paso del Cube Designer Una vez ingresemos veremos la paacutegina del cubo en donde podemos manipular las dimensiones y los graacuteficos como mejor nos parezca para analizar la informacioacuten de la base de datos

El software cuenta con diferentes herramientas que nos mostraran la informacioacuten de manera mas ordenada y grafica de acuerdo a nuestras necesidades para realizar nuestras presentaciones de informacioacuten con esto finalizamos la unidad numero 3 utilizando la herramienta Penthao que trabaja en conjunto con el programa OLAP para el disentildeo de cubos de informacioacuten

Page 22: Unidad 3 tsbd olap