r 105038

download r 105038

of 10

description

trabajo BI

Transcript of r 105038

3.3.2 Datamarts

3.3. Arquitectura de los almacenes de datosUn almacn de datos recoge, fundamentalmente, los datos histricos, es decir, hechos, sobre el contexto en el que se desenvuelve la organizacin. Los hechos son, por tanto, el aspecto central de los almacenes de datos. Esta caracterstica determina en gran medida la manera de organizar los almacenes de datos.

3.3.1 Modelo multidimensionalLos datos se organizan en torno a los hechos, que tienen unos atributos o medios que pueden verse en mayor o menor detalle segn ciertas dimensiones. Por ejemplo, una gran cadena de supermercados puede tener como hechos bsicos las ventas. Es esclarecedor comprobar que las medidas responden generalmente a la pregunta cuanto, mientras que las dimensiones respondern al cuando, que, donde. Etc.

Lo realmente interesante del modelo es que ha de permitir, de una manera sencilla, obtener informacin sobre hechos a diferentes niveles de agregacin.Por ejemplo: hechos el da 20 de mayo de 2003 la empresa vendi en Espaa 12.327 unidades de productos del categora insecticidas representa una unidad (cantidad, 12.327 unidades), de una venta con granularidad da para la dimensin tiempo (20 de mayo de 2003), con granularidad pas para la dimensin lugar (Espaa) y con granularidad categora (insecticida) para la dimensin de productos. Del mismo modo, el hecho El primer trimestre de 2004 la empresa vendi en valencia por un importe de 22.000 euros del producto androbrio 33 cl. Representa una medida (importe, 22.000 euros) de una venta con granularidad trimestre para la dimensin tiempo (primer trimestre de 2004), con granularidad ciudad para la dimensin lugar (Valencia) y con granularidad articulo (Androbrio 33 cl.) para la dimensin de productos.

La forma que tienen estos conjuntos de hechos y sus dimensiones hace que se llamen popularmente almacenes de datos en estrella simple (cuando no hay caminos alternativos en las dimensiones) o de estrella jerrquica o copo de nieve (cuando si hay caminos alternativos en las dimensiones, como el ejemplo anterior).A pesar de todo esto, podemos identificar cuatro pasos principales a la hora de disear un almacn de datos (en realidad estos pasos se han de seguir para cada datamart):Paso 1. Elegir un proceso de la organizacin para modelar.Paso 2. Decidir el grnulo (nivel de detalle) de representacin del proceso.Paso 3. Identificar las dimensiones que caracterizan el proceso.Paso 4. Decidir la informacin a almacenar sobre el proceso.Paso 1. Elegir un proceso de la organizacin para modelar.Ejemplo: Cadena de supermercados.Cadena de supermercados con 300 almacenes en la que se expenden unos 30.000 productos distintos.

Actividad: Ventas.La actividad a modelar son las ventas de productos en los almacenes de la cadena.

Paso 2. Decidir el grnulo (nivel de detalle) de representacin del proceso.Ejemplo: Cadena de supermercados.Grnulo: se desea almacenar informacin sobre las ventas diarias de cada producto en cada almacn de la cadena.Grnulo: define el significado de las tuplas de la tabla de hechos.determina las dimensiones bsicas del esquema.productodaalmacnventastiempoalmacnproductoPaso 3. Identificar las dimensiones que caracterizan el proceso.Ejemplo: Cadena de supermercados.definicin de grnulodimensiones bsicastiempoproductoestablecimientoNota: En las aplicaciones reales el nmero de dimensiones suele variar entre 3 y 15 dimensiones. Paso 4. Decidir la informacin a almacenar sobre el proceso.Ejemplo: Cadena de supermercados.Grnulo: se desea almacenar informacin sobre las ventas diarias de cada producto en cada establecimiento de la cadena.importe total de las ventas del producto en el danmero total de unidades vendidas del producto en el danmero total de clientes distintos que han comprado el producto en el da.