Análisis dimensional Aplicaciones del Análisis de Datos: –Formular queries –Extraer datos...

12
Análisis dimensional Aplicaciones del Análisis de Datos: Formular queries Extraer datos aggregados Analizar resultados Visualizar resultados El conjunto de datos se representa como un espacio n-dimensional. La reducción dimensional se ejecuta mediante la sumarización sobre las dimensiones que son dejadas de lado

Transcript of Análisis dimensional Aplicaciones del Análisis de Datos: –Formular queries –Extraer datos...

Page 1: Análisis dimensional Aplicaciones del Análisis de Datos: –Formular queries –Extraer datos aggregados –Analizar resultados –Visualizar resultados El conjunto.

Análisis dimensional

• Aplicaciones del Análisis de Datos:– Formular queries

– Extraer datos aggregados

– Analizar resultados

– Visualizar resultados

• El conjunto de datos se representa como un espacio n-dimensional. La reducción dimensional se ejecuta mediante la sumarización sobre las dimensiones que son dejadas de lado

Page 2: Análisis dimensional Aplicaciones del Análisis de Datos: –Formular queries –Extraer datos aggregados –Analizar resultados –Visualizar resultados El conjunto.

Ejemplo

• Ventas (storeId,itemId,timeId,…,monto)

• Store(storeId,nombre,region,pais,ciudad)

Sumarizar por region:

SELECT region,sum(monto)

FROM Ventas V, Store S

WHERE V.sotreId=S.storeId

GROUP BY region

Page 3: Análisis dimensional Aplicaciones del Análisis de Datos: –Formular queries –Extraer datos aggregados –Analizar resultados –Visualizar resultados El conjunto.

Sumarización

• Un problema n-dimensional se representa en un archivo de 2 dimensiones, con n dominions de atributos.

• Ej.:

Clima(tiempo,lat.long,altit,temp, presion)

4 dimensiones, 2 medidas.

Page 4: Análisis dimensional Aplicaciones del Análisis de Datos: –Formular queries –Extraer datos aggregados –Analizar resultados –Visualizar resultados El conjunto.

Problemas del Group By

• Es complicado para :– Histogramas– Roll-up– Subtotales, drill-dpown– Cross-tabs

Page 5: Análisis dimensional Aplicaciones del Análisis de Datos: –Formular queries –Extraer datos aggregados –Analizar resultados –Visualizar resultados El conjunto.

Problemas (cont.)

• Histogramas– SELECT day,pais,max(temp)

FROM ( SELECT day(time) as day, nation (lat,long) as pais

FROM clima) as foo

Group by day,pais

Primero debe armar la tabla y luego agrupar.

Page 6: Análisis dimensional Aplicaciones del Análisis de Datos: –Formular queries –Extraer datos aggregados –Analizar resultados –Visualizar resultados El conjunto.

Roll-up/drill-down

Modelo Año Color Ventas por M,A,C

Ventas por M,A

Ventas por M

M1 1990 N 50

B 60

110

1991 N 60

B 80

140 250

M2 1990 N 100

B 200

300

1991 N 100

B 300

400 700

950

Roll-Up

Page 7: Análisis dimensional Aplicaciones del Análisis de Datos: –Formular queries –Extraer datos aggregados –Analizar resultados –Visualizar resultados El conjunto.

Solución en SQL

Modelo A~o Color Ventas Ventas x M,A

Ventas x M,C

Ventas x M

M1 1990 N 50 110 110 250

M1 1990 B 60 110 140 250

M1 1991 N 60 140 110 250

M1 1991 B 80 140 140 250

M2 1990 N 100 300 200 700

M2 1990 B 200 300 500 700

Page 8: Análisis dimensional Aplicaciones del Análisis de Datos: –Formular queries –Extraer datos aggregados –Analizar resultados –Visualizar resultados El conjunto.

Problema

• Aumento de la cantidad de columnas

• P.ej: 6 dimensiones =>64 columnas

• Alternativa: introducir un valor “ALL”. El nro de columnas permanece constante

Page 9: Análisis dimensional Aplicaciones del Análisis de Datos: –Formular queries –Extraer datos aggregados –Analizar resultados –Visualizar resultados El conjunto.

Data Cube

Modelo Año Color Ventas

M1 1990 N 50

M1 1990 B 60

M1 1990 All 110

M1 1991 N 60

M1 1991 B 80

M1 1991 All 140

M2 1990 N 100

…. ….

Page 10: Análisis dimensional Aplicaciones del Análisis de Datos: –Formular queries –Extraer datos aggregados –Analizar resultados –Visualizar resultados El conjunto.

Data Cube (cont.)

Modelo Año Color Ventas

M2 1990 B 200

M2 1990 All 300

M2 1991 N 100

M2 1991 B 300

M2 1991 All 400

M2 All All 750

M1 All All 250

All All All 950

Page 11: Análisis dimensional Aplicaciones del Análisis de Datos: –Formular queries –Extraer datos aggregados –Analizar resultados –Visualizar resultados El conjunto.

Data Cube (cont.)

Modelo Año Color Ventas

M1 All N 110

M1 All B 140

M2 All N 200

M2 All B 500

Page 12: Análisis dimensional Aplicaciones del Análisis de Datos: –Formular queries –Extraer datos aggregados –Analizar resultados –Visualizar resultados El conjunto.

Operador CUBE en SQL

SELECT “ALL”, “ALL, “ALL”, SUM (ventas)

FROM Sales

UNION

SELECT Modelo, “ALL, “ALL”, SUM (ventas)

FROM Sales

GROUP BY Modelo

UNION

SELECT Modelo, “ALL”,Color, SUM (ventas)

FROM Sales

GROUP BY Modelo,Color

UNION

……