Base de datos II - udb.edu.sv · La asignatura Base de Datos II,está ... el código PL/SQL...

12
Base de datos II Facultad de Ingeniería. Escuela de computación.

Transcript of Base de datos II - udb.edu.sv · La asignatura Base de Datos II,está ... el código PL/SQL...

Page 1: Base de datos II - udb.edu.sv · La asignatura Base de Datos II,está ... el código PL/SQL asociado con una actividad de Recuperación de los Datos ... pantalla “Editar nodo de

Base de datos II Facultad de Ingeniería. Escuela de computación.

Page 2: Base de datos II - udb.edu.sv · La asignatura Base de Datos II,está ... el código PL/SQL asociado con una actividad de Recuperación de los Datos ... pantalla “Editar nodo de

Este manual ha sido elaborado para orientar al estudiante de Bases de datos II en el desarrollo de sus prácticas de laboratorios, haciendo uso de este antes, durante y después de la práctica, de tal forma que ofrece un método facilitador en su proceso de enseñanza/aprendizaje durante esta asignatura. En el desarrollo de esta asignatura se ha designado realizar las prácticas en 16 sesiones semanales de laboratorios, los que incluyen 11 prácticas, dos parciales y un proyecto final durante los cuales, el estudiante aplicará los conceptos y las técnicas fundamentalmente necesarias para el dominio de programas para el uso, configuración y administración de ORACLE. Todas las guías de laboratorio están estructuradas de la siguiente forma: - Objetivos - Materiales y equipos - Introducción teórica - Procedimiento - Bibliografía - Hoja de evaluación( En caso de que la actividad sea evaluada ) La asignatura Base de Datos II,está dividida en cinco unidades durante el ciclo. La unidad 1 Administración avanzada de bases de datos tendrá 3 laboratorios prácticos, la unidad 2 Arquitectura de bases de datos tendrá 2 laboratorios prácticos y la unidad 3 Diseño de un Datawarehuse tendrá 4 laboratorios prácticos. La unidad 4 Minería de datos tendrá 3 laboratorios prácticos. Y finalmente la Unidad 5 Calidad de datos y auditoria de bases de datos tendrá 3 laboratorios prácticos.

Introducción

Page 3: Base de datos II - udb.edu.sv · La asignatura Base de Datos II,está ... el código PL/SQL asociado con una actividad de Recuperación de los Datos ... pantalla “Editar nodo de

Pág

Contenido --------------------------------------------------------------------------------------- 5

Objetivos ---------------------------------------------------------------------------------------- 5

Materiales y equipos --------------------------------------------------------------------------- 5

Introducción.------------------------------------------------------------------------------------ 5

Procedimiento.---------------------------------------------------------------------------------- 7

Investigación ----------------------------------------------------------------------------------- 14

Bibliografía -------------------------------------------------------------------------------------- 14

Facultad: Ingeniería. Escuela: Computación. Asignatura: Base de datos II.

Tabla de Contenido

Guía 10. Minería de Datos 2

Guía 6

a 1

Page 4: Base de datos II - udb.edu.sv · La asignatura Base de Datos II,está ... el código PL/SQL asociado con una actividad de Recuperación de los Datos ... pantalla “Editar nodo de

Tema: MINERIA DE DATOS 2

En la presente guía se utilizaran las herramientas que provee Oracle para la minería de datos y así mismo se utilizaran los ejemplos preinstalados en el DBMS, para ejemplificar los conceptos. Así mismo se realizará una breve introducción a los algoritmos que utiliza Oracle para realizar procesos de minería de datos. Desarrollar flujos de minería de datos con las herramientas provistas por Oracle.

Instalador de Oracle

SQL Developer.

Virtual de Windows 2003 server.

Instalador de Jdk.

Oracle Data Mining es un conjunto de librerías incluidas en Oracle Database que permite descubrir nuevos conocimientos ocultos en los datos almacenados. ODM ayuda a las empresas a apuntar a sus mejores clientes, encontrar y prevenir el fraude, descubrir los atributos más influyentes que afectan los Indicadores de Desempeño Clave (KPIs), y buscar nueva información valiosa oculta en los datos. ODM permite buscar patrones de datos, identificar los atributos clave, descubrir nuevos clusters y asociaciones, y revelar conocimientos valiosos. Para abordar estos problemas de negocio, Oracle Data Mining permite que las empresas busquen nueva información en sus datos utilizando una amplia gama de algoritmos de avanzada. Los algoritmos de data mining son técnicas de aprendizaje automático para analizar los datos y descubrir patrones y relaciones. Oracle proporciona múltiples algoritmos ya que diferentes algoritmos son efectivos para diferentes tipos de análisis y diferentes problemas de negocio.

Objetivo Específico

Materiales y Equipo

Introducción Teórica

Contenidos

Page 5: Base de datos II - udb.edu.sv · La asignatura Base de Datos II,está ... el código PL/SQL asociado con una actividad de Recuperación de los Datos ... pantalla “Editar nodo de

Entre los algoritmos soportados por ODM se encuentran los siguientes, estos permiten realizar clasificaciones, agrupamiento, predicciones y asociaciones:

Agrupamiento (k-means, O-Cluster).

Árboles de decisión.

Atributo relevante.

Característica de selección.

Clasificador bayesiano (naive bayes).

Máquinas de soporte vectorial (support vector machines).

Modelos lineales generalizados

Reglas de asociación (APRIORI). La mayoría de los algoritmos de data mining pueden separarse en técnicas de data mining con “aprendizaje supervisado” y “aprendizaje no supervisado”. El aprendizaje supervisado requiere que el analista de datos identifique un atributo objetivo o una variable dependiente (por ejemplo, clientes que adquirieron un producto específico). La técnica de aprendizaje supervisado luego examina cuidadosamente los datos para buscar patrones y relaciones entre otros atributos y el atributo objetivo (por ejemplo, las características que indican si un cliente potencial tiene posibilidades de comprar un producto específico). Los algoritmos de aprendizaje supervisado de ODM son: Naive Bayes, Árbol de Decisión, Modelos Lineales Generalizados y Máquinas de Vectores Soporte. La otra gran categoría de los algoritmos de data-mining es para el “aprendizaje no supervisado”. En estos escenarios, no existe un ‘atributo objetivo’; en cambio, los algoritmos de data mining buscan encontrar asociaciones y clusters en los datos independientemente de cualquier objetivo de negocios definido a priori. Estos algoritmos incluyen Clustering k-Means mejorado, Clustering de Partición Ortogonal, Reglas de Asociación (análisis de la cartera de mercado) y Factorización de Matrices No Negativas. ODM incluye Oracle Data Miner, una interface gráfica de usuarios para el análisis de datos que tiene el fin de crear, evaluar y aplicar modelos de data mining. Oracle Data Miner guía al analista de datos a través del proceso data mining con total flexibilidad y presenta los resultados en formatos gráficos y tabulares. Oracle Data Miner puede generar el código PL/SQL asociado con una actividad de Recuperación de los Datos.

Procedimiento

Bibliografía

Guía 1

Page 6: Base de datos II - udb.edu.sv · La asignatura Base de Datos II,está ... el código PL/SQL asociado con una actividad de Recuperación de los Datos ... pantalla “Editar nodo de

Prerrequisitos.

1. Verificar si en el servidor virtual se encuentra instalado el JDK7.

2. Transferir al servidor virtual el ejecutable de SQLDeveloper 4.

3. Ejercicio de Guia 10 de bases finalizado.

Creación Gráficos 1. Arrastrar al lienzo el componente “Grafico”.

2. Clic derecho en la fuente de datos, seleccionar conectar y luego clic en el

componente “Gráfico“, luego editar en el componente gráfico.

3. En el cuadro emergente seleccionar Histograma y seleccionar los siguientes valores, que permitirán crear una grafica de edades, al finalizar dar clic en ok.

Page 7: Base de datos II - udb.edu.sv · La asignatura Base de Datos II,está ... el código PL/SQL asociado con una actividad de Recuperación de los Datos ... pantalla “Editar nodo de

4. Luego de finalizado generará un grafico de la siguiente forma:

5. ¿Qué conclusiones se pueden obtener al respecto? ____________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________

6. Crear un grafico tipo “Box” dando clic en el icono completar la ventana de graficos, con la siguiente información:

Page 8: Base de datos II - udb.edu.sv · La asignatura Base de Datos II,está ... el código PL/SQL asociado con una actividad de Recuperación de los Datos ... pantalla “Editar nodo de

7. ¿Qué representa el grafico? ____________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ Creación de modelos de datos a partir de algoritmos supervisados.

1. En la sección de componentes desplegar los elementos “Modelos”, identificar el elemento “Clasificación”, arrastrar ese elemento al lienzo de la siguiente forma:

2. Clic derecho en la fuente de datos, seleccionar conectar y luego clic en el

componente “Creación de Clase“, como resultado de esta operación se mostrará la pantalla “Editar nodo de creación de clasificación”, editar dicha pantalla con los siguientes valores:

Page 9: Base de datos II - udb.edu.sv · La asignatura Base de Datos II,está ... el código PL/SQL asociado con una actividad de Recuperación de los Datos ... pantalla “Editar nodo de

Con estos valores se predecirá comportamientos individuales de compra de seguros, esta predicción utilizara los algoritmos especificados en la pantalla de “configuración de modelo”, para indicar valores específicos en cada uno de los algoritmos dar doble clic sobre cada uno de ellos.

3. Dar clic en aceptar, y ver las propiedades del elemento de “Creación de clase”, verificar que en la columna crear no se encontraran ningún modelo ejecutado.

4. En la misma ventana de propiedades dar clic en probar y verificar que se tengan los siguientes parámetros seleccionados:

Page 10: Base de datos II - udb.edu.sv · La asignatura Base de Datos II,está ... el código PL/SQL asociado con una actividad de Recuperación de los Datos ... pantalla “Editar nodo de

5. Luego de realizados los cambios, ir al lienzo y dar clic derecho sobre el elemento “creación de clase” y dar clic en ejecutar:

Esta acción pude tardar unos minutos y provocará que el elemento, al finalizar tenga un icono verde en la esquina superior derecha.

6. Luego de ejecutado, el estado de los modelos debe de cambiar en la ventana de propiedades de la siguiente forma:

7. Luego de ejecutado dar clic derecho sobre el elemento “creación de clase” y dar clic en la opción “comparar resultados”:

Page 11: Base de datos II - udb.edu.sv · La asignatura Base de Datos II,está ... el código PL/SQL asociado con una actividad de Recuperación de los Datos ... pantalla “Editar nodo de

8. Como resultado del paso anterior se mostrará la siguiente pantalla:

9. ¿Qué información se obtiene de estos gráficos? ___________________________________________________________________________________________________________________________________________________________________________________________________________________________

10. ¿Cuál algoritmo es el mejor en la predicción de patrones de acuerdo a las graficas? Explique

____________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________

11. Aplicar el modelo con las siguientes instrucciones:

a. Especificar el modelo deseado de la ventana de propiedades del nodo “creación de clases”.

b. Agregar un nuevo origen de datos. (este nodo servirá para aplicar los datos.)

c. Agregar un Nuevo nodo de “aplicación”. d. Conectar los nodos de “creación de clases” y el Nuevo “Origen de datos” al

nodo de “Aplicación”. e. Finalmente ejecute el nodo de “aplicación” para crear datos predictivos del

modelo.

Page 12: Base de datos II - udb.edu.sv · La asignatura Base de Datos II,está ... el código PL/SQL asociado con una actividad de Recuperación de los Datos ... pantalla “Editar nodo de

¿Cómo se pueden aplicar modelos en ODM?.

¿Cómo se obtienen Predicciones a partir de los modelos?.

ORACLE 11g. Curso práctico. Teaching Soft Group.

ORACLE 9i. Manual del administrador. Técnicas de gestión de datos Oracle robustas y de alto rendimiento. Kevin Loney/ Marlene Thenault.

Investigación Complementaria

Guía 3

Guía 4

fía

Bibliografía

Guía 3

Guía 4

fía