Análisis de Datos Categóricos 2003/2004valentin/am4g/2013/pd_am_1213.doc  · Web viewAplicaremos...

16
DEPARTAMENTO DE ESTADÍSTICA E INVESTIGACIÓN OPERATIVA UNIVERSIDAD DE VALLADOLID Proyecto Docente ANÁLISIS MULTIVARIANTE (40769) Grado en Estadística Curso: 2º Cuatrimestre Carácter: Optativa Créditos: 6 Departamento responsable: Estadística e Investigación Operativa Profesor: Valentín Glz. de Garibay Prz. De Heredia e-mail: [email protected] web personal del profesor: http://www.eio.uva.es/~valentin/ web del profesor para esta asignatura: http://www.eio.uva.es/~valentin/am4g/40757.html INTRODUCCIÓN Objetivos generales prioritarios: - Conocimiento teórico y práctico de técnicas de análisis de datos multivariantes. - Utilización de diversos paquetes estadísticos para estas técnicas: SAS, Statistica, SPAD y programación con SAS/IML. Esta asignatura optativa de Análisis Multivariante de Cuarto Curso del Grado en Estadística constituye una continuación en el contacto del estudiante con problemas de estadística multivariante y el análisis de grandes tablas de datos. Con ella se avanza en el estudio de problemas multivariantes y sus técnicas, tras el primer contacto del alumno con ellas dentro de la asignatura obligatoria de tercer curso Análisis de Datos. Sigue teniendo un enfoque eminentemente práctico, pero comprendiendo bien el fundamento teórico de cada técnica y evitando presentar al alumno un catálogo exhaustivo de procedimientos para que los utilice mediante “recetas” aplicadas de forma mecánica. Esta asignatura requiere manejar conceptos, técnicas y procedimientos ya vistos en asignaturas anteriores, tanto sobre el muestreo de la Normal DEPARTAMENTO DE ESTADÍSTICA E I.O. - FACULTAD DE CIENCIAS- 47071 VALLADOLID - ESPAÑA tfno.: 983 42 31 11 – fax: 983 42 30 13 – http://www.eio.uva.es/ 1 o o p p e e r r a a t t i i v v a a media 50 100 150 200 250 300 desv. es tand. 150 200 250 300 V er . n o r m 0.2 0.4 0.6 0.8 d d e e p p a a r r t t a a m m e e n n t t o o e s t a d í s t i c a i n v e s t i g a c i ó n i n v e s t i g a c i ó n d d E E I I O O universidad de valladolid ww w.eio.uva.es

Transcript of Análisis de Datos Categóricos 2003/2004valentin/am4g/2013/pd_am_1213.doc  · Web viewAplicaremos...

Page 1: Análisis de Datos Categóricos 2003/2004valentin/am4g/2013/pd_am_1213.doc  · Web viewAplicaremos estos resultados al análisis de grandes tablas de datos con variables cualitativas:

DEPARTAMENTO DE ESTADÍSTICA E INVESTIGACIÓN OPERATIVAUNIVERSIDAD DE VALLADOLID

Proyecto DocenteANÁLISIS MULTIVARIANTE (40769)

Grado en Estadística Curso: 4º 2º CuatrimestreCarácter: Optativa Créditos: 6 Departamento responsable: Estadística e Investigación OperativaProfesor: Valentín Glz. de Garibay Prz. De Herediae-mail: [email protected] web personal del profesor:

http://www.eio.uva.es/~valentin/web del profesor para esta asignatura:

http://www.eio.uva.es/~valentin/am4g/40757.html

INTRODUCCIÓN

Objetivos generales prioritarios:- Conocimiento teórico y práctico de técnicas de análisis de datos multivariantes. - Utilización de diversos paquetes estadísticos para estas técnicas:

SAS, Statistica, SPAD y programación con SAS/IML.

Esta asignatura optativa de Análisis Multivariante de Cuarto Curso del Grado en Estadística constituye una continuación en el contacto del estudiante con problemas de estadística multivariante y el análisis de grandes tablas de datos. Con ella se avanza en el estudio de problemas multivariantes y sus técnicas, tras el primer contacto del alumno con ellas dentro de la asignatura obligatoria de tercer curso Análisis de Datos.

Sigue teniendo un enfoque eminentemente práctico, pero comprendiendo bien el fundamento teórico de cada técnica y evitando presentar al alumno un catálogo exhaustivo de procedimientos para que los utilice mediante “recetas” aplicadas de forma mecánica.

Esta asignatura requiere manejar conceptos, técnicas y procedimientos ya vistos en asignaturas anteriores, tanto sobre el muestreo de la Normal Multivariante para una y dos muestras, como sobre Técnicas Factoriales y Clasificiación Automática.

Comenzaremos a desarrollar la asignatura dando un repaso rápido tanto teórico como práctico de la Inferencia sobre la Normal Multivariante en los aspectos estudiados dentro de la asignatura Análisis de Datos de tercer curso.

Abordando ya el desarrollo de nuevos contenidos, la extensión del problema ya conocido de comparación de dos medias multivariantes a más de dos poblaciones, abrirá la puerta a los MANOVA, y de forma más general, a los Modelos Lienales de Respuesta Multivariante, tanto de Regresión como de Análisis de la Varianza y Covarianza.

Avanzaremos en cuestiones relacionadas con las técnicas de reducción de dimensión vistas en tercer curso, desarrollando el planteamiento poblacional y el caso general del Análisis Factorial con pesos no iguales y métrica M no necesariamente euclídea unitaria. Aplicaremos

D E P A R T A M E N T O D E E S T A D Í S T I C A E I . O . - F A C U L T A D D E C I E N C I A S - 4 7 0 7 1 V A L L A D O L I D - E S P A Ñ A t f n o . : 9 8 3 4 2 3 1 1 1 – f a x : 9 8 3 4 2 3 0 1 3 – h t t p : / / w w w . e i o . u v a . e s /

1

oopp

eerr

aatt

iivv

aa

media

50100

150200

250300

desv

. esta

nd.

150

200

250

300Ver.norm

0.20.4

0.6

0.8

ddee

ppaa

rrtt

aamm

eenn

ttoo ee ss tt aa dd íí ss tt ii cc aa

i n v e s t i g a c i ó ni n v e s t i g a c i ó n

dd EEII OOuniv

ersi

dad

de v

alla

dolid

www.eio.uva.es

Page 2: Análisis de Datos Categóricos 2003/2004valentin/am4g/2013/pd_am_1213.doc  · Web viewAplicaremos estos resultados al análisis de grandes tablas de datos con variables cualitativas:

estos resultados al análisis de grandes tablas de datos con variables cualitativas: Análisis de Correspondencias (AC). Volveremos sobre las técnicas de Clasificación Automática vistas en Tercer curso, trabajando ahora sobre los factores resultantes de un AC.

A continuación, abordaremos el estudio del Análisis Discriminante, como la técnica estadística apropiada para profundizar en el conocimiento de diferencias entre los diversos grupos que constituyen una determinada población multivariante. También nos detendremos en el enfoque Predictivo del Análisis Discriminante, que da cobijo a problemas tan interesantes como el Reconocimiento de Formas o el diagnóstico automático.

Finalizaremos dando una nueva perspectiva del Análisis Factorial, desde el punto de vista ahora de la Extracción de Factores Comunes, enfoque de uso muy extendido en ámbitos de la Psicología o la Sociología.

Se abordarán diversos problemas desde su plantemiento en la vida real, pasando por su análisis y la aplicación práctica de los procedimientos estadísticos multivariantes más apropiados, hasta la elección de una solución final satisfactoria y su presentación mediante la elaboración de informes y su exposición oral. Los estudiantes tratarán problemas complejos que deberán estructurar en múltiples tareas, fraccionándolos en pasos o etapas encadenadas. Se potenciará el uso de diversos programas informáticos estadísticos (SPAD, Statistica, SAS) y otros auxiliares que empleará como herramienta intermedia para preparación, lectura y depuración de los datos iniciales, y para elaborar los informes finales (Excel, Gadwin PS, Word, PowerPoint…). Deberá también utilizar técnicas estadísticas diversas aprendidas en otras asignaturas de la Diplomatura: Modelos Lineales, Análisis de Datos, Análisis de Datos Categóricos, Estadística Matemática… Con todo ello se persigue que el alumno avance en su proceso de maduración dentro de su formación estadística.

Dado que la asignatura está orientada a las aplicaciones del Análisis Multivariante, una buena parte del trabajo que el alumno tendrá que realizar será de índole práctico, mediante la utilización de herramientas informáticas y la interpretación de los resultados de los análisis que lleve a cabo. Previamente se le exigirá un cierto conocimiento y manejo de los conceptos teóricos de las técnicas que va a aplicar.

Aunque la amplitud de la Estadística obliga a distribuir en asignaturas específicas el estudio de diferentes métodos, esta asignatura propocionará al estudiante una visión transversal más homogénea y contribuirá a la adquisición de una parte del bagaje de “pensamiento estadístico” que un buen profesional debe utilizar.

En el desarrollo de esta asignatura, los estudiantes encontrarán además la ocasión de desarrollar específicamente aspectos importantes de su formación, más allá de los propiamente estadísticos (Ver las competencias a desarrollar y los resultados del aprendizaje descritos en la ficha de la signatura, que se encuentra publicada en la pg 15 del Anexo II de la memoria de verificación del grado: http://www.eio.uva.es/docencia/grado/memoria.pdf )

CONOCIMIENTOS PREVIOSPara seguir la asignatura con aprovechamiento se requiere por parte del alumno un

manejo desenvuelto, conceptual y práctico, tanto del Análisis de Datos como de los Modelos Lineales a nivel de las correspondientes asignaturas anuales Obligatorias de 3º del Grado en Estadística, que a su vez necesitan bases sólidas de Cálculo de Probabilidades, Estadística Matemática, Álgebra y Geometría, Cálculo Infinitesimal y Lenguajes de Programación, todo ello al nivel que se imparte en los cursos 1º y 2º del Grado. Deberá leer inglés técnico y manejar programas estadísticos en Francés e Inglés.

D E P A R T A M E N T O D E E S T A D Í S T I C A E I . O . - F A C U L T A D D E C I E N C I A S - 4 7 0 7 1 V A L L A D O L I D - E S P A Ñ A t f n o . : 9 8 3 4 2 3 1 1 1 – f a x : 9 8 3 4 2 3 0 1 3 – h t t p : / / w w w . e i o . u v a . e s /

2

Page 3: Análisis de Datos Categóricos 2003/2004valentin/am4g/2013/pd_am_1213.doc  · Web viewAplicaremos estos resultados al análisis de grandes tablas de datos con variables cualitativas:

TEMAS A DESARROLLAR EN EL PROGRAMA DE LA ASIGNATURA

Repaso de inferencias sobre la Normal Multivariante.Modelo Lineal con respuesta multivariante:

Regresión Multivariante y MANOVA.Repaso de Análisis de Componentes Principales y Análisis Cluster.Análisis Discriminante.Análisis de Correspondencias.Análisis de Factores Comunes.

BIBLIOGRAFÍA (resaltados en amarillo los textos básicos)

AFIFI, A. A. Y CLARK, V. (1990), Computer-Aided Multivariate Analysis (second edition), Ed: Van Nostrand Reinhold.

ALUJA, T Y MORINEAU, A (1999) Aprender de los Datos: El Análisis de Componentes Principales. Una aproximación desde el Data Minino. Ed: EUB S.L.

CHATFIELD, C. Y COLLINS, A.J. (1980), Introduction To Multivariate Analysis, Ed: Chapman and Hall.

EVERITT, B. (1993), Cluster Analysis (third edition), Ed: Edward Arnold. EVERITT B. S. Y DUNN G. (1991), Applied Multivariate Data Analysis, Ed:

Edward Arnold, London. FLURY BERNARD (1997). A first Course in Multivariate Statistics. Ed:

Springer JOBSON, D.V. (1992). Applied Multivariate Data Analysis. Volume II:

Categorical and Multivariate Methods. Ed: Springer-Verlag. KRZANOWSKI, W. J. (1988), Principles of Multivariate Analysis (a user's

perspective), Ed: Oxford Science Publications. LEBART, L., MORINEAU, A. Y WARWICK, K. M. (1984), Multivariate Descriptive

Statistical Analysis, Ed: Wiley. LEBART, L., MORINEAU, A. y TABARD, N (1977) Techniques de la description

statistique. LEBART, L., MORINEAU, A. y FENELON J. (1985) Tratamiento estadístico de

datos. Ed.: Marcombo. LEBART, L., MORINEAU, A. y PIRON M. (2000) Statistique exploratoire

multidimensionelle. Ed. :Dunod. PEÑA D. (2002) Análisis de Datos Multivariantes. Ed.: Mc Graw Hill. SEBER, G.A.F. (1984), Multivariate Observations, Ed: Wiley. SRIVASTAVA, m. s. (2002) Methods of Multivariate Statistics. Ed. Willey

D E P A R T A M E N T O D E E S T A D Í S T I C A E I . O . - F A C U L T A D D E C I E N C I A S - 4 7 0 7 1 V A L L A D O L I D - E S P A Ñ A t f n o . : 9 8 3 4 2 3 1 1 1 – f a x : 9 8 3 4 2 3 0 1 3 – h t t p : / / w w w . e i o . u v a . e s /

3

Page 4: Análisis de Datos Categóricos 2003/2004valentin/am4g/2013/pd_am_1213.doc  · Web viewAplicaremos estos resultados al análisis de grandes tablas de datos con variables cualitativas:

Los libros recomendados están a disposición de los alumnos, en la biblioteca de la Facultad o en la biblioteca del Departamento de Estadística.Por otra parte, en la página web personal del profesor se encuentra a disposición de los alumnos un amplio material de apoyo que será utilizado continuamente a lo largo del curso, tanto en el desarrollo de la teoría como de la parte práctica de la asignatura.

web del profesor para esta asignatura:

http://www.eio.uva.es/~valentin/ad4g/40769.html

OBJETIVOS- Que el estudiante avance en la capacidad de plantear y reconocer

problemas de Análisis Multivariante, localizando fuentes de datos en su caso, eligiendo técnicas adecuadas para su resolución y planteándolas adecuadamente. Existe una enorme cantidad de aplicaciones a problemas reales del Análisis Multivariante, que se reconocen ampliamente como una disciplina dentro de la Estadística Aplicada. El estudiante tendrá una perspectiva más amplia y general de la estadística.

- Que el estudiante mejore el manejo de paquetes de programas estadísticos, como SPAD, Statistica y SAS para el Análisis de Datos Multivariantes, a elaborar programas estadísticos propios con Matlab, y a utilizar herramientas complementarias, como hojas de cálculo, captura de imágenes, procesadores de texto y programas de presentación. El estudiante debe manejar con soltura las herramientas que le permitirán resolver problemas de análisis multivariante y elaborar informes.

- Que el estudiante sepa cómo interpretar con precisión los resultados de las diferentes técnicas multivariantes en problemas aplicados, para dar respuesta a problemas reales concretos.

- Que el estudiante avance en definir y seguir los diferentes pasos del proceso que va desde la formulación del problema real por profesionales de otras áreas, hasta la solución estadística y su comunicación.

- Que el estudiante siga potenciando el desarrollo de varias competencias genéricas demandadas en el ámbito profesional, como son el trabajo en equipo, la presentación de informes, la expresión oral y escrita, la elección de la solución más apropiada, la capacidad de iniciativa y el sentido crítico.

FORMACIÓN GENÉRICA

D E P A R T A M E N T O D E E S T A D Í S T I C A E I . O . - F A C U L T A D D E C I E N C I A S - 4 7 0 7 1 V A L L A D O L I D - E S P A Ñ A t f n o . : 9 8 3 4 2 3 1 1 1 – f a x : 9 8 3 4 2 3 0 1 3 – h t t p : / / w w w . e i o . u v a . e s /

4

Page 5: Análisis de Datos Categóricos 2003/2004valentin/am4g/2013/pd_am_1213.doc  · Web viewAplicaremos estos resultados al análisis de grandes tablas de datos con variables cualitativas:

Las actividades previstas en esta asignatura previsiblemente permitirán y facilitarán el desarrollo de ciertas habilidades genéricas, muy importantes desde el punto de vista de la formación personal y social e imprescindibles para una buena práctica profesional. Entre ellas se pueden destacar las siguientes:

- Desarrollo de la capacidad de trabajo individual- Desarrollo de la capacidad de trabajo en equipo- Redacción de informes técnicos- Redacción de informes dirigidos a usuarios no técnicos- Comunicación oral- Capacidad de análisis y síntesis- Localización y concreción de objetivos- Razonamiento crítico- Reconocimiento y valoración del trabajo bien hecho- Gestión de la información- Iniciativa personal- Planificación del trabajo a largo plazo- Aprendizaje autónomo- Desarrollo del pensamiento y del razonamiento cuantitativo- Capacidad de abstracción - Afán de superación personal- Interpretación de la realidad en términos estadísticos

En esta asignatura, tras el conocimiento teórico y aplicado de las materias estadísticas propias, se pondrá énfasis principalmente en la redacción y presentación de informes, fundamentalmente de forma escrita, en el razonamiento crítico y en la capacidad de análisis y síntesis. El seguimiento de la asignatura de forma activa y provechosa debe conseguir una mejora del estudiante en el resto de las competencias descritas.

CONTENIDOS

Repaso de Inferencias sobre la Normal Multivariante.

Contrastes de normalidad, observaciones atípicas. Contrastes sobre la media y sus aplicaciones: Anova de Medidas repetidas. Tendencia Polinomial del Crecimiento. Test de Simetría. Comparación de medias multivariantes en dos muestras relacionadas. Comparación de medias multivariantes en dos muestras independientes.

Modelo Lineal con respuesta multivariante

Regresión Multivariante. MANOVA: Análisis de la Varianza con respuesta multivariante. Análisis de perfiles.

Repaso de Análisis de Componentes Principales y Clasificación Automática.

Fundamentos teóricos del Análisis Factorial. Análisis de Componentes Principales (ACP) Normado y Sin Normar. ACP Poblacional. Análisis Cluster. Métodos Jerárquicos, No Jerárquicos y Mixtos.

D E P A R T A M E N T O D E E S T A D Í S T I C A E I . O . - F A C U L T A D D E C I E N C I A S - 4 7 0 7 1 V A L L A D O L I D - E S P A Ñ A t f n o . : 9 8 3 4 2 3 1 1 1 – f a x : 9 8 3 4 2 3 0 1 3 – h t t p : / / w w w . e i o . u v a . e s /

5

Page 6: Análisis de Datos Categóricos 2003/2004valentin/am4g/2013/pd_am_1213.doc  · Web viewAplicaremos estos resultados al análisis de grandes tablas de datos con variables cualitativas:

Técnicas Factoriales II: Análisis de Correspondencias (AC).

Introducción: El AF con pesos cualesquiera y métrica euclídea no unitaria. Distancia chi-cuadrado entre perfiles. Obtención de los ejes factoriales. Relación entre los análisis de los perfiles fila y los perfiles-columna. Contribuciones absolutas y relativas. Relación con el test chi-cuadrado. Interpretación de Gráficos bidimensionales y representación simultánea de los dos análisis. Elementos suplementarios. Comparación de grupos. Análisis de Correspondencias Múltiples. Clasificación sobre los factores de un AC.

Análisis Discriminante.

MANOVA previo. Planteamientos descriptivo y predictivo.Enfoque Descriptivo. Análisis Factorial Discriminante. Variables Discriminantes Canónicas. Dos grupos y k grupos. Poder discriminante de las variables canónicas discriminantes. Interpretación de las variables canónicas. Procedimientos de selección de variables.Enfoque Predictivo. Dos poblaciones. Función Lineal Discriminante. Probabilidad a priori y a posteriori. Cross-validation y Jackniffing. Función Discriminante Cuadrática. K poblaciones.

Análisis de Factores Comunes

Formulación del Problema. Análisis de la Matriz de Correlación. Extracción de Factores Comunes. Determinación del Número de Factores. Interpretación de Factores. Rotación de Factores. Cálculo de Puntuaciones Factoriales. Validación del Modelo.

METODOLOGÍAEl proyecto docente es una herramienta útil para controlar el desarrollo de la asignatura. A lo largo del curso se realizarán diversas actividades, clases en el aula, tanto teóricas como prácticas, clases prácticas de laboratorio, tutorías individualizadas, ejecución y presentación escrita y oral de trabajos, exámenes parciales y trabajo final.Todas las actividades tienen como objetivo principal el de potenciar el aprendizaje de los estudiantes, facilitando la adquisición de los conocimientos y competencias previstas. Las diferentes actividades estarán sujetas a un proceso de evaluación continua, y permitirán dar la certificación necesaria del aprendizaje. Véase el apartado dedicado a la evaluación del aprendizaje.A continuación se detallan las diferentes actividades que se realizarán a lo largo del curso en el ámbito de la asignatura.Clases Teóricas:

- El profesor expondrá en clase la teoría básica necesaria, insistiendo en los conceptos más que en los desarrollos formales. Por lo general se utilizará el material teórico elaborado por el profesor a partir de la bibliografía recomendada. El estudiante encontrará en la página web de la asignatura este material a su disposición y podrá emplea en clase una copia impresa.

D E P A R T A M E N T O D E E S T A D Í S T I C A E I . O . - F A C U L T A D D E C I E N C I A S - 4 7 0 7 1 V A L L A D O L I D - E S P A Ñ A t f n o . : 9 8 3 4 2 3 1 1 1 – f a x : 9 8 3 4 2 3 0 1 3 – h t t p : / / w w w . e i o . u v a . e s /

6

Page 7: Análisis de Datos Categóricos 2003/2004valentin/am4g/2013/pd_am_1213.doc  · Web viewAplicaremos estos resultados al análisis de grandes tablas de datos con variables cualitativas:

Clases Prácticas y de Laboratorio:Resumen: En la página web del profesor encontramos accesos a las prácticas de la asignatura. Tras explicar y estudiar los aspectos teóricos de cada tema se plantearán problemas prácticos para resolver. Los primeros serán los más sencillos, se resolverán en clase y en el laboratorio con la ayuda del profesor y servirán para afianzar los conceptos estudiados. Posteriormente aumentará la complejidad. El estudiante dispondrá de algunos ejemplos guiados y finalmente propuestas de trabajo para realizar sólo y en equipo. Recibirá orientación sobre la forma de elaborar informes y dispondrá de ejemplos prácticos completos confeccionados por el profesor

- Los estudiantes realizarán a lo largo del curso varias prácticas de ordenador en el Laboratorio de Estadística para familiarizarse con el manejo de los programas estadísticos más comunes en la materia, como SAS, SPAD o Statistica. Empleará otros programas auxiliares como herramienta para preparación, lectura y depuración de los datos iniciales, y para elaborar los informes finales (Excel, Gadwin, Word, PowerPoint)

- Se tratará una amplia colección de problemas reales de distintos ámbitos de aplicación en los que se utilizan los métodos que el estudiante aprenderá a manejar en la asignatura. También aquí se utilizará como base el material elaborado por el profesor, que el estudiante encontrará su disposición en la página web de la asignatura.

D E P A R T A M E N T O D E E S T A D Í S T I C A E I . O . - F A C U L T A D D E C I E N C I A S - 4 7 0 7 1 V A L L A D O L I D - E S P A Ñ A t f n o . : 9 8 3 4 2 3 1 1 1 – f a x : 9 8 3 4 2 3 0 1 3 – h t t p : / / w w w . e i o . u v a . e s /

7

Page 8: Análisis de Datos Categóricos 2003/2004valentin/am4g/2013/pd_am_1213.doc  · Web viewAplicaremos estos resultados al análisis de grandes tablas de datos con variables cualitativas:

- En cada tema se realizarán varias prácticas, que irán aumentando su grado de dificultad. El estudiante dispondrá de un guión para las prácticas iniciales de las técnicas más complejas. Este material conduce al estudiante en la aplicación de los procedimientos estadísticos apropiados y en el manejo de los programas específicos. El seguimiento de estos guiones ayuda al estudiante a personalizar el ritmo de su aprendizaje.

- El profesor expondrá en cada tema las primeras interpretaciones de resultados y guiará al estudiante de forma personalizada mientras éste aumenta su grado de autonomía.

- La teoría se ilustrará continuamente mediante ejemplos y en el desarrollo de los ejemplos se harán continuas referencias a los conceptos teóricos. Esto hace difícil diferenciar de forma precisa entre clases de teoría y clases prácticas. No obstante, podemos estimar que la “teoría” ocupará del orden de un 30% del tiempo total dedicado a las clases.

- Como última fase del trabajo práctico, se abordará la elaboración de informes que sinteticen de forma precisa y clara todas las fases del problema, desde el planteamiento inicial hasta la solución final. Se insistirá en distinguir entre un “informe técnico”, aquél que se dirige a un profesional de la estadística, y un informe “de usuario” que debe exponer la esencia de las conclusiones en un lenguaje no técnico y próximo al entorno del problema. Los estudiantes tendrán también a su disposición en algunos casos informes completos realizados por el profesor.

D E P A R T A M E N T O D E E S T A D Í S T I C A E I . O . - F A C U L T A D D E C I E N C I A S - 4 7 0 7 1 V A L L A D O L I D - E S P A Ñ A t f n o . : 9 8 3 4 2 3 1 1 1 – f a x : 9 8 3 4 2 3 0 1 3 – h t t p : / / w w w . e i o . u v a . e s /

8

Page 9: Análisis de Datos Categóricos 2003/2004valentin/am4g/2013/pd_am_1213.doc  · Web viewAplicaremos estos resultados al análisis de grandes tablas de datos con variables cualitativas:

- La participación activa de los alumnos será necesaria en todos los casos, ya se trate de clases de teoría, de prácticas o de laboratorio. Podríamos destacar que es, si cabe, en los apartados de “teoría”, en los que la atención de los alumnos debe ser máxima, con objeto de conseguir de la síntesis expuesta el mayor aprovechamiento.

Tutorías:- Las tutorías individualizadas se atenderán dentro de las 6 horas

semanales que se publican oficialmente o en cualquier otra día y hora, previa cita con el profesor.

Encuesta final:

- El profesor podrá solicitar de los estudiantes al finalizar el curso la realización de una encuesta específica de la asignatura, con objeto de conocer su opinión sobre distintos aspectos de la misma

D E P A R T A M E N T O D E E S T A D Í S T I C A E I . O . - F A C U L T A D D E C I E N C I A S - 4 7 0 7 1 V A L L A D O L I D - E S P A Ñ A t f n o . : 9 8 3 4 2 3 1 1 1 – f a x : 9 8 3 4 2 3 0 1 3 – h t t p : / / w w w . e i o . u v a . e s /

9

Page 10: Análisis de Datos Categóricos 2003/2004valentin/am4g/2013/pd_am_1213.doc  · Web viewAplicaremos estos resultados al análisis de grandes tablas de datos con variables cualitativas:

CALENDARIO DE ACTIVIDADES

Curso 4º GEST Cuatrimestre 2º Aula 105 Laboratorio A134

4 G 2 Lunes Martes Miercoles Jueves Viernes

9 h Mod. de I.O. II Mod. de I.O. II

10 h *Análisis Multivariante

Series Temporales

(aula V)

& Análisis Multivariante

Series Temporales

(aula V)11 h *Análisis

Multivariante*Análisis

MultivarianteSeries

Temporales & Análisis

MultivarianteSeries

Temporales

12 h Análisis de Supervivencia

*Análisis Multivariante

Análisis de Supervivencia

Mod. de I.O. II

# Análisis Multivariante

13 h Análisis de Supervivencia

Análisis de Supervivencia

Mod. de I.O. II

# Análisis Multivariante

* las Semanas 1 a 7 ; & las Semanas 8 a 11 # las Semanas 1 a 11

Curso 4º Horario de Clase Análisis MultivarianteSegundo Cuatrimestre

Lunes Martes Miércoles Jueves Viernes9 h

10 h AM11 h AM AM12 h AM13 h

Pruebas de evaluación contínua.Las pruebas parciales escritas y las exposiciones orales de los trabajos se realizarán semanalmente en horario de clase, dentro de la primera hora de clase de cada semana. Habrá pruebas de diferentes tipos y pesos, que se anunciarán oportunamente, incluyendo tanto exámenes de teoría y cuestiones como presentación de trabajos. Los criterios de evaluación se explican en el apartado siguiente.

D E P A R T A M E N T O D E E S T A D Í S T I C A E I . O . - F A C U L T A D D E C I E N C I A S - 4 7 0 7 1 V A L L A D O L I D - E S P A Ñ A t f n o . : 9 8 3 4 2 3 1 1 1 – f a x : 9 8 3 4 2 3 0 1 3 – h t t p : / / w w w . e i o . u v a . e s /

10

Page 11: Análisis de Datos Categóricos 2003/2004valentin/am4g/2013/pd_am_1213.doc  · Web viewAplicaremos estos resultados al análisis de grandes tablas de datos con variables cualitativas:

EVALUACIÓN del APRENDIZAJECRITERIOS de EVALUACION

1 En la Primera Convocatoria (Junio) de cada curso académico, la asignatura de Análisis de Datos se aprobará superando los criterios mínimos establecidos en el formato de evaluación continua.

2 En la Segunda Convocatoria (Julio), la asignatura se aprobará superando el examen final y el trabajo personal de la asignatura. Las pruebas parciales y la evaluación continua realizadas durante el curso no se tendrán en cuenta en esta segunda convocatoria.1 PRIMERA CONVOCATORIA (JUNIO):

EVALUACION CONTINUAPara aprobar la asignatura el alumno tendrá que superar

las pruebas parciales para evaluación continua (apartado 1.1) 75%y el trabajo final para evaluación continua (apartado1.2) 25%según las indicaciones que a continuación se detallan.

La calificación final del alumno en la asignatura dependerá de su trayectoria a lo largo de todo el curso. El trabajo final supondrá el 25% de la nota final y las pruebas presenciales supondrán el 75% restante. 1.1 Pruebas parciales para evaluación continua:

A lo largo del curso se convocarán numerosas pruebas parciales (entre 10 y 12 aproximadamente), de diferentes tipos y pesos: exámenes de teoría, problemas y cuestiones, elaboración y presentación de trabajos …

Las pruebas parciales en principio se realizarán durante la primera hora de clase de cada semana (no necesariamente la hora completa ni todas las semanas). Las pruebas serán por lo general breves. Versarán sobre la materia vista en la semana precedente y aspectos anteriores del Tema que se esté desarrollando. Algunas pruebas consistirán en la exposición de trabajos que previamente habrán elaborado. Durante la semana se dará a conocer en clase la naturaleza de la siguiente prueba, así como su peso.

Además, cada estudiante entregará una hoja en la que de forma esquemática resuma su aprendizaje personal en el período anterior. Indicará el tiempo aproximado que ha dedicado a la asignatura durante la semana y las dificultades que ha encontrado. Le será devuelta tras su revisión por el profesor. El objetivo de esta actividad es que el alumno reconozca su propio aprendizaje y detecte posibles errores en el mismo, así como que el profesor esté informado de la marcha del curso. Esto puede facilitar una reorientación de actividades o la recomendación de actuaciones particulares para mejorar el aprendizaje individual. En ningún caso tendrá efectos sobre las calificaciones.

Cada prueba se valorará provisionalmente como APTO, COMPENSABLE ó SUSPENSO. Antes de realizar la siguiente prueba, el alumno sometido a evaluación continua debe comprender y subsanar los errores que haya cometido en la prueba, elaborando y entregando una nueva versión sin errores. Tras esto, la calificación provisional pasa a ser definitiva. Sin esta entrega de correcciones, la calificación en la prueba pasará a ser de “Suspenso”.

El No Presentado se valorará como “Suspenso”. La prueba final de cada Tema versará sobre toda la materia vista en el

mismo. Con los resultados de esta prueba final de Tema y los resultados de las restantes pruebas parciales del mismo, cada alumno obtendrá una calificación de APTO/NO APTO en ese Tema.

D E P A R T A M E N T O D E E S T A D Í S T I C A E I . O . - F A C U L T A D D E C I E N C I A S - 4 7 0 7 1 V A L L A D O L I D - E S P A Ñ A t f n o . : 9 8 3 4 2 3 1 1 1 – f a x : 9 8 3 4 2 3 0 1 3 – h t t p : / / w w w . e i o . u v a . e s /

11

Page 12: Análisis de Datos Categóricos 2003/2004valentin/am4g/2013/pd_am_1213.doc  · Web viewAplicaremos estos resultados al análisis de grandes tablas de datos con variables cualitativas:

Para superar esta parte 1.1 de pruebas parciales el alumno debe obtener la calificación de “APTO” en cada Tema. Tampoco superará esta parte el alumno que suspenda una serie de tres o más pruebas consecutivas.

1.2 Trabajo Final para evaluación continua:Cada alumno realizará y expondrá un trabajo personal sobre materia libre

con datos originales que deberá aportar también. El trabajo será individual. En él se plantearán y resolverán diferentes

problemas relativos a los grandes temas desarrollados en la asignatura e incluirá necesariamente técnicas factoriales y de clasificación.

Utilizará al menos SPAD y SAS. Deberá entregar el trabajo en la última semana del curso y podrá

presentarlo ante sus compañeros mediante una exposición oral de 10-15 minutos con debate posterior.

Se valorará la originalidad, complejidad y calidad del trabajo, el volumen de datos y sobre todo, el informe final. Éste debe estar redactado en un estilo “no técnico”. Para ello el estudiante se situará en el lugar del “dueño del problema”, y utilizar su lenguaje en lo posible. Adjuntará como anexo un informe “sí técnico” que contenga una selección de salidas comentadas, justificando las técnicas que se emplean y las conclusiones extraídas.

La exposición oral de los trabajos y la participación en los debates también será tenida en cuenta para su calificación.

Se valorará sobre 10 puntos y para superar esta parte 1.2 (trabajo final para evaluación continua), deberá obtener una puntuación de al menos 5 puntos.

2 SEGUNDA CONVOCATORIA (JULIO):EXAMEN y TRABAJOLa evaluación se realizará a través de un Examen Final sobre toda la

materia y un trabajo personal de la asignatura. Cada estudiante individualmente tendrá que dar respuesta a varias cuestiones teóricas y prácticas y entregar el día del examen su trabajo personal de la asignatura. Las pruebas parciales y la evaluación continua realizadas durante el curso no se tendrán en cuenta en esta segunda convocatoria (Julio).

Para aprobar la asignatura el alumno tendrá que superar el examen final de la asignatura completa (apartado 2.1) 80%y el trabajo personal de la asignatura (apartado 2.2) 20%según las indicaciones que a continuación se detallan.

2.1 Examen final de la asignatura completaEl examen contendrá preguntas cortas de tipo teórico-práctico ó sobre ideas

generales de los programas utilizados. Puede incluir práctica con ordenador. No se pedirán desarrollos teóricos de temas largos. Como material de apoyo puede utilizarse un folio-resumen con el nombre del

alumno en la cabecera y lo entregará junto con su examen. Este examen final se valorará sobre 8 puntos y para superar esta parte 2.1 el

alumno deberá obtener una puntuación mínima de 4 puntos.

2.2 Trabajo personal de la asignatura.

D E P A R T A M E N T O D E E S T A D Í S T I C A E I . O . - F A C U L T A D D E C I E N C I A S - 4 7 0 7 1 V A L L A D O L I D - E S P A Ñ A t f n o . : 9 8 3 4 2 3 1 1 1 – f a x : 9 8 3 4 2 3 0 1 3 – h t t p : / / w w w . e i o . u v a . e s /

12

Page 13: Análisis de Datos Categóricos 2003/2004valentin/am4g/2013/pd_am_1213.doc  · Web viewAplicaremos estos resultados al análisis de grandes tablas de datos con variables cualitativas:

Sólamente se valorará si el alumno ha superado la parte 2.1 (mínimo 4 puntos).El alumno entregará su trabajo personal de la asignatura el mismo día del

examen, al comenzar éste. Este trabajo personal, individual y original se realizará sobre materia libre de la

asignatura con datos originales que deberá aportar también, pudiendo utilizar varias fuentes de datos. En él se plantearán y resolverán diferentes problemas relativos a los temas desarrollados en la asignatura.

Con este trabajo el alumno deberá mostrar el manejo que ha adquirido tanto de las técnicas estadísticas estudiadas en la asignatura como de los programas estadísticos empleados.

Entre sus contenidos incluirá al menos técnicas factoriales y de clasificación, desarrollando como mínimo las siguientes fases:

Planteamiento del problema y selección de datos. Lectura de datos y depuración (ausentes, errores, outliers..)Descripciones univariantes, ajustes a distribuciones…Descripciones multivariantes, técnicas de reducción de dimensión…Tratamiento estadístico para encontrar una solución satisfactoria al problema (analizar varias posibilidades)Interpretación de salidas y elección de una solución satisfactoria.Elaboración de informes técnicos/ no técnicos.

Se valorará la originalidad, calidad y presentación del trabajo, el volumen de datos y sobre todo, el informe final. Éste debe estar redactado en un estilo “no técnico”. Para ello el estudiante se situará en el lugar del “dueño del problema” y utilizar su lenguaje.

Adjuntará como anexo un informe “sí técnico” elaborado en lenguaje estadístico que contenga los planteamientos y una selección de salidas comentadas, justificando las técnicas que se emplean y las conclusiones extraídas.

Para superar este apartado 2.2, el alumno deberá obtener al menos 1 punto sobre una valoración máxima de 2 puntos posibles.

Cuando el alumno supera ambos apartados, 2.1 y 2.2, su nota final de segunda convocatoria será la suma de las obtenidas en cada uno de ellos.

Cuando el alumno no supera el apartado 2.1, su nota final de segunda convocatoria será la obtenida en ese apartado 2.1.

Cuando el alumno supera el apartado 2.1 pero no supera el 2.2, su nota final de segunda convocatoria será 4.

D E P A R T A M E N T O D E E S T A D Í S T I C A E I . O . - F A C U L T A D D E C I E N C I A S - 4 7 0 7 1 V A L L A D O L I D - E S P A Ñ A t f n o . : 9 8 3 4 2 3 1 1 1 – f a x : 9 8 3 4 2 3 0 1 3 – h t t p : / / w w w . e i o . u v a . e s /

13