Guia Didáctica

14
Gu´ ıa Did´ actica Estad´ ıstica Aplicada a las Ciencias de la Salud Alfonso Garc´ ıa P´ erez Universidad Nacional de Educaci´on a Distancia

Transcript of Guia Didáctica

Page 1: Guia Didáctica

Guıa Didactica

Estadıstica Aplicada a las Ciencias de la Salud

Alfonso Garcıa Perez

Universidad Nacional de Educacion a Distancia

Page 2: Guia Didáctica

Copyright c©2010 Alfonso Garcıa Perez

Fotografıa de la Portada: Hospital Gregorio Maranon. Madrid

“No esta permitida la reproduccion total o parcial de estelibro, ni su tratamiento informatico, ni la transmision deninguna forma o por cualquier medio, ya sea electronico,mecanico, por fotocopia, por registro u otros medios, sin elpermiso previo y por escrito de los titulares del Copyright.El contenido de este libro esta registrado por el autor en elRegistro de la Propiedad Intelectual con el numero 16/2005/2564y protegido por la Ley, que establece penas de prision ademasde las correspondientes indemnizaciones para quien lo plagiara”

Edita: Universidad Nacional de Educacion a Distancia

Page 3: Guia Didáctica

Capıtulo 1

Guıa Didactica

1.1. Introduccion

La Estadıstica es una herramienta que permite obtener conclusiones cientıfi-cas sobre una poblacion de la que solo se tienen algunos datos. Ademas, conla caracterıstica de que los posibles errores que se pudieran cometer se midenen terminos de probabilidades. Son precisamente las cotas que se fijan pa-ra las probabilidades de error las que permiten obtener Metodos Estadısticosoptimos.

Este curso de Experto Universitario va dirigido a todos aquellos profesio-nales que trabajan en el campo de la Salud, ası como a estudiantes en dichasareas, tales como Medicina, Farmacia, Enfermerıa, Biologıa, Psicologıa, Psi-quiatrıa o, simplemente, a todos aquellos que esten interesados en aprender ysaber manejar los Metodos Estadısticos que se utilizan en las Ciencias de laSalud.

Tiene como objetivo el ensenar al alumno a manejar los Metodos Estadısti-cos que, especıficamente se aplican en el area de las denominadas Ciencias dela Salud (entendidas estas en un sentido amplio) ası como a emplear dichosmetodos con la ayuda de un ordenador, mediante la utilizacion de los princi-pales paquetes estadısticos.

Aunque puede le pueda parecer al alumno un curso muy denso, la ensenan-za de las materias abordadas en el curso se articulan en tres fases o niveles,que analizaremos en la Seccion 1.4, que permiten aprobar el curso habiendosuperado solo el Nivel Basico, pero que le permite profundizar mucho mas, silo desea, pudiendo hacer preguntas sobre esos otros niveles en este ano y enlos sucesivos. Se evita de esta forma el obligar al alumno a cursar (y pagar)muchos modulos o cursos parciales para adquirir un conocimiento profundo

3

Page 4: Guia Didáctica

4 Alfonso Garcıa Perez

de la materia. Ademas, el nivel inicial de los alumnos al comenzar el curso estan diverso que, de esta manera, el alumno puede adquirir los mismos conoci-mientos finales partiendo de distintos puntos y yendo a diferentes velocidades.Es la clave de la Ensenanza a Distancia: el Equipo Docente se adapta a lasnecesidades de los alumnos y no al reves.

1.2. Contenido

1. Estadıstica Descriptiva. Analisis de Datos.2. Introduccion al Calculo de Probabilidades.3. Conceptos basicos de Inferencia Estadıstica.

− Estimacion por punto.− Estimacion por intervalos de confianza.− Contraste de hipotesis.

4. Analisis de la Varianza.5. Regresion Lineal y Correlacion

− Regresion lineal simple y Correlacion.− Regresion lineal multiple y Correlacion.

6. Analisis de la Covarianza.7. Analisis de Tablas de Contingencia.

− Contraste χ2 de bondad de ajuste.− Contraste χ2 de homogeneidad de varias muestras.− Contraste χ2 de independencia de caracteres.

8. Otros modelos de Regresion.− Regresion Logıstica.− Regresion Poisson.

9. Metodos de Clasificacion de individuos.− Analisis de Conglomerados (cluster).− Analisis Discriminante.

10. Analisis de datos de Supervivencia.− Tipos de censura y distribuciones de tiempo de fallo.− Modelos de regresion exponencial, Weibull, de azar proporcional,

y de tiempo de fallo acelerado.− Estimacion de la funcion de supervivencia. Estimador Kaplan-Meier.− Comparacion de curvas de supervivencia.

11. Fundamentos Estadısticos de los Ensayos Clınicos.12. Tratamiento Informatico de todos los Metodos Estadısticos anteriores

con los paquetes BMDP, SAS, SPSS, SPLUS y R.13. Ejercicios practicos resueltos.

Page 5: Guia Didáctica

Capıtulo 1. Guıa Didactica 5

1.3. Metodologıa y Organizacion del curso

El alumno dispone, ademas de esta Guıa Didactica, de seis textos:— Estadıstica Aplicada: Conceptos basicos (2a edicion), de Alfonso

Garcıa Perez, editado por la UNED en la coleccion Educacion Permanente,(codigo 0184011EP01A02) el cual contiene los temas del curso de EstadısticaBasica.

— Estadıstica Aplicada a las Ciencias de la Salud, de Alfonso GarcıaPerez, editado por la UNED como Material Especıfico, el cual contiene lostemas del curso de Estadıstica Avanzada. Este texto se envıa por e-mail enformato pdf.

— Estadıstica Aplicada con BMDP, de Alfonso Garcıa Perez, editadopor la UNED en la coleccion Educacion Permanente, (codigo 0186080EP01A01)mediante el cual el alumno aprende a manejar dicho paquete estadıstico ası co-mo sus principales programas.

— Estadıstica Aplicada con SAS, de Alfonso Garcıa Perez, editado porla UNED en la coleccion Educacion Permanente, (codigo 86080EP31A01) me-diante el cual el alumno aprende a manejar dicho paquete estadıstico ası comosus principales programas.

— Estadıstica Aplicada con R, de Alfonso Garcıa Perez, editado porla UNED en la coleccion Varia, (codigo 0137352PB01A01) mediante el cualel alumno aprende a manejar dicho paquete estadıstico gratuito ası como susprincipales programas.

— Estadıstica Basica Aplicada con SPSS, de Alfonso Garcıa Perez yYolanda Cabrero Ortega, editado por la UNED como Material Especıfico, me-diante el cual el alumno aprende a manejar dicho paquete estadıstico ası comosus principales programas. Este texto se envıa por e-mail en formato pdf.

Y, ademas, de un pequeno texto en pdf enviado por e-mail, Ejerciciospracticos resueltos, en donde aparecen numerosos problemas resueltos.

1.4. Recomendaciones sobre el estudio del curso yCronograma

Todo este Material Didactico, mas alguno adicional que podra encontrar elalumno en el Curso Virtual, puede parecer algo excesivo y puede que ası sea,pero hemos pensado que, en lugar de obligar al alumno a hacer varios cursospara poder considerarse Experto en la Estadıstica que se Aplica en las Cienciasde la Salud, el alumno tiene ya todo el Material y, aunque debera enviar los 8ejercicios para aprobar antes del 15 de Septiembre, puede seguir preguntandosobre el Material al Equipo Docente en los anos siguientes.

Ademas, en este tipo de cursos, el nivel inicial de los alumnos es muy

Page 6: Guia Didáctica

6 Alfonso Garcıa Perez

variado lo que puede hacer que a algunos alumnos les parezcan los temas muysencillos y a otros muy complicados.

Observe el alumno tambien que, aunque tiene cuatro textos de como ejecu-tar los Metodos Estadısticos con BMDP, SAS, SPSS o R, lo habitual es que, almenos en una primera lectura, solo utilice un paquete estadıstico y, por tanto,un solo texto de estos cuatro.

Por todo ello, hemos dividido la ensenanza de estas tecnicas en tres niveleso etapas que el alumno podra recorrer en uno o varios anos. Resaltamos quecon hacer la primera etapa y enviar los 8 ejercicios antes del 15 de Septiembre,ejercicios que corresponden a esta primera etapa, el alumno aprobara el cursosin ninguna dificultad.

Nivel BasicoComprende los Temas del Programa:

1. Estadıstica Descriptiva. Analisis de Datos.3. Conceptos basicos de Inferencia Estadıstica.

− Estimacion por punto.− Estimacion por intervalos de confianza.− Contraste de hipotesis.

4. Analisis de la Varianza.5. Regresion Lineal y Correlacion

− Regresion lineal simple y Correlacion.7. Analisis de Tablas de Contingencia.

− Contraste χ2 de bondad de ajuste.− Contraste χ2 de homogeneidad de varias muestras.− Contraste χ2 de independencia de caracteres.

al que hay que anadir su manejo con los paquetes estadısticos estudiados enel curso y la realizacion de ejercicios practicos.

Para ello, estudie los capıtulos 1 y 2 del texto base Estadıstica Aplicada:Conceptos Basicos (en adelante CB), lea luego el capıtulo 5 de CB y estudie loscapıtulos 6 y 7 de CB, las secciones 8.1, 8.2, 9.1, 9.2 y 9.3 de CB y, finalmente,el capıtulo 12 de CB, realizando muchos ejemplos del texto en pdf, EjerciciosPracticos Resueltos ayudado de algun paquete estadıstico. Recuerde que lorazonable es que elija uno de ellos y lo utilice todo el tiempo. Recuerde ademasque R es gratuito por si no tiene ninguno.

Utilice los Foros del Curso Virtual y pregunte todo lo que no entienda. Suspreguntas le ayudaran y pueden servir a otros alumnos.

Si puede, asista a las sesiones voluntarias de paquetes estadısticos que secelebraran en Madrid alrededor de Semana Santa y en algun otro centro de

Page 7: Guia Didáctica

Capıtulo 1. Guıa Didactica 7

trabajo en donde haya bastantes alumnos y alguno de ellos se lo haya pro-puesto al director de este curso, Alfonso Garcıa Perez. (Logicamente, todaslas sesiones de practicas voluntarias, y en concreto estas ultimas realizadas enalgun centro de trabajo, seran totalmente gratuitas para los alumnos del cursoy para aquellos companeros de trabajo de los alumnos en donde se celebrasenlas reuniones que quieran asistir.)

Con esto ya puede enviar los 8 ejercicios del curso y aprobarlo. Puedeenviarlos todos juntos o ir enviandolos poco a poco segun vaya estudiandolos temas correspondientes, de manera que le enviemos comentarios sobre suresolucion. Al final de la resolucion correcta de todos los ejercicios (para lo cualle daremos todas las oportunidades que necesite), le remitiremos un certificadocon su nombre, los creditos, las horas, etc. del curso, hasta que la UNED leenvıe el definitivo, una vez concluya el curso el 1 de Octubre.

De esta manera ya habra obtenido unos conocimientos basicos de la Es-tadıstica que se Aplica en las Ciencias de la Salud, y habra aprobado el cursoy obtenido el certificado. No obstante, este ano o en un futuro, le invitamos aseguir estudiando Estadıstica Aplicada pasando al siguiente nivel.

Nivel MedioSe corresponde con los Temas del Programa:

2. Introduccion al Calculo de Probabilidades.4. Analisis de la Varianza.5. Regresion Lineal y Correlacion

− Regresion lineal simple y Correlacion.− Regresion lineal multiple y Correlacion.

6. Analisis de la Covarianza.

Para la Introduccion al Calculo de Probabilidades estudie los capıtulos 3 y4 del texto CB. Ahora seguira mas claramente el capıtulo 5 de CB. Le reco-mendamos releer los capıtulos 6 y 7. Las secciones no estudiadas anteriormentede los capıtulos 8, 9 y 10, y todo el capıtulo 11 son el siguiente objetivo. Elestudio de los capıtulos 13 y 14 de CB concluirıan este nivel intermedio.

Nivel AvanzadoAhora ya puede iniciarse en el estudio de algunos Metodos Avanzados de

Estadıstica Aplicada en Ciencias de la Salud, habitualmente multivariantes.Serıan los temas del Programa:

8. Otros modelos de Regresion.− Regresion Logıstica.− Regresion Poisson.

Page 8: Guia Didáctica

8 Alfonso Garcıa Perez

9. Metodos de Clasificacion de individuos.− Analisis de Conglomerados (cluster).− Analisis Discriminante.

10. Analisis de datos de Supervivencia.− Tipos de censura y distribuciones de tiempo de fallo.− Modelos de regresion exponencial, Weibull, de azar proporcional,

y de tiempo de fallo acelerado.− Estimacion de la funcion de supervivencia. Estimador Kaplan-Meier.− Comparacion de curvas de supervivencia.

11. Fundamentos Estadısticos de los Ensayos Clınicos.

que se corresponden con los seis capıtulos del texto en pdf, Estadıstica Aplicadaa las Ciencias de la Salud, logicamente acompanados de los ejercicios resueltosque vienen en ese texto y con la ayuda de alguno de los paquetes estadısticosanalizados en el curso.

1.5. Profesorado

Dr. D. Alfonso Garcıa Perez (UNED).Catedratico de Estadıstica e Investigacion Operativa.

Da. Yolanda Cabrero Ortega (UNED).Centro Asociado de la UNED de Madrid.

D. Jesus Herranz Valera.Centro Nacional de Investigaciones Oncologicas CNIO.

D. Javier Navarro Fernandez (UNED).Titular de Universidad.

1.6. Atencion al alumnado

El alumno puede realizar consultas a:— Dr. D. Alfonso Garcıa Perez, de lunes a jueves de 10’30 a 13 horas y,

ademas, los jueves de 4 a 8 de la tarde, en el telefono: 91 398 72 51. Fax: 91398 66 97. e-mail: [email protected], mejor, a traves del Curso Virtual, sobre el que le enviaremos informacionpara acceder a el.

O, si ello es posible, de forma personal, en el despacho 104 de la Facultadde Ciencias de la UNED (Paseo Senda del Rey, 9. 28040-MADRID). Para estaopcion solicitar la entrevista para fijar la hora y el dıa.

Page 9: Guia Didáctica

Capıtulo 1. Guıa Didactica 9

1.7. Criterios de Evaluacion y Calificacion

Para obtener una calificacion positiva del curso, el alumno debera enviarresueltos correctamente los 8 ejercicios del Anexo de la Guıa Didactica a

Alfonso Garcıa PerezDepartamento de EstadısticaFacultad de CienciasUNEDPaseo Senda del Rey, 928040-Madrid

antes del dıa 15 de septiembre. Puede enviarlos tambien por e-mail a la di-reccion de correo electronico [email protected] y puede enviarlos poco apoco o todos juntos. Como lo desee. Nosotros los corregiremos y, si tuviesemuchos defectos, le indicarıamos que debe corregirlos y como debe corregirlos.

Page 10: Guia Didáctica

10 Alfonso Garcıa Perez

Page 11: Guia Didáctica

Capıtulo 2

ANEXO

Problema 1Se analizo el Nivel de Colesterol, en miligramos por decilitro de sangre

mg/dL, de 20 personas obteniendo los siguientes resultados:

200 , 150 , 210 , 240 , 270 , 400 , 185 , 218 , 225 , 250

275 , 167 , 225 , 239 , 297 , 310 , 199 , 225 , 250 , 275

Realizar un analisis descriptivo de estos datos calculando alguna medidade posicion, alguna de dispersion, haciendo alguna representacion grafica delos datos, etc.

Problema 2Se quiere estimar, mediante un intervalo de confianza, el tiempo que trans-

curre desde la administracion de la primera dosis de una nueva vacuna contrala hepatitis B, hasta que se produce en el individuo una drastica disminuciondel nivel de anticuerpos contra la mencionada enfermedad, requiriendo esteuna nueva dosis de recuerdo.

Para tal fin se eligio una muestra aleatoria simple de 40 individuos de lapoblacion en estudio en los que se observo el tiempo transcurrido desde laadministracion de la vacuna hasta la disminucion de los anticuerpos, obte-niendose una media muestral de 35 dıas.

Determinar el mencionado intervalo de confianza para un coeficiente deconfianza de 0′95, sabiendo que en las vacunas de tipo sintetico, como laaquı utilizada, es admisible suponer una desviacion tıpica de 7 dıas.

Problema 3Se este estudiando el tiempo de vida entre los pacientes a una determinada

enfermedad. A tal fin se eligieron al azar 100 fichas de pacientes fallecidos por

11

Page 12: Guia Didáctica

12 Alfonso Garcıa Perez

la enfermedad en estudio, obteniendose una media muestral de 740 dıas y unacuasidesviacion tıpica muestral de 32 dıas.

¿Puede admitirse para los pacientes de la enfermedad en cuestion un tiempomedio de vida superior a 730 dıas?

Problema 4Se quiere averiguar si tres tipos de dietas A, B y C presentan diferencias

significativas en cuanto a sus efectos sobre el aumento de peso.Con este proposito se eligieron al azar 15 individuos a las que se some-

tio aleatoriamente a una de las tres dietas, obteniendose los siguientes aumen-tos de peso:

Dieta Aumento de pesoA 39 33 39 35 32B 36 40 35 30 29C 33 33 36 26 35

A la vista de estos datos, ¿puede inferirse que existen diferencias significa-tivas entre las tres dietas a nivel α = 0′05?

Problema 5Se realizo un experimento para estudiar el efecto de un determinado medi-

camento en la disminucion de los ataques de corazon. La variable independientefue la dosis de droga en miligramos, X, y la variable dependiente la reduccionen los ataques al corazon, al compararlos con un grupo control, Y . Los datosrecogidos fueron los siguientes:

X Y

0′50 100′75 81′00 121′25 121′50 141′75 122′00 162′25 182′50 172′75 203′00 183′25 203′50 21

Determinar la recta de regresion y analizar si es significativa.

Page 13: Guia Didáctica

Capıtulo 2. ANEXO 13

Problema 6Se esta estudiando la distribucion de los cuatro grupos sanguıneos O,A, B,

AB en una poblacion. Extraıda una muestra aleatoria de ella se obtuvieronlos siguientes datos

Grupo sanguıneo frecuenciaO 121A 120B 79

AB 33

Un modelo teorico asigna las siguientes probabilidades a cada uno de losgrupos

Grupo sanguıneo frecuenciaO r2

A p2 + 2prB q2 + 2qr

AB 2pq

con p + q + r = 1.A partir de los datos de la muestra se obtuvieron las siguientes estimaciones

de los parametros: p = 0′2465 y q = 0′1732.Contrastar la hipotesis de que los datos se ajustan al modelo teorico.

Problema 7Se quiere analizar si pueden considerarse significativamente independientes

o no el tener problemas respiratorios en la adolescencia y el tener un historialde bronquitis en la infancia. Para ello se seleccionaron al azar 1000 adolescentesy se les clasifico segun tuvieran en la actualidad problemas respiratorios o no ysegun su historial clınico de bronquitis en la infancia. Los resultados obtenidosfueron los siguientes:

Historial debronquitisSı No Total

Problemas Sı 25 40respiratorios No 200 735

Total 1000

¿Puede rechazarse la hipotesis nula de independencia entre ambas variables?

Page 14: Guia Didáctica

14 Alfonso Garcıa Perez

Problema 8En un estudio sobre la caries dental de ninos de cuatro zonas geograficas

con distintos niveles de fluor en el agua, se tomo una muestra de 120 ninos decada zona en la que se obtuvieron los siguientes datos:

Zona Ninos sin cariesA 48B 18C 40D 54

¿Se pueden aceptar como equivalentes las cuatro zonas geograficas respectoa la presencia de caries?