Proyecto SA Est III 2016-1

2
Estad´ ıstica III Proyecto de an´ alisis de supervivencia* Octubre 2015 Considere el conjunto de datos contenido en la base de datos CausesDead.txt y realice lo siguiente. I. Presente la gr´ afica del estimador Kaplan–Meier de S (t) y de h(t). Reporte la edad media y la edad mediana. II. Ajuste el estimador actuarial. Usted mismo especifique el n´ umero de intervalos a con- siderar. Presente la tabla de vida y las gr´ afica de S (t) estimada. III. Ajuste uno de los siguientes modelos param´ etricos a) Exponencial b) Weibull c) Lognormal d) Gompertz–Makeham. Presente las gr´ aficas de ˆ S (t) y la de Kaplan–Mier en una sola gr´ afica, y la de ˆ h(t) en otra. Presente las estimaciones e intervalos de confianza para sus par´ ametros. IV. Ajuste el modelo de Regresi´on de Cox (Proportional-Hazard Model ) como sigue: 1. Ajuste el modelo considerando solamente una variable explicativa binaria, x 1 :0, 1 (e.g. sexo). Reporte estimaciones e intervalos de confianza para los par´ ametros del modelo ajustado. ¿El par´ ametro asociado a esta variable es estad´ ısticamente significativo? 2. Presente en una sola gr´ afica las dos curvas t vs log ˆ h(t), una por cada valor de x 1 . ¿Qu´ e puede observar en esta gr´ afica? 3. Ajuste un modelo incluyendo una segunda variable continua, x 2 (e.g. edad). Reporte ˆ h(t)= ˆ h 0 (t) exp{ ˆ β 1 x 1 + ˆ β 2 x 2 }, las estimaciones e intervalos de confianza para los par´ ametros del modelo. ¿Es cada uno de los par´ ametros significativo?, ¿Es el modelo estad´ ısticamente significativo? 4. Considere el modelo h(t)= h 0 (t) exp{β 1 x 1 + β 2 x 2 + β 3 x 1 x 2 }. ¿El efecto de la interacci´ on x 1 x 2 es significativo? ¿C´ omo lo interpreta? 5. Elija un subconjunto de p variables X =(x 1 ,x 2 ,...,x p ) y ajuste el modelo completo h(t)= h 0 (t) exp{β 1 x 1 + ... + β p x p }. 6. Use los m´ etodos automatizados disponibles para hacer una selecci´on de variables (stepwise, forward, backward) a partir del modelo ajustado en el punto anterior. 7. Apoy´ andose en los resultados de los modelos ajustados, seleccione uno de ellos, justifique su selecci´on y reporte los estimadores puntuales e intervalares. Reporte la estad´ ıstica de raz´ on de verosimilitudes para la prueba de hip´ otesis de significancia del modelo. 8. Grafique ˆ S (t), para el modelo seleccionado. 1

description

est a

Transcript of Proyecto SA Est III 2016-1

Estadıstica III Proyecto de analisis de supervivencia* Octubre 2015

Considere el conjunto de datos contenido en la base de datos CausesDead.txt y realice losiguiente.

I. Presente la grafica del estimador Kaplan–Meier de S(t) y de h(t). Reporte la edadmedia y la edad mediana.

II. Ajuste el estimador actuarial. Usted mismo especifique el numero de intervalos a con-siderar. Presente la tabla de vida y las grafica de S(t) estimada.

III. Ajuste uno de los siguientes modelos parametricos

a) Exponencial

b) Weibull

c) Lognormal

d) Gompertz–Makeham.

Presente las graficas de S(t) y la de Kaplan–Mier en una sola grafica, y la de h(t) enotra. Presente las estimaciones e intervalos de confianza para sus parametros.

IV. Ajuste el modelo de Regresion de Cox (Proportional-Hazard Model) como sigue:

1. Ajuste el modelo considerando solamente una variable explicativa binaria, x1 : 0, 1(e.g. sexo). Reporte estimaciones e intervalos de confianza para los parametrosdel modelo ajustado. ¿El parametro asociado a esta variable es estadısticamentesignificativo?

2. Presente en una sola grafica las dos curvas t vs log h(t), una por cada valor de x1.¿Que puede observar en esta grafica?

3. Ajuste un modelo incluyendo una segunda variable continua, x2 (e.g. edad). Reporteh(t) = h0(t) exp{β1x1 + β2x2}, las estimaciones e intervalos de confianza para losparametros del modelo. ¿Es cada uno de los parametros significativo?, ¿Es el modeloestadısticamente significativo?

4. Considere el modelo h(t) = h0(t) exp{β1x1 + β2x2 + β3x1x2}. ¿El efecto de lainteraccion x1x2 es significativo? ¿Como lo interpreta?

5. Elija un subconjunto de p variables X = (x1, x2, . . . , xp) y ajuste el modelo completoh(t) = h0(t) exp{β1x1 + . . .+ βpxp}.

6. Use los metodos automatizados disponibles para hacer una seleccion de variables(stepwise, forward, backward) a partir del modelo ajustado en el punto anterior.

7. Apoyandose en los resultados de los modelos ajustados, seleccione uno de ellos,justifique su seleccion y reporte los estimadores puntuales e intervalares. Reporte laestadıstica de razon de verosimilitudes para la prueba de hipotesis de significanciadel modelo.

8. Grafique S(t), para el modelo seleccionado.

1

ARTURO
Comentario en el texto

9. Grafique los residuales del modelo elegido (martingale, Cox-Snell, o Schoenfeld).

V. Formacion de grupos de riesgo.

1. Grafique el histograma de los scores derivados de la funcion de riesgo ajustada,exp{β1x1i + . . .+ βpxpi}, i : 1, ..., n.

2. Determine una particion de las observaciones en dos o tres grupos de riesgo (e.g.bajo, medio, y alto). La particion generalmente se hace en base a experiencia propia,de acuerdo a los percentiles, o sugerida por el histograma de los scores h(t).

3. Evalue un curva promedio S(t) para cada uno de los grupos que haya definidoy presente en una sola grafica las curvas grupales obtenidas. Comente sobre lascaracterısticas de los grupos de riesgo. ¿Hay diferencias? ¿Sugiere colapsar algunosgrupos?

*Proyecto proporcionado por la Dr. Guillermina Eslava Gomez.

2