Practicaasdasd

3
GF600 – Otoño 2007 - Practica de Matlab No. 3 30% del curso (10% parte A, 20% parte B) Parte A: Prueba de hipótesis y estadística descriptiva Formato de la actividad En esta tarea se examinen distintos aspectos del comportamiento de la contaminación atmosférica (MP10) en el sector centro-poniente de Santiago. En general, se trabaja con series diarias de observaciones (ver anexo para una función para extraer fácilmente datos diarios de los archivos .mat). Cada una de las actividades consiste en (al menos) una prueba de hipótesis que se base en una pregunta sobre los observaciones de PM10. Hay que interpretar en términos precisos la pregunta y de allí construir la prueba de hipótesis usando los cinco pasos estándares (ver documento: Wilks_Cap_5.doc): 1. Identificación de un estadístico de prueba 2. Definición de una hipótesis nula 3. Definición de una hipótesis alternativa 3. Obtención de la distribución nula 4. Comparación del estadístico de prueba observado con la distribución nula Use un nivel de rechazo de 5% y también calcula la probabilidad (p) para la estadística de prueba. Para cada prueba ocupa 2 metodologías si es posible: Un test paramétrico (asumiendo distribuciones gaussianas) y un test no-paramétrico (de demuestro o bootstrap) y comparen los resultados. En todos los casos comenten sobre los supuestos y limitaciones de las pruebas. Datos necesarios Para esta tarea hay datos de 4 estaciones en la Región Metropolitana (ver mapa al final). Las estaciones tienen diferentes variables atmosféricas disponibles. Variables disponibles MP10 (ug/m3) Temperatura (°C) Velocidad del viento (m/s) Orientación del viento (°) Presión Atmosférica (hPa) Precipitación (mm) Estación pm10 temp vel dir pres prcp parque x x x x pudahuel x x x x platina x loprado x x x x

description

asadasdsa

Transcript of Practicaasdasd

  • GF600 Otoo 2007 - Practica de Matlab No. 3 30% del curso (10% parte A, 20% parte B) Parte A: Prueba de hiptesis y estadstica descriptiva Formato de la actividad En esta tarea se examinen distintos aspectos del comportamiento de la contaminacin atmosfrica (MP10) en el sector centro-poniente de Santiago. En general, se trabaja con series diarias de observaciones (ver anexo para una funcin para extraer fcilmente datos diarios de los archivos .mat). Cada una de las actividades consiste en (al menos) una prueba de hiptesis que se base en una pregunta sobre los observaciones de PM10. Hay que interpretar en trminos precisos la pregunta y de all construir la prueba de hiptesis usando los cinco pasos estndares (ver documento: Wilks_Cap_5.doc): 1. Identificacin de un estadstico de prueba 2. Definicin de una hiptesis nula 3. Definicin de una hiptesis alternativa 3. Obtencin de la distribucin nula 4. Comparacin del estadstico de prueba observado con la distribucin nula Use un nivel de rechazo de 5% y tambin calcula la probabilidad (p) para la estadstica de prueba. Para cada prueba ocupa 2 metodologas si es posible: Un test paramtrico (asumiendo distribuciones gaussianas) y un test no-paramtrico (de demuestro o bootstrap) y comparen los resultados. En todos los casos comenten sobre los supuestos y limitaciones de las pruebas. Datos necesarios Para esta tarea hay datos de 4 estaciones en la Regin Metropolitana (ver mapa al final). Las estaciones tienen diferentes variables atmosfricas disponibles.

    Variables disponibles MP10 (ug/m3)

    Temperatura(C)

    Velocidaddel viento (m/s)

    Orientacin del viento ()

    Presin Atmosfrica (hPa)

    Precipitacin (mm)

    Estacin

    pm10 temp vel dir pres prcp parque x x x x pudahuel x x x x platina x loprado x x x x

  • Los datos de encuentran en las siguientes archivos: parque.mat pudahuel.mat platina.mat loprado.mat Para extraer series diarias hay disponible una funcion: get_serie_diara.m Use >> help get_serie_diaria para saber como usar. Actividades Para cada actividad use datos solamente para el periodo invernal (de Abril a Agosto). Asegura que se tomen en cuanta las observaciones faltantes. Donde sea apropiado, respalda los resultados con grficos (histogramas, diagramas de caja, diagramas de dispersin, etc.) Considere en los anlisis la posible influencia de dependencias seriales.

    Sugerencias help (siempre) randperm (util para test no parametrito) for i = 1:10000 dist_nulo(i) = .; end corrcoef

    1) Influencia de precipitacin en la cuenca (Use datos de PM10 de Pudahuel y precipitacin de La Platina) a) Hiptesis: En promedio, la contaminacin (MP10) es menor durante das en que hay precipitaciones en Santiago b) Cuanto tiempo se necesita para que, despus de una lluvia, la contaminacin en Santiago vuelve a niveles normales? 2) Influencia del da de semana (Use datos de PM10 de Parque OHiggins) a) Hiptesis: El da domingo es menos contaminado que cualquier otro da de la semana b) Caracteriza la influencia del da de semana en los niveles de contaminacin. Existen efectivamente das que son ms o menos contaminados que los dems? 3) Comparacin de estaciones Parque OHiggins y Pudahuel (Use datos de PM10 de Parque OHiggins y Pudahuel) a) Hiptesis: El promedio de PM10 en Pudahuel es mayor que el promedio en

  • ParqueOhiggins b) Hiptesis: Hay mas das de alerta y preemergencia en Pudahuel que en Parque OHiggins 4) Relacin entre PM10 y variables atmosfricas (Use datos de PM10 y temperatura de Parque OHiggins y Lo Prado) a) Hiptesis Hay menos contaminacin atmosfrica en das de viento menos fuerte b) Hiptesis El nivel de contaminacin atmosfrica depende de la temperatura del aire c) Hiptesis El nivel de contaminacin depende fuertemente de la estabilidad del aire (dT/dz) Sugerencia: Use la coeficiente de correlacin como medida de la cuan fuerte es la relacin entre dos variables d) Use diagramas de dispersin para representar la relacin entre PM10 y estas variables. Calcule intervalos de confianza de 90% para los coeficientes de correlacin. Mapa de las estaciones Las estaciones Pudahuel, Parque OHiggins y La Platina estn ubicadas en aproximadamente 500m de altura. Lo Prado est mas elevada, en ~900 m.