Analisis Texto Graficas Minitab

19
1. Gráfica de valores individuales Exploración de datos y evaluar relaciones entre las variables, Variabilidad de los datos y comparación de datos Grafica. Fuente: Autores Grafica.

Transcript of Analisis Texto Graficas Minitab

Page 1: Analisis Texto Graficas Minitab

1. Gráfica de valores individuales

Exploración de datos y evaluar relaciones entre las variables, Variabilidad de los datos y comparación de datos

Grafica.

Fuente: Autores

Grafica.

Fuente: Autores

Page 2: Analisis Texto Graficas Minitab

Interpretación de los resultados

Las gráficas de valores individuales para material partículado PM10, muestran que cada año tiene un promedio de contaminación distinto. El año 2009 tiene una media menor que los años 2008 y 2010.

Las gráficas de valores individuales para morbilidad de menores de 5 años, muestran que cada año tiene un promedio de contaminación distinto. El año 2008 tiene una media menor que los años 2009 y 2010; en contraste el año 2009 no muestra una correlación entre la contaminación del aire por material partículado y la morbilidad de menores de 5 años.

2. Histograma agrupado

Histograma agrupado, es el que muestra los histogramas de cada año en la misma gráfica. El histograma agrupado mostrará la cantidad de superposición entre los datos de cada centro de envío.

Grafica.

Fuente: Autores

Grafica.

Page 3: Analisis Texto Graficas Minitab

Fuente: Autores

Interpretación de los resultados

Tal como pudo apreciar en la gráfica de valores individuales, las medias de cada año son distintas. Los tiempos de entrega promedio son:

AÑO PM 10 Morbilidad2008 78.83 1202009 58.75 114.52010 61.08 75.6

El histograma agrupado muestra que los años 2009 y 2010 son similares en cuanto al promedio de contaminación por PM 10 y a la dispersión de los datos. En contraste, el año 2008 es mayor y mass disperso. Para morbilidad el histograma agrupado muestra que los años 2008 y 2009 son similares en cuanto al promedio y a la dispersión de los datos. En contraste, el año 2010 es manor y menos disperso.

2. Histograma en paneles

Page 4: Analisis Texto Graficas Minitab

Para determinar si los datos en cada año siguen una distribución normal.

Grafica.

Fuente: Autores

Grafica.

Fuente: Autores

Page 5: Analisis Texto Graficas Minitab

Interpretación de los resultados

La contaminación en cada año, no se distribuyen normalmente, tal como lo demuestran las curvas de distribución que exhiben el mismo patrón, exceptuando el año 2008 que se distribuye mejor solamente para el caso de morbilidad de menores de 5 años..

3. Examen de las relaciones entre dos variables

Las gráficas pueden ayudar a identificar si existen asociaciones entre variables y la fuerza de cualquier asociación. El conocer la relación entre variables puede ayudar a orientar análisis adicionales y a determinar qué variables resulta importante analizar.

Gráfica de Dispersión

Page 6: Analisis Texto Graficas Minitab

4. Interpretación de los resultados

Los puntos de la gráfica de dispersión no muestran un patrón claro en ninguno para los tres años. La línea de regresión de morbilidad en correlación al PM 10, es relativamente plana, lo que sugiere poca asociación entre variables.

Page 7: Analisis Texto Graficas Minitab

Grafica. Dispersión de datos con rezago de un mes en la contaminación del aire PM 10.

Grafica. Dispersión de datos con rezago de dos meses en la contaminación del aire PM 10.

Page 8: Analisis Texto Graficas Minitab

Grafica. Dispersión de datos con rezago de tres meses en la contaminación del aire PM 10.

Interpretación de los resultados

Los puntos de la gráfica de dispersión mejoran en el patrón de correlación. La línea de regresión de morbilidad en correlación al PM 10, aumenta la pendiente positiva, aunque los datos se muestran dispersos en relación a la correlación.

Page 9: Analisis Texto Graficas Minitab

Análisis de datos

El campo de estadísticas proporciona principios y metodologías para recopilar, resumir, analizar e interpretar datos. También sirve para sacar conclusiones de análisis de resultados. Las estadísticas se pueden usar para describir datos y hacer inferencias. Ambos elementos pueden orientar decisiones.

1. Estadísticas descriptivas

Ejecución del ANOVA (análisis de varianza)

En general, una prueba de hipótesis supone verdadera una afirmación inicial y luego prueba esta afirmación mediante datos de muestra.

Las pruebas de hipótesis incluyen dos hipótesis: la hipótesis nula (señalada como H0) y la hipótesis alternativa (señalada como H1). La hipótesis nula es la afirmación inicial y con frecuencia se especifica sobre la base de investigaciones anteriores o de conocimiento común. La hipótesis alternativa es lo que usted puede considerar verdadero.

Salida de la ventana Sesión

ANOVA unidireccional: Morbililidad Menores de 5 Años vs. AÑO

Fuente GL SC MC F PAÑO 2 14015 7007 2,07 0,143Error 33 111840 3389Total 35 125855

S = 58,22 R-cuad. = 11,14% R-cuad.(ajustado) = 5,75%

ICs de 95% individuales para la media basados en Desv.Est. agrupadaNivel N Media Desv.Est. ------+---------+---------+---------+---2008 12 120,00 59,57 (----------*----------)2009 12 114,50 72,54 (----------*-----------)2010 12 75,67 36,83 (----------*-----------) ------+---------+---------+---------+--- 60 90 120 150

Desv.Est. agrupada = 58,22

Page 10: Analisis Texto Graficas Minitab

Intervalos de confianza simultáneos de Tukey del 95%Todas las comparaciones de dos a dos entre los niveles de AÑO

Nivel de confianza individual = 98,04%

AÑO = 2008 restado de:

AÑO Inferior Centro Superior -+---------+---------+---------+--------2009 -63,81 -5,50 52,81 (-----------*-----------)2010 -102,65 -44,33 13,98 (-----------*-----------) -+---------+---------+---------+-------- -100 -50 0 50

AÑO = 2009 restado de:

AÑO Inferior Centro Superior -+---------+---------+---------+--------2010 -97,15 -38,83 19,48 (----------*-----------) -+---------+---------+---------+-------- -100 -50 0 50

ANOVA unidireccional: Material Partículado µg/m³ vs. AÑO

Fuente GL SC MC F PAÑO 2 2895 1448 13,06 0,000Error 33 3659 111Total 35 6554

S = 10,53 R-cuad. = 44,18% R-cuad.(ajustado) = 40,79%

ICs de 95% individuales para la media basados en Desv.Est. agrupadaNivel N Media Desv.Est. -------+---------+---------+---------+--2008 12 78,83 14,66 (-----*-----)2009 12 58,75 8,55 (-----*-----)2010 12 61,08 6,68 (-----*-----) -------+---------+---------+---------+-- 60 70 80 90

Desv.Est. agrupada = 10,53

Intervalos de confianza simultáneos de Tukey del 95%

Page 11: Analisis Texto Graficas Minitab

Todas las comparaciones de dos a dos entre los niveles de AÑO

Nivel de confianza individual = 98,04%

AÑO = 2008 restado de:

AÑO Inferior Centro Superior ------+---------+---------+---------+---2009 -30,63 -20,08 -9,54 (--------*--------)2010 -28,30 -17,75 -7,20 (--------*--------) ------+---------+---------+---------+--- -24 -12 0 12

AÑO = 2009 restado de:

AÑO Inferior Centro Superior ------+---------+---------+---------+---2010 -8,21 2,33 12,88 (--------*--------) ------+---------+---------+---------+--- -24 -12 0 12

Interpretar los resultados

El proceso de toma de decisiones para una prueba de hipótesis se puede basar en el valor de probabilidad (valor p) para la prueba específica.

Si el valor p es menor o igual a un nivel predeterminado de significancia nivel ∞ finito, usted rechaza la hipótesis nula y da crédito a la alternativa.

Si el valor p es mayor que el nivel ∞ finito, no se rechaza la hipótesis nula y no se puede dar crédito a la hipótesis alterna.

El método de Tukey compara las medias para cada par de niveles de factor utilizando un nivel de significancia por familia (frecuentemente mencionado como nivel de significancia por familia) para controlar la tasa de errores de tipo de I El nivel de significancia por familia es la probabilidad de cometer uno o más errores de tipo I para todo el conjunto de comparaciones. El método de Tukey ajusta el nivel de confianza individual, de acuerdo con el nivel de significancia por familia que usted elija.

Page 12: Analisis Texto Graficas Minitab

Los resultados se presentan como un conjunto de intervalos de confianza para la diferencia entre pares de medias. Utilice los intervalos para determinar si las medias son diferentes:

Si un intervalo no contiene cero, existe una diferencia estadísticamente significativa entre las medias correspondientes.

Si el intervalo sí contiene cero, la diferencia entre las medias no es estadísticamente significativa, la cual aplica para morbilidad de menores de 5 años y PM 10.

Salida de la ventana Gráfica

Page 13: Analisis Texto Graficas Minitab
Page 14: Analisis Texto Graficas Minitab
Page 15: Analisis Texto Graficas Minitab

Interpretar los resultados

Las gráficas de valores individuales y las de caja indican que el tiempo de entrega varía entre los centros de envío, lo que resulta coherente con las gráficas del capítulo anterior.

Gráfica de probabilidad normal: para detectar no normalidades. Una línea aproximadamente recta indica que los residuos se distribuyen normalmente.

Histograma de los residuos: para detectar diversos valores máximos, valores atípicos y no normalidades. El histograma debe ser aproximadamente simétrico y con forma de campana.

Residuos contra los valores ajustados: para detectar varianza no constante, términos de orden superior omitidos y valores atípicos. Los residuos se deben dispersar aleatoriamente en torno a cero.

Residuos versus orden: para detectar la dependencia del tiempo de los residuos. Los residuos no deben exhibir un patrón claro.

Para los años en morbilidad de menores de 5 años y PM 10 de, las gráficas de residuos cuatro en uno no indican infracciones de supuestos estadísticos. El modelo del ANOVA de un factor ajusta los datos de manera razonablemente adecuada.