Download - Análisis Componentes de la Varianza

Transcript
Page 1: Análisis Componentes de la Varianza

STATGRAPHICS – Rev. 4/25/2007

© 2006 por StatPoint, Inc. Análisis de Componentes de la Varianza - 1

Análisis de Componentes de la Varianza Resumen El procedimiento de Análisis de Componentes de Varianza está diseñado para estimar la contribución de múltiples factores a la variabilidad de una variable dependiente Y. Está diseñado para analizar un experimento anidado en el cual los factores están estructurados en una manera jerárquica. En tal estudio, las muestras de cada factor son tomadas del interior de las muestras del factor inmediatamente arriba de él. Por ejemplo, b conjuntos podrían haber sido tomados de un proceso. Entonces s muestras podrían ser tomadas de cada conjunto. Finalmente, t pruebas podrían ser realizadas en cada muestra. El conjunto final de datos tendría un total de n = bst medidas. Este procedimiento está diseñado para un experimento en el cual los factores están estructurados en un estricto orden jerárquico y en el cual todos los efectos se asumen como aleatorios. El procedimiento Modelos Lineales Generales debería ser usado para situaciones más complicadas. StatFolio de Muestra: varcomp.sgp Datos de la Muestra: El archivo pigment.sf6 contiene datos de un experimento descrito por Box, Hunter y Hunter (1978). En ese experimento, b = 15 conjuntos de pegamento de pigmento fueron seleccionados. De cada conjunto, s = 2 muestras fueron tomadas y t = 2 pruebas fueron ejecutadas en cada muestra para medir la humedad contenida. Un total de n = 60 mediciones se encuentran en el archivo y una parte de éstas se muestra abajo:

Batch Simple Test Moisture 1 1 1 40 1 1 2 39 1 2 1 30 1 2 2 30 2 3 1 26 2 3 2 28 2 4 1 25 2 4 2 26 3 5 1 29 3 5 2 28 3 6 1 14 3 6 2 15

Los conjuntos están numerados del 1 a b = 15. Las muestras están numeradas del 1 al bs = 30, sin embargo ellas podrían haber sido etiquetadas del 1 a s = 2 dentro de cada conjunto. Las pruebas están numeradas del 1 a t = 2 dentro de cada muestra, sin embargo éstas podrían haber sido numeradas del 1 al bst = 60. Cada esquema de numeración proporcionará idénticos resultados.

Page 2: Análisis Componentes de la Varianza

STATGRAPHICS – Rev. 4/25/2007

© 2006 por StatPoint, Inc. Análisis de Componentes de la Varianza - 2

Captura de Datos Los datos consisten de una sencilla columna que contiene las mediciones así como múltiples columnas que indican los niveles de los factores experimentales.

• Variable Dependiente: columna numérica que contiene las observaciones. • Factores en Orden de Anidamiento: columnas numéricas o no numéricas que contienen los

niveles que identifican cada factor. Los factores deben ser capturados de arriba hacia abajo, por ejemplo cada factor se asume para ser anidado en el factor que se encuentra inmediatamente arriba de él en la lista. Este es uno de los pocos procedimientos de STATGRAPHICS en los que el orden de los factores afecta el análisis.

• Selección: selecciona el subconjunto. Nota: la prueba del factor final puede omitirse de la lista de factores en el cuadro de diálogo. Si es así, sus efectos serán incluidos como un término de “Residuo” en la tabla de ANOVA.

Modelo Estadístico El modelo estadístico relevante para la muestra de datos es tsbbstY εεεμ +++= (1) donde μ = media del proceso εb = desviación de la media de conjunto b de la media del proceso μ

Page 3: Análisis Componentes de la Varianza

STATGRAPHICS – Rev. 4/25/2007

© 2006 por StatPoint, Inc. Análisis de Componentes de la Varianza - 3

εs = desviación de la media de la muestra s de la media del conjunto b εt = desviación del cálculo de la prueba t de la media de la muestra s Las desviaciones se asumen usualmente como muestras aleatorias de distribuciones normales con desviaciones estándar: σb = desviación estándar entre los conjuntoss σs = desviación estándar entre las muestras dentro de los conjuntos σt = desviación estándar entre los resultados de pruebas dentro de cada muestra Suponiendo que los diversos componentes del error son independientes, la variabilidad del proceso general es la suma de la variabilidad explicada por los diversos componentes, por ejemplo: 2222

tsb σσσσ ++= (2)

Resumen del Análisis El Resumen del Análisis muestra el número de observaciones n y un análisis de la tabla de varianza. Análisis Componentes de la Varianza - moisture Variable dependiente: moisture Factores: batch sample test Número de casos completos: 60 Análisis de Varianza para moisture Fuente Suma de Cuadrados Gl Cuadrado Medio Comp. Var. Porciento TOTAL (CORREGIDO) 2108.18 59 Batch 1210.93 14 86.4952 7.12798 19.49 Sample 869.75 15 57.9833 28.5333 78.01 Test 27.5 30 0.916667 0.916667 2.51

La tabla muestra: • Sumas de Cuadrados: una descomposición de la suma de las desviaciones cuadradas

alrededor de la gran media. • GL: los grados de libertad asociados con cada suma de cuadrados. • Cuadrado Medio: las sumas de cuadrados divididos entre sus grados de libertad. • Componentes de la Varianza: los componentes de la varianza estimada los cuales son las

varianzas estimadas de cada factor dentro del factor donde está anidado. Los componentes de

Page 4: Análisis Componentes de la Varianza

STATGRAPHICS – Rev. 4/25/2007

© 2006 por StatPoint, Inc. Análisis de Componentes de la Varianza - 4

la varianza son estimados al especificar los cuadrados de medias en la tabla de la ANOVA igual a sus valores esperados y resolviendo las ecuaciones resultantes.

• Porciento: el porcentaje de la varianza total del proceso representada por cada componente. En los datos de la muestra las estimaciones de los componentes de la varianza son:

$σb2 = 7.128 $σ s

2 =28.53 $σ t2 = 0.9167.

La estimación de la variabilidad total del proceso es

2222 ˆˆˆˆ tsb σσσσ ++= = 36.63 Note que la variabilidad entre muestras dentro del mismo conjunto representa sobre el 78% de la variabilidad total indicando un problema con la homogeneidad dentro de los conjuntos.

Diagrama de Puntos El cuadro Diagrama de Puntos grafica los datos por niveles de un factor seleccionado.

Gráfica de Componentes de Varianza

12

34

56

78

910

1112

1314

15batch

13

18

23

28

33

38

43

moi

stur

e

La gráfica de arriba muestra líneas horizontales en cada una de las 15 medias de conjuntos. Cada punto representa la media de una muestra dentro de un conjunto. Opciones de Cuadro

Page 5: Análisis Componentes de la Varianza

STATGRAPHICS – Rev. 4/25/2007

© 2006 por StatPoint, Inc. Análisis de Componentes de la Varianza - 5

• Factor: el factor a ser graficado en el eje horizontal.

Gráfica de Desviación de Componentes La Gráfica de Desviación de Componentes muestra la desviación de cada observación de la media de todas las observaciones al mismo nivel de un factor seleccionado:

2.51%

78.01%

19.49%

Gráfica de Desviación de Componentes para moisture

-14 -9 -4 1 6 11 16desviación de la media

test

sample

batch

Cada sección de la gráfica contiene un punto que corresponde a cada observación. En cada sección, una media diferente ha sido substraída del valor de los datos.

Sección Superior (conjunto): muestra la desviación de cada observación de la media general de todas las observaciones.

Sección del Centro (muestra): muestra la desviación de cada observación de la media del conjunto del cual fue tomado.

Sección Inferior (prueba): muestra la desviación de cada observación de la media de la muestra de la cual fue tomada.

El efecto es para mostrar de abajo hacia arriba la contribución adicional de cada componente. La variabilidad en la sección inferior se explica solamente al proceso de prueba. La variabilidad en la sección del centro incluye la variabilidad de las pruebas y la variabilidad entre muestras dentro del mismo conjunto. La variabilidad en la sección superior proviene de los tres componentes.

Page 6: Análisis Componentes de la Varianza

STATGRAPHICS – Rev. 4/25/2007

© 2006 por StatPoint, Inc. Análisis de Componentes de la Varianza - 6

En la gráfica de arriba es claro que una cantidad substancial de variabilidad es introducida en el nivel de las muestras dentro de los conjuntos.

Resumen Estadístico La tabla del Resumen Estadístico muestra los tamaños muestrales, medias y desviaciones estándar en cada nivel de los factores. Una parte de la tabla se muestra abajo:

Resumen estadístico para moisture Desviación Nivel Recuento Media Estándar MEDIA GLOBAL 60 26.7833 5.97762 Batch 1 4 34.75 5.5 2 4 26.25 1.25831 3 4 21.5 8.1035 4 4 27.25 3.77492 5 4 18.25 1.5 6 4 28.75 4.42531 7 4 28.0 5.22813 8 4 31.5 2.88675 9 4 29.0 2.3094 10 4 20.0 6.58281 11 4 25.0 1.63299 12 4 30.25 1.5 13 4 24.5 5.8023 14 4 24.25 0.957427 15 4 32.5 6.45497 Muestra 1 2 39.5 0.707107 2 2 30.0 0.0 3 2 27.0 1.41421 4 2 25.5 0.707107 5 2 28.5 0.707107 6 2 14.5 0.707107 7 2 30.5 0.707107 8 2 24.0 0.0

Gráficas de Residuos Como con todos los modelos estadísticos es una buena práctica examinar los residuos. Los residuos son iguales a los valores de los datos observados menos los valores predichos por el modelo estadístico subyacente. El procedimiento Componentes de Varianza crea 3 gráficas de residuos:

1. versus nivel de factor. 2. versus valor predicho. 3. versus número de fila.

Nota: En los datos muestrales, los factores han sido especificados para cada nivel de error experimental así que los residuos son todos igual a 0. Si la prueba es removida como un factor, entonces su efecto será reflejado en un término del residuo. Las gráficas de abajo reflejan eso como análisis:

Page 7: Análisis Componentes de la Varianza

STATGRAPHICS – Rev. 4/25/2007

© 2006 por StatPoint, Inc. Análisis de Componentes de la Varianza - 7

Residuos versus Nivel de Factor Esta gráfica es útil para visualizar cualquier diferencia en la variabilidad en varios niveles de un factor.

12

34

56

78

910

1112

1314

15

Gráfico de Residuos para moisture

-1.5

-1

-0.5

0

0.5

1

1.5

resi

duo

batch

El residuo promedio en cada nivel es igual a 0. Paneles de Opciones

• Factor: factor a ser mostrado en el eje horizontal Residuos versus Predicho Esta gráfica es útil para detectar cualquier heteroscedasticidad en los datos.

Page 8: Análisis Componentes de la Varianza

STATGRAPHICS – Rev. 4/25/2007

© 2006 por StatPoint, Inc. Análisis de Componentes de la Varianza - 8

Gráfico de Residuos para moisture

-1.5

-1

-0.5

0

0.5

1

1.5

resi

duo

13 18 23 28 33 38 43moisture predicho

La heteroscedasticidad ocurre cuando la variabilidad de los datos cambia conforme la media cambia y podría necesitar la transformación de los datos antes de realizar la ANOVA. La heteroscedasticidad se evidencia usualmente por un patrón en forma de embudo en la gráfica de los residuos. Residuos versus Observación Esta gráfica muestra los residuos versus el número de fila en la hoja de base de datos:

Gráfico de Residuos para moisture

-1.5

-1

-0.5

0

0.5

1

1.5

resi

duo

0 10 20 30 40 50 60número de fila

Si los datos se ordenan en orden cronológico cualquier patrón en los datos podría indicar una influencia externa. No se encuentra evidencia de tal patrón en la gráfica de arriba.

Guardar Resultados Los siguientes resultados pueden ser guardados en la hoja de base de datos:

1. Componentes de Varianza – los componentes de varianza estimada. 2. Residuos – los n residuos.

Page 9: Análisis Componentes de la Varianza

STATGRAPHICS – Rev. 4/25/2007

© 2006 por StatPoint, Inc. Análisis de Componentes de la Varianza - 9

Cálculos La estimación de los componentes de la varianza sigue el procedimiento descrito en la documentación Modelos Lineales Generales.