Análisis de Varianza
I Definición:
1.1 Análisis de Varianza.- Se utiliza para comparar (a) tratamientos o niveles de
un factor único. La estructura de los datos es como se muestra en la siguiente tabla.
Tabla: Datos típicos para un experimento unifacorial
Tratamiento
o nivel
Observaciones Totales Promedios
1 y11 y12 … yin y1. .1y
2 y21 y22 y2. .2y
.
.
.
.
.
.
.
.
.
…
…
…
.
.
.
.
.
.
a ya1 ya2 … yan ya. .ay
y.. ..y
Nota: Existen algunos autores que también consideran el formato de tabla, donde los
tratamiento son las columnas correspondientes.
En la tabla yij representa la j-ésima observación del tratamiento i.
1.2 Modelo Lineal:
El modelo lineal se expresa mediante la siguiente relación:
nj
aiy ijiij
,...,2,1
,...,2,1
donde:
: Es un parámetro común a todos los tratamientos denominado media global.
i : Es un parámetro único para el i-ésimo tratamiento llamado efecto del tratamiento.
ij : Es la componente aleatoria del error.
1.3 Modelo de efectos fijos
En este modelo los efectos del tratamiento i se definen usualmente como desviaciones
con respecto a la media general, por esta razón.
0a
i
i
Para probar la hipótesis se puede realizar de la siguiente forma:
a) probar la igualdad de las medias de los tratamientos
),(:1
...: 21
jiparunparamenosloporH
Ho
ji
a
b ) Probar que los efectos de los tratamiento son cero.
)(0:1
0...: 21
iunomenosalporaH
Ho
i
a
Análisis Estadístico:
Para el análisis estadístico se utiliza el teorema de Cochran, el cual consideran que
variables aleatorias, con distribución norma NID(0,1) . El criterio de rechazo de la
hipótesis es la siguiente:
aNaFFo ,1,
Donde: N = n*a = numero de observaciones totales.
a: Numero de tratamientos.
Caso 1: Modelo balaceado
Tabla No 2 : Tabla de análisis de varianza par el modelo de efectos fijos unifactorial.
Fuente de
variación
Suma de
cuadrados
G.L Media de
Cuadrados
Fo F
Entre
tratamientos
SStratamientos a-1 MStratamientos
EMS
ntosMStratamieFo aNaF ,1,
Error dentro
del
tratamiento
SSE N-a MSE
Total SST N-1
Donde:
ntoSStratamieSSTSS
SSntoSStratamieSST
N
y
n
yntoSStratamie
N
yySST
E
E
a
i
i
a
i
n
j
ij
2
..
1
2
.
2
..
1 1
2
b) Modelo Desbalanceado o desequilibrado
Tabla No 2 : Tabla de análisis de varianza par el modelo de efectos fijos unifactorial.
Fuente de
variación
Suma de
cuadrados
G.L Media de
Cuadrados
Fo F
Entre
tratamientos
SStratamientos a-1 MStratamientos
EMS
ntosMStratamieFo aNaF ,1,
Error dentro
del
tratamiento
SSE N-a MSE
Total SST N-1
Donde:
ntoSStratamieSSTSS
SSntoSStratamieSST
N
y
n
yntoSStratamie
N
yySST
E
E
a
i i
i
a
i
n
j
ij
2
..
1
2
.
2
..
1 1
2
1.4 Modelo de Efectos Aleatorios
PROBLEMAS
1. Se ha hecho una experiencia para comparar tres métodos de enseñanza de la
programación de un ordenador digital de cierto tipo. Se tomaron muestras
aleatorias de tamaño 4 de cada uno de tres grupos de estudiantes adiestrados,
respectivamente, por el método A (enseñanza directa sobre máquina), por el
método B (enseñanza personal y alguna experiencia directa operando con el
ordenador) y por el método C (enseñanza personal, pero ningún trabajo sobre el
ordenador mismo) y los siguientes son los puntos obtenidos por estos
estudiantes en un test de aprovechamiento adecuado:
Método A: 76, 80, 70, 74
Método B: 95, 85, 91, 89
Método C: 77, 82, 81, 84
Valerse de las fórmulas abreviadas para calcular las sumas de cuadrados que se
necesitan, construir una tabla de análisis de la varianza y contrastar al nivel de
significancia 05,0 si las diferencias entre las medias de las tres muestras son
significantes.
2. Unas muestras aleatorias de cinco marcas de llantas requieren las siguientes
distancias de frenado (en pies) a una velocidad de 30 millas por hora:
Marca A Marca B Marca C Marca D Marca E
26 28 28 27 30
25 28 25 32 24
29 31 28 31 29
24 33 27 30 25
Utilizar las fórmulas abreviadas para calcular las sumas de cuadrados necesarias,
construir una tabla de análisis de la varianza y contrastar al nivel de significancia
01,0 si las diferencias entre las medias de las cinco muestras se pueden atribuir al
azar.
3. He aquí lo devengado en ocho semanas consecutivas (en dólares) por tres
vendedores de aspiradoras a domicilio empleados por una empresa determinada:
Sr.Jones 153 192 169 176 212 185 178 200
Sr.Brown 176 182 173 187 199 188 169 184
Sr. North 165 201 177 195 189 173 182 198
Calcular con las fórmulas abreviadas las sumas de cuadrados que se necesitan, construir
una tabla de análisis de varianza y contrastar al nivel de significancia 05,0 si las
diferencias entre los promedios semanales devengados por estos vendedores son
significantes.
4. He aquí los puntajes obtenidos por 10 estudiantes, elegidos al azar entre cada
una de cuatro escuelas diferentes, en un test concebido para medir su
conocimiento de sucesos de actualidad:
Escuela1 75 88 62 97 62 81 93 76 53 99
Escuela2 80 82 64 45 67 84 55 39 60 57
Escuela3 64 90 58 64 82 71 59 66 87 63
Escuela4 94 69 85 57 93 88 69 78 56 78
Con las fórmulas abreviadas, calcular las sumas de cuadrados que se necesitan, construir
una tabla de análisis de la varianza y contrastar al nivel de significancia 05,0 para
ver si las diferencias entre los puntajes promedios obtenidos por los estudiantes de las
cuatro escuelas son significantes.
5. Se está estudiando la resistencia a la tensión de cemento Portland. Cuatro
técnicas de mezclado pueden ser usadas económicamente. Se han recolectado
los siguientes datos:
Técnica de
mezclado
Resistencia a la tensión (lb/ plg2
1 3129 3000 2865 2890
2 3200 3300 2975 3150
3 2800 2900 2985 3050
4 2600 2700 2600 2765
a). Pruebe la hipótesis de que las técnicas de mezclado afectan la resistencia del
cemento. Use 05,0 .
b). Use la prueba de intervalos múltiples de Duncan para comparar los pares de medias.
6. Una fábrica de textiles cuenta con un gran número de telares. Se supone que
cada uno tiene la misma producción de tela por minuto. Para investigar esta
suposición, cinco telares son escogidos al azar, y se mide la cantidad de tela
producida en cinco tiempos diferentes. Se obtienen los datos siguientes:
a). Explique por qué es éste un experimento de efectos aleatorios. ¿Tienen todos los
telares el mismo rendimiento?
b). Calcule la variabilidad de los telares.
Telar Producción (lb/min)
1 14,0 14,1 14,2 14,0 14,1
2 13,9 13,8 13,9 14,0 14,0
3 14,1 14,2 14,1 14,0 13,9
4 13,6 13,8 14,0 13,9 13,7
5 13,8 13,6 13,9 13,8 14,0
c). Estime la varianza del error experimental.
d). Determine un intervalo de confianza de 95% para 22
2
t
t .
7. Se ha realizado un experimento para determinar si cuatro temperaturas
específicas de horneado afectan la densidad de un cierto tipo de ladrillo. El
experimento proporcionó los siguientes datos:
Temperatura Densidad
100 21,8 21,9 21,7 21,6 21,7
125 21,7 21,4 21,5 21,4
150 21,9 21,8 21,8 21,6 21,5
175 21,9 21,7 21,8 21,4
a). ¿Afecta la temperatura de horneado la densidad del ladrillo?
b). Compare los valores medios usando la prueba de intervalos múltiples de Duncan.
c). Utilice el método gráfico para determinar cuáles medias difieren. ¿Concuerdan las
conclusiones a que se llega con este método con las de la prueba de intervalos múltiples
de Duncan de la parte (b) de esta pregunta?
8. Un fabricante de equipos de televisión está interesado en el efecto que tienen
sobre los cinescopios de televisores a color, cuatro diferentes tipos de
recubrimiento. Se obtuvieron los siguientes datos de conductividad:
Tipo de
recubrimiento
Conductividad
1 143 141 150 146
2 152 149 137 143
3 134 136 132 127
4 129 127 132 129
a). ¿Existe diferencia en la conductividad producida por los recubrimientos? Use
05,0 .
b). Estime la media general y los efectos de los tratamientos.
c). Calcule una estimación por intervalo de 95% de confiabilidad para la media del
recubrimiento tipo 4. Calcule una estimación por intervalo con 99% de confiabilidad
para la diferencia media entre los recubrimientos 1 y 4.
d) Pruebe todas las parejas de medias usando la prueba de intervalos múltiples de
Duncan, con 05,0 .
e). Suponiendo que actualmente se usa el recubrimiento 4, ¿qué recomendaría al
fabricante? Se desea minimizar la conductividad.
Top Related