Modelo Unifactorial -Teoria

6
Análisis de Varianza I Definición: 1.1 Análisis de Varianza.- Se utiliza para comparar (a) tratamientos o niveles de un factor único. La estructura de los datos es como se muestra en la siguiente tabla. Tabla: Datos típicos para un experimento unifacorial Tratamiento o nivel Observaciones Totales Promedios 1 y 11 y 12 y in y 1. . 1 y 2 y 21 y 22 y 2. . 2 y . . . . . . . . . . . . . . . a y a1 y a2 y an y a. . a y y.. .. y Nota: Existen algunos autores que también consideran el formato de tabla, donde los tratamiento son las columnas correspondientes. En la tabla y ij representa la j-ésima observación del tratamiento i. 1.2 Modelo Lineal: El modelo lineal se expresa mediante la siguiente relación: n j a i y ij i ij ,..., 2 , 1 ,..., 2 , 1 donde: : Es un parámetro común a todos los tratamientos denominado media global. i : Es un parámetro único para el i-ésimo tratamiento llamado efecto del tratamiento. ij : Es la componente aleatoria del error. 1.3 Modelo de efectos fijos En este modelo los efectos del tratamiento i se definen usualmente como desviaciones con respecto a la media general, por esta razón. 0 a i i Para probar la hipótesis se puede realizar de la siguiente forma:

Transcript of Modelo Unifactorial -Teoria

Page 1: Modelo Unifactorial -Teoria

Análisis de Varianza

I Definición:

1.1 Análisis de Varianza.- Se utiliza para comparar (a) tratamientos o niveles de

un factor único. La estructura de los datos es como se muestra en la siguiente tabla.

Tabla: Datos típicos para un experimento unifacorial

Tratamiento

o nivel

Observaciones Totales Promedios

1 y11 y12 … yin y1. .1y

2 y21 y22 y2. .2y

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

a ya1 ya2 … yan ya. .ay

y.. ..y

Nota: Existen algunos autores que también consideran el formato de tabla, donde los

tratamiento son las columnas correspondientes.

En la tabla yij representa la j-ésima observación del tratamiento i.

1.2 Modelo Lineal:

El modelo lineal se expresa mediante la siguiente relación:

nj

aiy ijiij

,...,2,1

,...,2,1

donde:

: Es un parámetro común a todos los tratamientos denominado media global.

i : Es un parámetro único para el i-ésimo tratamiento llamado efecto del tratamiento.

ij : Es la componente aleatoria del error.

1.3 Modelo de efectos fijos

En este modelo los efectos del tratamiento i se definen usualmente como desviaciones

con respecto a la media general, por esta razón.

0a

i

i

Para probar la hipótesis se puede realizar de la siguiente forma:

Page 2: Modelo Unifactorial -Teoria

a) probar la igualdad de las medias de los tratamientos

),(:1

...: 21

jiparunparamenosloporH

Ho

ji

a

b ) Probar que los efectos de los tratamiento son cero.

)(0:1

0...: 21

iunomenosalporaH

Ho

i

a

Análisis Estadístico:

Para el análisis estadístico se utiliza el teorema de Cochran, el cual consideran que

variables aleatorias, con distribución norma NID(0,1) . El criterio de rechazo de la

hipótesis es la siguiente:

aNaFFo ,1,

Donde: N = n*a = numero de observaciones totales.

a: Numero de tratamientos.

Caso 1: Modelo balaceado

Tabla No 2 : Tabla de análisis de varianza par el modelo de efectos fijos unifactorial.

Fuente de

variación

Suma de

cuadrados

G.L Media de

Cuadrados

Fo F

Entre

tratamientos

SStratamientos a-1 MStratamientos

EMS

ntosMStratamieFo aNaF ,1,

Error dentro

del

tratamiento

SSE N-a MSE

Total SST N-1

Donde:

ntoSStratamieSSTSS

SSntoSStratamieSST

N

y

n

yntoSStratamie

N

yySST

E

E

a

i

i

a

i

n

j

ij

2

..

1

2

.

2

..

1 1

2

b) Modelo Desbalanceado o desequilibrado

Tabla No 2 : Tabla de análisis de varianza par el modelo de efectos fijos unifactorial.

Page 3: Modelo Unifactorial -Teoria

Fuente de

variación

Suma de

cuadrados

G.L Media de

Cuadrados

Fo F

Entre

tratamientos

SStratamientos a-1 MStratamientos

EMS

ntosMStratamieFo aNaF ,1,

Error dentro

del

tratamiento

SSE N-a MSE

Total SST N-1

Donde:

ntoSStratamieSSTSS

SSntoSStratamieSST

N

y

n

yntoSStratamie

N

yySST

E

E

a

i i

i

a

i

n

j

ij

2

..

1

2

.

2

..

1 1

2

1.4 Modelo de Efectos Aleatorios

PROBLEMAS

1. Se ha hecho una experiencia para comparar tres métodos de enseñanza de la

programación de un ordenador digital de cierto tipo. Se tomaron muestras

aleatorias de tamaño 4 de cada uno de tres grupos de estudiantes adiestrados,

respectivamente, por el método A (enseñanza directa sobre máquina), por el

método B (enseñanza personal y alguna experiencia directa operando con el

ordenador) y por el método C (enseñanza personal, pero ningún trabajo sobre el

ordenador mismo) y los siguientes son los puntos obtenidos por estos

estudiantes en un test de aprovechamiento adecuado:

Método A: 76, 80, 70, 74

Método B: 95, 85, 91, 89

Método C: 77, 82, 81, 84

Valerse de las fórmulas abreviadas para calcular las sumas de cuadrados que se

necesitan, construir una tabla de análisis de la varianza y contrastar al nivel de

Page 4: Modelo Unifactorial -Teoria

significancia 05,0 si las diferencias entre las medias de las tres muestras son

significantes.

2. Unas muestras aleatorias de cinco marcas de llantas requieren las siguientes

distancias de frenado (en pies) a una velocidad de 30 millas por hora:

Marca A Marca B Marca C Marca D Marca E

26 28 28 27 30

25 28 25 32 24

29 31 28 31 29

24 33 27 30 25

Utilizar las fórmulas abreviadas para calcular las sumas de cuadrados necesarias,

construir una tabla de análisis de la varianza y contrastar al nivel de significancia

01,0 si las diferencias entre las medias de las cinco muestras se pueden atribuir al

azar.

3. He aquí lo devengado en ocho semanas consecutivas (en dólares) por tres

vendedores de aspiradoras a domicilio empleados por una empresa determinada:

Sr.Jones 153 192 169 176 212 185 178 200

Sr.Brown 176 182 173 187 199 188 169 184

Sr. North 165 201 177 195 189 173 182 198

Calcular con las fórmulas abreviadas las sumas de cuadrados que se necesitan, construir

una tabla de análisis de varianza y contrastar al nivel de significancia 05,0 si las

diferencias entre los promedios semanales devengados por estos vendedores son

significantes.

4. He aquí los puntajes obtenidos por 10 estudiantes, elegidos al azar entre cada

una de cuatro escuelas diferentes, en un test concebido para medir su

conocimiento de sucesos de actualidad:

Escuela1 75 88 62 97 62 81 93 76 53 99

Escuela2 80 82 64 45 67 84 55 39 60 57

Escuela3 64 90 58 64 82 71 59 66 87 63

Escuela4 94 69 85 57 93 88 69 78 56 78

Con las fórmulas abreviadas, calcular las sumas de cuadrados que se necesitan, construir

una tabla de análisis de la varianza y contrastar al nivel de significancia 05,0 para

ver si las diferencias entre los puntajes promedios obtenidos por los estudiantes de las

cuatro escuelas son significantes.

5. Se está estudiando la resistencia a la tensión de cemento Portland. Cuatro

técnicas de mezclado pueden ser usadas económicamente. Se han recolectado

los siguientes datos:

Técnica de

mezclado

Resistencia a la tensión (lb/ plg2

Page 5: Modelo Unifactorial -Teoria

1 3129 3000 2865 2890

2 3200 3300 2975 3150

3 2800 2900 2985 3050

4 2600 2700 2600 2765

a). Pruebe la hipótesis de que las técnicas de mezclado afectan la resistencia del

cemento. Use 05,0 .

b). Use la prueba de intervalos múltiples de Duncan para comparar los pares de medias.

6. Una fábrica de textiles cuenta con un gran número de telares. Se supone que

cada uno tiene la misma producción de tela por minuto. Para investigar esta

suposición, cinco telares son escogidos al azar, y se mide la cantidad de tela

producida en cinco tiempos diferentes. Se obtienen los datos siguientes:

a). Explique por qué es éste un experimento de efectos aleatorios. ¿Tienen todos los

telares el mismo rendimiento?

b). Calcule la variabilidad de los telares.

Telar Producción (lb/min)

1 14,0 14,1 14,2 14,0 14,1

2 13,9 13,8 13,9 14,0 14,0

3 14,1 14,2 14,1 14,0 13,9

4 13,6 13,8 14,0 13,9 13,7

5 13,8 13,6 13,9 13,8 14,0

c). Estime la varianza del error experimental.

d). Determine un intervalo de confianza de 95% para 22

2

t

t .

7. Se ha realizado un experimento para determinar si cuatro temperaturas

específicas de horneado afectan la densidad de un cierto tipo de ladrillo. El

experimento proporcionó los siguientes datos:

Temperatura Densidad

100 21,8 21,9 21,7 21,6 21,7

125 21,7 21,4 21,5 21,4

150 21,9 21,8 21,8 21,6 21,5

175 21,9 21,7 21,8 21,4

a). ¿Afecta la temperatura de horneado la densidad del ladrillo?

b). Compare los valores medios usando la prueba de intervalos múltiples de Duncan.

c). Utilice el método gráfico para determinar cuáles medias difieren. ¿Concuerdan las

conclusiones a que se llega con este método con las de la prueba de intervalos múltiples

de Duncan de la parte (b) de esta pregunta?

Page 6: Modelo Unifactorial -Teoria

8. Un fabricante de equipos de televisión está interesado en el efecto que tienen

sobre los cinescopios de televisores a color, cuatro diferentes tipos de

recubrimiento. Se obtuvieron los siguientes datos de conductividad:

Tipo de

recubrimiento

Conductividad

1 143 141 150 146

2 152 149 137 143

3 134 136 132 127

4 129 127 132 129

a). ¿Existe diferencia en la conductividad producida por los recubrimientos? Use

05,0 .

b). Estime la media general y los efectos de los tratamientos.

c). Calcule una estimación por intervalo de 95% de confiabilidad para la media del

recubrimiento tipo 4. Calcule una estimación por intervalo con 99% de confiabilidad

para la diferencia media entre los recubrimientos 1 y 4.

d) Pruebe todas las parejas de medias usando la prueba de intervalos múltiples de

Duncan, con 05,0 .

e). Suponiendo que actualmente se usa el recubrimiento 4, ¿qué recomendaría al

fabricante? Se desea minimizar la conductividad.