Post on 31-Aug-2019
Pruebas de hipótesis
Comparación de 2 muestras
Álvaro José Flórez
1Escuela de Ingeniería Industrial y Estadística
Facultad de Ingenierías
Febrero - Junio 2012
Comparación de medias
La comparación de dos poblaciones o de dos tratamientos es unasituación común en la estadística aplicada.
• Se toman muestras aleatorias de dos poblaciones diferentes.
• Se divide un conjunto de individuos al azar y se exponen a dostratamientos diferentes.
El objetivo es la comparación de las respuestas de los dostratamientos o la comparación de las características de dospoblaciones.
Comparación de medias
El maíz común no tiene la cantidad de lisina que necesitan losanimales en su pienso. Unos cientí�cos han desarrollado ciertasvariedades de maíz que contienen una mayor cantidad de lisina. Enuna prueba sobre la calidad del maíz con alto contenido de lisinadestinado al pienso animal, un grupo experimental de 20 pollos deun día de edad empezó a recibir una ración que contenía el nuevomaíz. Un grupo control de otros 20 pollos recibió una ración que eraidéntica a la anterior, con la excepción de que contenía maíz normal.Luego de 21 días se obtuvo la ganancia de peso (en gramos) de lospollos.
Comparación de medias
Para realizar una prueba de diferencias de medias se debe cumplirque:
• Dos muestras aleatorias de dos poblaciones distintas.
• Las muestras son independientes (una muestra no tieneninguna in�uencia sobre la otra)
• Las dos poblaciones tienen distribuciones normales
Prueba de hipótesis para comparación de
medias
Sea x1, x2, . . . , xnx y y1, y2, . . . , yny dos muestras aleatoriasindependientes, no necesariamente del mismo tamaño, de dospoblaciones normales con medias µx y µy respectivamente. Si setiene que H0 : µx − µy = D
Si se conocen las varianzas (σ2x y σ2
y) entonces
z =(x− y)−D√σx/nx + σy/ny
∼ N(0, 1)
Prueba de hipótesis para comparación de
medias
Sea x1, x2, . . . , xnx y y1, y2, . . . , yny dos muestras aleatoriasindependientes, no necesariamente del mismo tamaño, de dospoblaciones normales con medias µx y µy respectivamente. Si setiene que H0 : µx − µy = D
Si se conocen desconocen las varianzas pero se consideran iguales (σ2x =
σ2y) entonces:
t =(x− y)−DSp√
1nx
+ 1ny
∼ t(nx + ny − 2)
Donde:
Sp =
√(nx − 1)S2
x + (ny − 1)S2y
nx + ny − 2
Prueba de hipótesis para comparación de
medias
Sea x1, x2, . . . , xnx y y1, y2, . . . , yny dos muestras aleatoriasindependientes, no necesariamente del mismo tamaño, de dospoblaciones normales con medias µx y µy respectivamente. Si setiene que H0 : µx − µy = D
Si se conocen desconocen las varianzas y se consideran diferentes (σ2x 6=
σ2y) entonces:
t =(x− y)−D√
S2x
nx+
S2y
ny
∼ t(v)
Donde:
v ≈
(S2x
nx+
S2y
ny
)2(S2
x/nx)2
nx−1 +(S2
y/ny)2
ny−1
Prueba de hipótesis para comparación de
mediasSi:
H0 : µx − µy = D µx − µy < D
Entonces se rechaza H0 si z < zα (varianzas conocidas), t < t(nx+ny−2,α)
(varianzas desconocidas pero iguales) o t < t(v,α) (varianzas desconocidas)
Si:H0 : µx − µy = D µx − µy > D
Entonces se rechaza H0 si z > z1−α (varianzas conocidas), t >t(nx+ny−2,1−α) (varianzas desconocidas pero iguales) o t > t(v,1−α)(varianzas desconocidas)
Si:H0 : µx − µy = D µx − µy 6= D
Entonces se rechaza H0 si |z| > z1−α/2 (varianzas conocidas), |t| >t(nx+ny−2,1−α/2) (varianzas desconocidas pero iguales) o |t| > t(v,1−α/2)(varianzas desconocidas)
Ejemplo
Un grupo experimental de 20 pollos de un día de edad empezó arecibir una ración que contenía el nuevo maíz. Un grupo control deotros 20 pollos recibió una ración que era idéntica a la anterior, con laexcepción de que contenía maíz normal. Luego de 21 días se obtuvola ganancia de peso (en gramos) de los pollosPara el Grupo Control:
x = 366,95 y S2x = 2488,24
Para el Grupo Experimental:
y = 402,95 y S2y = 1825,734
¾Hay evidencia su�ciente para determinar que con el nuevo
maíz se obtienen mejores resultados?
Ejemplo
Se quiere comparar dos institutos de capacitación en término decali�cación obtenida por sus respectivos alumnos. Se tomó unamuestra aleatoria alumnos para cada instituto y se observó que lascali�caciones (sobre 100 puntos) para 15 alumnos del centro A tienenun promedio de 81.06 y una desviación estándar de 8.27, mientrasque en la muestra de la institución B se encontró que en una muestraaleatoria de 13 estudiantes el promedio fue de 75.23 y la desviaciónestándar de 8.55.
En particular se está interesado en determinar si hay diferencias enlas cali�caciones de ambos institutos, ¾La muestras encontradas danevidencia para determinar que las medias son diferentes?
Generalidades en caso de comparación
La recogida de datos debe hacerse de forma que el único factor quein�uya de forma distinta en ambas muestras sea aquel cuyo efectose desea estudiar.
X Asegurarse de que todos los factores que puedan tener algunain�uencia en la respuesta, in�uya exactamente igual en las dosmuestras (excepto aquel cuyo efecto se desea estudiar)
X Aleatorizar todo lo que se pueda para protegerse de posiblessesgos introducidos por factores no identi�cados
También deben cumplirse los supuesto de normalidad de las dospoblaciones, poblaciones independientes y que las muestras seanaleatorias (representativas)
Prueba de hipótesis para comparación de
varianzas
Sea x1, x2, . . . , xnx y y1, y2, . . . , yny dos muestras aleatoriasindependientes, no necesariamente del mismo tamaño, de dospoblaciones normales con medias µx y µy, y varianzas σ2x y µyrespectivamente.
Si se tiene que H0 : σ2x/σ2y = D
F = DS2x/S
2y ∼ F(nx−1,ny−1)
Prueba de hipótesis para comparación de
varianzas
Si:H0 : σ2
x/σ2y = D H1 : σ2
x/σ2y < D
Entonces se rechaza H0 si F < F(nx−1,ny−1,α)
Si:H0 : σ2
x/σ2y = D H1 : σ2
x/σ2y > D
Entonces se rechaza H0 si F > F(nx−1,ny−1,1−α)
Si:H0 : σ2
x/σ2y = D H1 : σ2
x/σ2y 6= D
Entonces se rechaza H0 si F < F(nx−1,ny−1,α/2) o F >F(nx−1,ny−1,1−α/2)
Ejemplo
Una compañia utiliza dos máquinas (A y B) para producir cojinetespara ensambles de volantes para vehículos. Para la compañiaes primordial que el diámetro de estos cojinetes no varíe enforma signi�cativa de las especi�caciones en más de 0.3 pulgadas.El encargado de la producción cree que una de las máquinasestá produciendo cojinetes que presentan mayor dispersión que laespeci�cada y decide hacer una pruebas para comparar las dosmáquinas.
Elije una muestra aleatoria de 25 cojinetes del lote de producción de lamáquina A y 23 de la máquina B y observa que la desviación estándarde la máquina A es de 0.002 pulgadas y de B una desviación de 0.0015pulgadas. Realice una prueba de hipótesis para determinar si haydiferencias signi�cativas en los diámetros de los cojinetes producidospor las dos máquinas.
Comparación de proporciones
Si se tienen dos muestras aleatorias independientes de tamaño n1 yn2 de dos poblaciones, y se observa la proporción de observacionesque pertenecen a una clase de interés (p1 = X1/n1 y p2 =X2/n2) respectivamente. Suponiendo que las proporciones tienenuna distribución aproximadamente normal.
Si se tiene que H0 : p1 = p2
Z =(p1 − p2)√
p(1− p)(
1n1
+ 1n2
) ∼ N(0, 1)
Donde p = X1+X2n1+n2
Prueba de hipótesis para comparación de
proporciones
Si:H0 : p1 = p2 H1 : p1 < p2
Entonces se rechaza H0 si Z < Zα
Si:H0 : p1 = p2 H1 : p1 > p2
Entonces se rechaza H0 si Z > Z1−α
Si:H0 : p1 = p2 H1 : p1 6= p2
Entonces se rechaza H0 si |Z| > Z1−α/2
Prueba de hipótesis para comparación de
proporciones
Un artículo del New York Times en 1987 reportó que se puede reducirel riesgo de sufrir ataques al corazón ingiriendo aspirina. Para llegar aesta conclusión el cronista se basó en los resultados de un experimentodiseñado, en donde participaron dos grupos de personas. A un grupo de11.034 personas se le suministró una dosis diaria de una pastilla que nocontenía ninguna droga (placebo), y de estos 189 sufrieron posteriormenteataques al corazón, mientras que al otro grupo de 11037 se les suministrouna aspirina, y sólo 104 lo sufrieron.
Usando una prueba de hipótesis y un nivel de signi�cancia del 1%,¾considera que el cronista del New York Times estaba en lo correcto?
Ejemplo
Se dice que escuchar a Mozart mejora los resultados de las pruebas realizadas porestudiantes. Es posible que los buenos olores tengan el mismo efecto. Para probaresta idea, 21 sujetos tuvieron que pasar una prueba que consistía en marcar conun lápiz la trayectoria a seguir para salir de un laberinto mientras llevaban puestauna mascarilla. Las mascarilla era inodora o bien contenía una esencia �oral. Lavariable respuesta es le tiempo medio en tres ensayos. Cada sujeto tenía quepasar la prueba con cada una de las mascarillas 1
Sujeto Sin esencia Con esencia
1 30.6 37.972 48.43 51.57...
......
20 47.37 53.6321 53.67 47
11A. R. Hirsch, L.H. Johnston, Odors and learning (1996)
Ejemplo
Se dice que escuchar a Mozart mejora los resultados de las pruebas realizadas porestudiantes. Es posible que los buenos olores tengan el mismo efecto. Para probaresta idea, 21 sujetos tuvieron que pasar una prueba que consistía en marcar conun lápiz la trayectoria a seguir para salir de un laberinto mientras llevaban puestauna mascarilla. Las mascarilla era inodora o bien contenía una esencia �oral. Lavariable respuesta es le tiempo medio en tres ensayos. Cada sujeto tenía quepasar la prueba con cada una de las mascarillas 1
Sujeto Sin esencia Con esencia
1 30.6 37.972 48.43 51.57...
......
20 47.37 53.6321 53.67 47
¾Las muestras son
independientes?
11A. R. Hirsch, L.H. Johnston, Odors and learning (1996)
Prueba t para diseños por pares
Un diseño experimental bastante frecuente utiliza los procedimientos t deuna muestra para comparar dos tratamientos. En un diseño por pares,un mismo sujeto recibe ambos tratamientos (por ejemplo, antes (X1)y después(X2)).Para comparar las respuesta de dos tratamientos en undiseño por pares, aplica los procedimientos t de una muestra a lasdiferencias observadas (D = X1 −X2).
Se desea valorar si el perfume �oral mejora los resultados de formasigni�cativa.
H0 : µD = 0 µD > 0
A partir de los resultados se observó que:
D = 0,9567 SD = 12,5479 n = 21
Prueba t para diseños por pares
Un diseño experimental bastante frecuente utiliza los procedimientos t deuna muestra para comparar dos tratamientos. En un diseño por pares,un mismo sujeto recibe ambos tratamientos (por ejemplo, antes (X1)y después(X2)).Para comparar las respuesta de dos tratamientos en undiseño por pares, aplica los procedimientos t de una muestra a lasdiferencias observadas (D = X1 −X2).
Se desea valorar si el perfume �oral mejora los resultados de formasigni�cativa.
H0 : µD = 0 µD > 0
A partir de los resultados se observó que:
D = 0,9567 SD = 12,5479 n = 21
Prueba t para diseños por pares
Un diseño experimental bastante frecuente utiliza los procedimientos t deuna muestra para comparar dos tratamientos. En un diseño por pares,un mismo sujeto recibe ambos tratamientos (por ejemplo, antes (X1)y después(X2)).Para comparar las respuesta de dos tratamientos en undiseño por pares, aplica los procedimientos t de una muestra a lasdiferencias observadas (D = X1 −X2).
Se desea valorar si el perfume �oral mejora los resultados de formasigni�cativa.
H0 : µD = 0 µD > 0
A partir de los resultados se observó que:
D = 0,9567 SD = 12,5479 n = 21
Otros tipos de pruebas de hipótesis
Si se quiere hacer una comparación de la media de más de 2 muestrasindependientes se puede hacer uso de una prueba de análisis de varianza
(prueba basada en la distribución F), donde se prueban las siguienteshipótesis.
H0 : µ1 = µ2 = . . . = µk H1 : Por lo menos dos medias diferentes
Si se quiere determinar si un conjunto de datos se puede ajustar a unadistribución de probabilidad determinada se puede hacer uso de una prueba
de bondad de ajuste. Por ejemplo si se quiere probar normalidad, lashipótesis serían:
H0 : X = Normal(µ, σ2) H1 : X 6= Normal(µ, σ2)
Algunas de estas pruebas son: Kolmogorov-Smirnov, Anderson-Darling oShapiro-Wilk (Normalidad).
Bibliografía
Devore, J. L. (2008). Probabilidad y estadística para ingeniería y
ciencias. Thomson Paraninfo, México, vol. 7 edition.
Montgomery, D. and Runger, G. (2004). Probabilidad y estadística
aplicadas la ingeniería. Limusa-Wiley, México, 2 edition.
Moore, D. S. (2005). Estadística aplicada básica. Antoni BoschEditor, Barcelona, España, vol. 2 edition.