Prueba de hipótesis para la diferencia de medias · Pruebas de hipótesis Hipótesis nula...

27
Estadística Técnica Prueba de hipótesis para la diferencia de medias Cladera Ojeda, Fernando

Transcript of Prueba de hipótesis para la diferencia de medias · Pruebas de hipótesis Hipótesis nula...

Page 1: Prueba de hipótesis para la diferencia de medias · Pruebas de hipótesis Hipótesis nula Hipótesis alternativa Regiones – Valor crítico De rechazo De aceptación Errores Tipo

Estadística Técnica

Prueba de hipótesis para la diferencia de medias

Cladera Ojeda, Fernando

Page 2: Prueba de hipótesis para la diferencia de medias · Pruebas de hipótesis Hipótesis nula Hipótesis alternativa Regiones – Valor crítico De rechazo De aceptación Errores Tipo

Conceptos previos

Inferencia estadística Población Muestra Parámetro Estadístico Hipótesis estadística

Page 3: Prueba de hipótesis para la diferencia de medias · Pruebas de hipótesis Hipótesis nula Hipótesis alternativa Regiones – Valor crítico De rechazo De aceptación Errores Tipo

Pruebas de hipótesis

Hipótesis nula Hipótesis alternativa Regiones – Valor crítico

De rechazo De aceptación

Errores Tipo I – Nivel de significancia Tipo II - Potencia

Page 4: Prueba de hipótesis para la diferencia de medias · Pruebas de hipótesis Hipótesis nula Hipótesis alternativa Regiones – Valor crítico De rechazo De aceptación Errores Tipo

Diferencia de medias

Hipótesis nula

Hipótesis alternativa

1−2=01−2=d0

1−201−2d0

1−2≠0

Page 5: Prueba de hipótesis para la diferencia de medias · Pruebas de hipótesis Hipótesis nula Hipótesis alternativa Regiones – Valor crítico De rechazo De aceptación Errores Tipo

Poblaciones y muestras

Tenemos ahora, dos poblaciones:Población 1 Población 2

Muestra 1 Muestra 2

1 2

12 1

2

x1 x2

s12 s2

2

n1 n2

Page 6: Prueba de hipótesis para la diferencia de medias · Pruebas de hipótesis Hipótesis nula Hipótesis alternativa Regiones – Valor crítico De rechazo De aceptación Errores Tipo

Posibilidades...

Varianzas poblacionales conocidas Varianzas poblacionales desconocidas

Se suponen iguales Se suponen diferentes

12=2

2

12≠2

2

Page 7: Prueba de hipótesis para la diferencia de medias · Pruebas de hipótesis Hipótesis nula Hipótesis alternativa Regiones – Valor crítico De rechazo De aceptación Errores Tipo

Varianzas conocidas - TLC

Si X es la media de una muestra aleatoria de tamaño n tomada de una población con media varianza finita , entonces, la forma límite de la distribución

Si es la disttribución normal estándar n(z;0;1).

Z=X−

−n

n∞

2

Page 8: Prueba de hipótesis para la diferencia de medias · Pruebas de hipótesis Hipótesis nula Hipótesis alternativa Regiones – Valor crítico De rechazo De aceptación Errores Tipo

Por propiedad reproductiva, y aplicando TLC.

Ya que son independientes:

X1 – X2 ~ Normal ( , )

Media

VarianzaX 1−X2

2 =X1

2 X2

2 =1

2

n1

2

2

n2

X1−X 2=X1

−X 2=1−2

X1−X 2X 1−X2

Page 9: Prueba de hipótesis para la diferencia de medias · Pruebas de hipótesis Hipótesis nula Hipótesis alternativa Regiones – Valor crítico De rechazo De aceptación Errores Tipo

Aplicando TLC, tenemos

Entonces, evaluaremos nuestra hipótesis en función de z y , obtenida mediante la tabla de la distribución normal.

Z=X 1−X2−X1

−X 2

12

n1

2

2

n2

Z=X 1−X2−d0

12

n1

2

2

n2

z

Page 10: Prueba de hipótesis para la diferencia de medias · Pruebas de hipótesis Hipótesis nula Hipótesis alternativa Regiones – Valor crítico De rechazo De aceptación Errores Tipo

Varianzas desconocidas e iguales

Z=X 1−X2−1−2

2 [ 1n1

1n2 ]

n1−1S12

2

n2−1S22

2

v. a. con

X2

=n−1

Page 11: Prueba de hipótesis para la diferencia de medias · Pruebas de hipótesis Hipótesis nula Hipótesis alternativa Regiones – Valor crítico De rechazo De aceptación Errores Tipo

T=Z

Vv

T=X1−X 2−1−2

S p 1n1

1n2

S p2=

n1−1S12n2−1S2

2

n1n2−2

Usamos la distribución t-student, con n1+n2-2 gl. A partir de ella, encontramos y comparamos con el valor calculado.

t ,

Page 12: Prueba de hipótesis para la diferencia de medias · Pruebas de hipótesis Hipótesis nula Hipótesis alternativa Regiones – Valor crítico De rechazo De aceptación Errores Tipo

Varianzas desconocidas diferentes

T=X1−X 2−1−2

S12

n1

S2

2

n2

= s1

2/n1s22 /n2

2

[s12/n1

2/n1−1 ] [s2

2/n2

2/n2−1 ]

¿

Usamos la distribución t-student, v gl. A partir de ella, encontramos y comparamos nuevamente.

t ,

Page 13: Prueba de hipótesis para la diferencia de medias · Pruebas de hipótesis Hipótesis nula Hipótesis alternativa Regiones – Valor crítico De rechazo De aceptación Errores Tipo

P 6.23 – Apuntes de la Cátedra

Un diseñador de productos está interesado en reducir el tiempo de secado de una pintura. Se prueban dos fórmulas de pintura; la fórmula 1 tiene el contenido químico estándar y la fórmula 2 tiene un nuevo ingrediente secante que tiende a reducir el tiempo de secado. De la experiencia se sabe que la desviación estándar del tiempo de secado es ocho minutos y esta variabilidad inherente no debe verse afectada por a adición del nuevo ingrediente.Se pintan 35 placas con la fórmula 1 y otras 35 con la fórmula 2. Los dos tiempos promedio de secado muestrales son 116 minutos para la fórmula 1 y 112 minutos para la fórmula 2. ¿A qué conclusión puede llegar el diseñador del producto sobre la eficacia delnuevo ingrediente, al nivel de significancia 0,01?

Page 14: Prueba de hipótesis para la diferencia de medias · Pruebas de hipótesis Hipótesis nula Hipótesis alternativa Regiones – Valor crítico De rechazo De aceptación Errores Tipo

X1 : tiempo de secado de la fórmula 1 X1 ~ Desc( ) X2: tiempo de secado de la fórmula 2 X2 ~ Desc( ) X1 – X2 ~ N( ) x1 = 116 minutos x2 = 112 minutos n1 = n2 = 35 = 0,01

1 ,1=8

2 ,1=8

1−2 ,12 /n12

2/n2

h0 :1−2=0h1 :1−20

Page 15: Prueba de hipótesis para la diferencia de medias · Pruebas de hipótesis Hipótesis nula Hipótesis alternativa Regiones – Valor crítico De rechazo De aceptación Errores Tipo
Page 16: Prueba de hipótesis para la diferencia de medias · Pruebas de hipótesis Hipótesis nula Hipótesis alternativa Regiones – Valor crítico De rechazo De aceptación Errores Tipo

Por tabla, observamos que Zc = 2,33

Decidimos entonces aceptar la hipótesis nula. No hay evidencia suficiente como para demostrar que el tiempo de secado disminuye significativamente.

Podemos calcular el valor P, por tabla normal.

Z0=x1−x2

12

n1

2

2

n2

⇒Z 0=116−112

8 135

1

35

=2,09

Page 17: Prueba de hipótesis para la diferencia de medias · Pruebas de hipótesis Hipótesis nula Hipótesis alternativa Regiones – Valor crítico De rechazo De aceptación Errores Tipo
Page 18: Prueba de hipótesis para la diferencia de medias · Pruebas de hipótesis Hipótesis nula Hipótesis alternativa Regiones – Valor crítico De rechazo De aceptación Errores Tipo

La verdadera probabilidad de cometer error de tipo 1 es de 0,01831. Es decir, mayor que la aceptable.

Esto valida nuestra conclusión, de que para este nivel de significancia los tiempos de secado no son significativamente diferentes.

Page 19: Prueba de hipótesis para la diferencia de medias · Pruebas de hipótesis Hipótesis nula Hipótesis alternativa Regiones – Valor crítico De rechazo De aceptación Errores Tipo

P 10 . 24 - Walpole

Cinco muestras de una sustancia ferrosa se usan para determinar si hay una diferencia entre un análisis químico de laboratorio y un análisis de fluorescencia de rayos X del contenido de hierro. Cada muestra se divide en dos submuestras y se aplican los dos tipos de análisis. A continuación, se presentan los datos codificados que muestran los análisis de contenido de hiero:

Suponga que las poblaciones son normales, pruebe con un nivel de significancia de 0,05 si los dos métodos de análisis dan, en promedio, el mismo resultado.

Analysis 1 2 3 4 5X-ray 2.0 2.0 2.3 2.1 2.4

Chemical 2.2 1.9 2.5 2.3 2.4

Page 20: Prueba de hipótesis para la diferencia de medias · Pruebas de hipótesis Hipótesis nula Hipótesis alternativa Regiones – Valor crítico De rechazo De aceptación Errores Tipo

X1 : Contenido de Fe en muestra analizada con Rx X2: Contenido de Fe en muestra de análisis

químico X1 ~ N( ) X2 ~ N( ) x1 = 2,16 s1 = 0,18165 x2 = 2,26 s2 = 0,23021 n1 = n2 = 5

= 0,05

1 ,1

2 ,2

h0 :2−1=0h1 :2−1≠0

Page 21: Prueba de hipótesis para la diferencia de medias · Pruebas de hipótesis Hipótesis nula Hipótesis alternativa Regiones – Valor crítico De rechazo De aceptación Errores Tipo
Page 22: Prueba de hipótesis para la diferencia de medias · Pruebas de hipótesis Hipótesis nula Hipótesis alternativa Regiones – Valor crítico De rechazo De aceptación Errores Tipo

Si las varianzas son iguales

T o=x2−x1

S p 1n1

1n2

=0,1

0,02072/5=0,7624

S p2=

n1−1 s12n2−1 s2

2

n1n2−2=

4.0,0330,0538

=0,043

Ya que T0 < T = 2,306 se opta por no rechazar la hipótesis nula. No hay evidencia significativa de que el contenido promedio de Fe es mayor en un método que en otro.

Page 23: Prueba de hipótesis para la diferencia de medias · Pruebas de hipótesis Hipótesis nula Hipótesis alternativa Regiones – Valor crítico De rechazo De aceptación Errores Tipo

Si las varianzas son diferentes

T=X2−X 1

S12

n1

S2

2

n2

=0,10

0,01311=0,7624

= s1

2/n1s22 /n2

2

[s12/n1

2/n1−1 ] [s2

2/n2

2/n2−1 ]

≈8

Page 24: Prueba de hipótesis para la diferencia de medias · Pruebas de hipótesis Hipótesis nula Hipótesis alternativa Regiones – Valor crítico De rechazo De aceptación Errores Tipo
Page 25: Prueba de hipótesis para la diferencia de medias · Pruebas de hipótesis Hipótesis nula Hipótesis alternativa Regiones – Valor crítico De rechazo De aceptación Errores Tipo

Nuevamente, concluímos no rechazar la hipótesis nula.

Pueden tomarse ambos métodos de análisis indistintamente.

Page 26: Prueba de hipótesis para la diferencia de medias · Pruebas de hipótesis Hipótesis nula Hipótesis alternativa Regiones – Valor crítico De rechazo De aceptación Errores Tipo
Page 27: Prueba de hipótesis para la diferencia de medias · Pruebas de hipótesis Hipótesis nula Hipótesis alternativa Regiones – Valor crítico De rechazo De aceptación Errores Tipo

Bibliografía

Walpole, Myers y Myers (1999). Probabilidad y Estadística para Ingenieros. Sexta edición. Ed. Prentice Hall. México.

Apuntes de la cátedra Estadística Técnica (2009). Facultad de Ingeniería. Universidad Nacional de Cuyo.