Post on 06-Jul-2018
8/18/2019 Unidad IV. Pruebas de Hipótesis
1/22
Prof. Felipe R. Tuz Poot 91
UNIDAD IV. PRUEBAS DE HIPÓTESIS
CONCEPTOS BÁSICOS DE PRUEBAS DE HIPÓTESIS
La inferencia estadística está relacionada con los métodos para obtener conclusiones o
generalizaciones acerca de una población. Estas conclusiones acerca de la población pueden estarrelacionadas con la forma de la distribución de una variable aleatoria, ó con los valores de uno ovarios parámetros de la misma.
El campo de la inferencia estadística se divide en dos:
a) Por un lado, el interés de la estimación de los parámetros de una distribución y,b)
Las pruebas de hipótesis.
En el caso de la estimación, se trata de elegir el valor de un parámetro de la población, mientras que
en las pruebas de hipótesis se trata de decidir entre aceptar o rechazar si un valor especificado del
parámetro corresponde a la población (por ejemplo, si el tiempo de vida de un artículo es un valor
o no lo es).
En el campo de las pruebas de hipótesis se pueden considerar dos áreas:
a) Pruebas de hipótesis respecto a los parámetros, para determinar si un parámetro de unadistribución toma o no un determinado valor, o si puede tomar un conjunto de valores y,
b) Pruebas de Bondad de Ajuste, para definir o establecer si un conjunto de datos se puede
modelar mediante una determinada distribución.
En las secciones siguientes solamente se aborda, el primer inciso, es decir, las pruebas de hipótesis.
Una hipótesis estadística es una proposición o conjetura que se hace de la población o poblacionesrespecto a sus respectivos parámetros. Por ejemplo, si con base en una muestra aleatoria se tiene
que decidir si un proceso está produciendo una determinada media, digamos µ 100, o si hay quedecidir si una determinada droga sirve a un grupo específico de pacientes, lo anterior, puedetraducirse en un lenguaje de “Pruebas de Hipótesis”, y utilizar metodologías estadísticas para tomaruna decisión al respecto.
Estadísticamente una prueba de hipótesis es una afirmación o conjetura de una o más poblaciones.
Nunca se sabe con absoluta certeza la verdad o falsedad de una hipótesis estadística, a no ser que se
examine la población entera. Esto último, por supuesto sería impráctico en la mayoría de las
situaciones, es por esto que en lugar de la población, se toma una muestra aleatoria representativa
de la población de interés y se utilizan los datos de tal muestra para proporcionar evidencia que
confirme o no la hipótesis planteada.
Una prueba de hipótesis consiste en contrastar dos hipótesis estadísticas. Tal contraste involucra latoma de decisión acerca de las hipótesis. La decisión consiste en rechazar o no una hipótesis en favorde la otra. En el proceso de una prueba de hipótesis para una toma de decisión estadística se
involucran dos tipos de hipótesis: Hipótesis nula e hipótesis alternativa , éstas se abordan con más
detalle a continuación.
Hipótesis Nula y Alternativa
La hipótesis nula denotada por es una declaración afirmando ningún cambio o ningún efecto en elestado de la naturaleza. se considera cierta, o sin cambio alguno salvo que los datos proporcionenevidencia convincente de que es falsa. Comúnmente es planteada con el objetivo de ser rechazada, ya
que se pretende probar que los datos dan evidencia de algún cambio.
8/18/2019 Unidad IV. Pruebas de Hipótesis
2/22
Prof. Felipe R. Tuz Poot 92
La hipótesis alternativa es una declaración que contradice y es denotada por o bien . Esaceptada sólo si los datos proporcionan evidencia convincente de su verdad. Comúnmente es
planteada como la hipótesis del investigador, la cual es la que se pretende aceptar rechazando .Ejemplo Supóngase que se sospecha que los niños tienen un CI más alto si comen alimentos con aceite de
pescado durante seis meses.
La hipótesis alternativa :“Los niños que comen alimentos con aceite de pescado por seis meses tienen un CI mayor que los
niños que no lo hacen.
La hipótesis nula :“Los niños que comen alimentos con aceite de pescado durante seis meses no muestran un mayor CI
que los niños que no lo hacen”
En un experimento se consideran dos grupos: un grupo de control al que no se le proporciona
alimentos con aceite de pescado y otro grupo al que sí se le proporciona. A ambos grupos se les mideel CI al inicio del experimento y después de los seis meses del experimento.
De las pruebas del coeficiente intelectual del grupo de control, se encuentra un CI medio de 100 antes
del experimento y 100 después, esto es, no hay aumento.
Los niños alimentados con aceite de pescado muestran un aumento de 100 a 106. Esto parece ser un
aumento, pero aquí es donde la estadística entra en el proceso de comprobación de hipótesis. Es
necesario comprobar si el aumento es significativo como para afirmarlo a nivel poblacional.
Usando una prueba adecuada, el investigador puede comparar las dos medias finales de los dosgrupos (100 y 106), teniendo en cuenta el aumento, el número de datos en las muestras y laasignación al azar relativa de los grupos. El resultado permitirá determinar si existe evidencia
suficiente para apoyar si la conjetura hecha por el investigador es afirmativa.
Es importante tener en cuenta que, no rechazar la hipótesis nula no es lo mismo que aceptarla. Essólo que este experimento en particular no puso de manifiesto que el consumo de alimento con aceite
de pescado no afecta al coeficiente intelectual. Este principio se encuentra en la esencia de la pruebade hipótesis.
Errores de tipo I y tipo II
Al utilizar un proceso de prueba de hipótesis para tomar decisiones sobre el parámetro poblacional,
existe el riesgo de llegar a una conclusión equivocada, eso es, al aplicar la metodología de prueba dehipótesis, puede cometerse uno de dos tipos de error: el error de tipo I y el error de tipo II.
Error tipo I: Se presenta cuando se rechaza la hipótesis nula siendo cierta y no debería rechazarse.
Nivel de significancia. Es la probabilidad de cometer un error tipo I, denotado por alfa, . Nivel de confianza: Es la probabilidad de la decisión correcta de aceptar la hipótesis nula cuando esverdadera, esta probabilidad se denota por 1 .Error tipo II: Este tipo de error se presenta cuando no se rechaza la hipótesis nula siendo falsa ydebería rechazarse.
8/18/2019 Unidad IV. Pruebas de Hipótesis
3/22
Prof. Felipe R. Tuz Poot 93
Característica de la prueba: Es la probabilidad de cometer un error de tipo II y se denota por . Potencia de la prueba o poder de la prueba. Es la probabilidad de la decisión correcta de rechazar la
hipótesis nula cuando es falsa, esta probabilidad es denotada por 1 .En la siguiente tabla se resumen las probabilidades según la toma de decisión en una prueba dehipótesis.
Estado de H0
Decisión es verdadera es falsa
Aceptar Decisión correcta1 a Nivel de confianza Error tipo II b característica de la pruebaRechazar Error tipo I
a Nivel de significancia Decisión correcta1 b potencia de la pruebaUna hipótesis es una afirmación sobre un parámetro poblacional, la cual será aceptada o rechazada
en base a la evidencia que proporciona la muestra. La hipótesis inicial que se define sobre la
población se llama hipótesis nula; pero si rechazamos esa hipótesis nula debemos tener una hipótesis
alternativa, la cual tomaremos como cierta si la hipótesis inicial o nula es falsa.
EjemploEn un juzgado se le acusa a una persona de un delito, desde el punto de vista legal la persona acusadase le considera inocente (hipótesis nula o inicial) hasta que se demuestre lo contrario. Si el juez con
todas las evidencias presentadas determina más allá de toda duda razonable que la persona esculpable; entonces rechaza la hipótesis nula y determina como verdadera una hipótesis alternativa
(¡culpable!).
Para que las reglas de decisión sean buenas, deben diseñarse de modo que minimicen los errores dedecisión, y no es una cuestión sencilla, porque para cualquier tamaño de la muestra, un intento de
disminuir un tipo de error (por ejemplo error tipo I) suele ir acompañado de un crecimiento del otro
tipo de error (error tipo II). En la práctica un tipo de error puede ser más grave que el otro, y debe
alcanzarse un compromiso que disminuya el error más grave, la única forma de disminuir ambos ala vez es aumentar el tamaño de la muestra, que no siempre es posible.
En general, en una prueba de hipótesis se trata de minimizar el error tipo I, es decir, “el error derechazar y aceptar la hipótesis alternativa”, por lo que hay que cuidar que la probabilidad deeste error sea lo más pequeña posible. Como se mencionó anteriormente, la hipótesis del
investigador se encuentra en la hipótesis alternativa, por lo que se tratará de buscar evidencia en la
P(Error tipo II) =
Bajo H0
P(Error tipo I) =
Bajo Ha
Valor crítico
8/18/2019 Unidad IV. Pruebas de Hipótesis
4/22
Prof. Felipe R. Tuz Poot 94
muestra para rechazar la hipótesis nula y aceptar la alternativa, esto trae como consecuencia que se
tenga probabilidad de cometer el error tipo I pero con la probabilidad más pequeña.
Las dos decisiones posibles que se pueden hacer nos llevan a una de las dos siguientes conclusiones:
1) La conclusión de que hay suficiente evidencia para apoyar la hipótesis alternativa (rechazar
la hipótesis nula a favor de la alternativa)
2) La conclusión de que no hay pruebas suficientes que apoyen la hipótesis alternativa (no
rechazar la hipótesis nula a favor de la alternativa)
Estadístico de Prueba: El estadístico de prueba es el que permite tomar la decisión en una pruebade hipótesis establecida por el investigador, ya que es una función de la muestra con la característica
de tener una distribución, misma que se utiliza para calcular probabilidades que permiten definir la
región de rechazo y la región de aceptación respecto a la hipótesis nula. Sin el conocimiento de dicha
distribución no sería posible definir dichas regiones, pues todo lo relacionado a inferencia estadísticaes basado en probabilidades de una distribución teórica de la población.
Región de aceptación y de rechazo
Región de aceptación: La región de aceptación es un subconjunto de valores del estadístico deprueba para los cuales la hipótesis nula no se rechaza.
Región de rechazo: Es el conjunto de valores fuera de la región de aceptación. Si el valor delestadístico de prueba se encuentra dentro de esta región, la hipótesis nula es rechazada. En talescasos, se dice que la hipótesis nula ha sido rechazada con un nivel de significación .Valor crítico: Es el valor o el punto límite que divide a la región de rechazo y la región de aceptación.
En un proceso de prueba de hipótesis, para tomar la decisión con respecto a la hipótesis nula (aceptar
o rechazar esta hipótesis) se debe determinar el valor crítico en la distribución de la estadística de
prueba. El valor crítico divide la región de rechazo de la región de aceptación.
Por ejemplo, supóngase que se plantea una hipótesis respecto al parámetro µ y además el estadísticode prueba adecuado para la prueba es, el cual tiene una distribución normal estándar.Considerando la probabilidad del error tipo I, es decir estableciendo α, se utiliza la distribución de
probabilidad del estadístico de prueba para establecer las regiones de rechazo y las de aceptación
respecto a la hipótesis nula.
Si lo que se desea probar es:
: µ µ contra la hipótesis alternativa : µ ≠ µ con un nivel de significancia α (es decir, permitir el error tipo I con la probabilidad establecida)entonces las regiones de rechazo se presenta en la siguiente figura con 0.05
8/18/2019 Unidad IV. Pruebas de Hipótesis
5/22
Prof. Felipe R. Tuz Poot 95
donde usando la distribución normal estándar son tales que: < /2 y > /2.
En el caso particular
0.05 se tiene que
1.96 1.96 Las áreas sombreadas en la figura, son las llamadas regiones críticas o zonas de rechazo de la hipótesis
nula, los valores y son denominados puntos críticos. Así que si al calcular el estadístico deprueba e, el valor de este se encuentra dentro de la región de rechazo, entonces se rechaza , encaso contrario, se dice que no hay suficiente evidencia para rechazarla. Ahora, si el valor de e
correspondiente a la muestra observada cae dentro de la zona de aceptación en la figura, el
investigador se inclinara a pensar que no reunió suficiente evidencia para poder rechazar la hipótesisnula a favor de la alternativa, aunque aquí también cabe la posibilidad de cometer un error en la
decisión, que será del tipo II.
En la práctica, los niveles de significancias más usuales son: 1%, 5% o bien el 10%.
Las pruebas de hipótesis pueden ser de una o de dos colas dependiendo del planteamiento que se
desee probar en la hipótesis alternativa. Si al establecer la hipótesis alternativa, ésta es de la forma: µ > µ, entonces se considera que se trata de una prueba de hipótesis de una cola a la derecha, osea, que la región de rechazo estará en el lado derecho de la distribución del estadístico de prueba y
se considera la prueba con nivel de significancia α; ahora, si se establece la hipótesis alternativa: µ < µ , entonces se trata de prueba de hipótesis de una cola a la izquierda y se especifica laprueba con nivel de significancia α; por último si el signo es de desigualdad en la hipótesis alterna osea, es : µ ≠ µ , se trata de una prueba de hipótesis de dos colas, una a la derecha y otra a laizquierda, como son dos las zonas de rechazo, se tendrá que dividir el nivel de significancia α entre
dos (éste el caso presentado en la figura anterior). Observe, en las siguientes gráficas se presentanlas regiones de rechazo que se dan en cada caso mencionado:
Prueba de hipótesis de una cola a la derecha (
: µ > µ)
95%
=0.025 =0.025
Región cr ítica o
zona de rechazo de
la hipótesis nula
Región crítica o
zona de rechazo de
la hipótesis nula
Zona de aceptación
de la hipótesis
nula
z
8/18/2019 Unidad IV. Pruebas de Hipótesis
6/22
Prof. Felipe R. Tuz Poot 96
Prueba de hipótesis de una cola a la izquierda (: µ < µ)
Prueba de hipótesis de dos colas (: µ ≠ µ)Los pasos para realizar una prueba de hipótesis son los siguientes:
1. Plantear la hipótesis nula
2. Plantear la hipótesis alternativa3. Especificar el nivel de significancia
4.
Considerar el tamaño de muestra
5. Establecer los valores críticos que definen las regiones de rechazo de las de no rechazo.
6. Determinar cuál debe ser la estadística de prueba a emplear7.
Coleccionar los datos de la muestra y calcular el valor muestral de la Estadística de prueba
apropiada8. Determinar si la estadística de prueba calculada corresponde a la región de rechazo o la
región de aceptación. Recuérdese que la ubicación de estas regiones son respecto al signo de
desigualdad ≠,>,
8/18/2019 Unidad IV. Pruebas de Hipótesis
7/22
Prof. Felipe R. Tuz Poot 97
estudio se desea comprobar estadísticamente si la media de combustión es 50 cm/s o no lo es, es
decir las hipótesis de interés son:
: µ 50 vs : µ ≠ 50 Supóngase que la región de no rechazo de es:
{̅: 48.5 ≤ ̅ ≤ 51.5} Suponiendo que la verdadera media es µ 52 , considerando 10 . El interés aquí es el dedeterminar la potencia de la prueba, para ello determínese la probabilidad del error tipo II es decir, . =Probabilidad (Aceptar cuando es falsa)
=Probabilidad (Aceptar cuando µ 52)=Probabilidad (48.5 ≤ ̅ ≤ 51.5 cuando µ 52) .−./√ ≤ ̅−./√ ≤ .−./√ 4.43 ≤ ≤ 0.63 0.63 ≤ ≤ 4.43 ≥ 0.63 ≥ 4.43
0.2643 0000 0.2643 Entonces la potencia de la prueba es: 1 1 0.2643 0.7357 cuando µ 52.La potencia de la prueba es una medida descriptiva y concisa de la sensibilidad de una estadística,
donde la sensibilidad se entiende como la habilidad de la prueba para detectar diferencias; en el caso
del ejemplo, la sensibilidad de la prueba para detectar la diferencia entre la rapidez de combustión
media de 50 cm/s y 52 es 0.7357, o sea, si la media verdadera es en realidad 52 cm/s, esta pruebarechazará : µ 50 y detectará esta diferencia en un 73.57% de las veces. Podría decirse tambiénque la prueba tiene la capacidad de rechazar
: µ 50 con un 73.57% de confianza cuando la
verdadera media es µ 52. Si este valor potencia, se considera muy bajo, el investigador podríaincrementar el tamaño de la muestra.
8/18/2019 Unidad IV. Pruebas de Hipótesis
8/22
Prof. Felipe R. Tuz Poot 98
PRUEBA DE HIPÓTESIS A PARTIR DE UNA MUESTRA
Prueba de hipótesis para la media
Se comenzará estudiando las pruebas de hipótesis para la media de una sola población sobre la quese desea hacer inferencia. Los estadísticos a utilizar son: el estadístico
y el estadístico
, ¿cuál se
empleará? Pues dependerá de si se conoce o desconoce y considerando ciertas características dela muestra y la población.Prueba de hipótesis para la media con conocidaLas hipótesis que pueden ser de interés al investigador respecto a la media son:
I
: : ≠ II : : > III : : <
donde
es una constante.
Para las hipótesis establecidas aquí, es importante considerar que la prueba sólo es válida bajo
cualquiera de las siguientes condiciones:
i) la muestra aleatoria es obtenida de una población con distribución normal o aproximadamente
normal
ii) Se desconoce la distribución poblacional correspondiente a la muestra, pero el tamaño de lamuestra n es grande, mayor o igual a 30.
Así, por la teoría de distribuciones muestrales, y considerando el error tipo I se tiene que el
estadístico de prueba adecuado es:
√ donde: es la media muestral con el tamaño de muestra es la media poblacional planteada en la hipótesis nula es la desviación estándar poblacional.El estadístico tiene una distribución normal estándar o aproximadamente normal, entonces, laregión de rechazo de con el nivel de significancia es:
a) Para las hipótesis planteadas en I la región de rechazo está dada por los valores que se
obtienen de z y que cumplen || > ⁄ b) Para las hipótesis planteadas en II la región de rechazo está dada por los valores que obtienende z que cumplan >
c) Para las hipótesis planteadas en III la región de rechazo está dada por los valores que se
obtienen de z que cumplan < EjemploUn ingeniero establece que en promedio las mediciones del diámetro del tubo de albañil es mayor
que 30. Para comprobar que lo que establece el ingeniero efectivamente es lo correcto se toma una
muestra aleatoria de 100 tubos del cual resulta una media de 32 cm y una varianza de 4. ¿Apoya la
muestra la aseveración del ingeniero? Responda con un 95% de confianza.
8/18/2019 Unidad IV. Pruebas de Hipótesis
9/22
Prof. Felipe R. Tuz Poot 99
Solución
La hipótesis que se desea probar es:
: 30 : > 30.Este ejemplo es el caso ii) planteado en esta sección pues es desconocida pero el tamaño demuestra
100 es grande.
Se estima la varianza poblacional a través de la varianza muestral 4. Así, el estadístico deprueba es
√ ≈ √
32 302√ 100 10
Y el valor crítico es z . 1.64 . Ya que calculada cumple que > . 1.64 entonces serechaza la hipótesis nula a favor de la hipótesis alternativa, esto es, se acepta la hipótesis que plantea
el ingeniero con un 95% de confianza.
Prueba de hipótesis para la media µ, con desconocida.Las hipótesis que pueden ser de interés al investigador respecto a la media son:
I
: : ≠ II : : > III : : <
donde es una constante.Para las hipótesis establecidas es importante que la muestra aleatoria obtenida esté bajo cualquiera
de las siguientes condiciones:
i) la muestra aleatoria es obtenida de una población con distribución normal o aproximadamentenormal
ii) Se desconoce la distribución poblacional correspondiente a la muestra, pero el tamaño de lamuestra n es grande, mayor o igual a 30.
Así, bajo cualquiera de estas condiciones que cumpla la muestra, se tiene por teoría de distribuciones
muestrales y considerando el error tipo I que, el estadístico de prueba adecuado para cualquiera delas hipótesis planteadas es:
√
el cual tiene una distribución con 1 grados de libertad y donde: es la media muestral con el tamaño de muestra es la media poblacional planteada en la hipótesis nula es la desviación estándar muestral.
Considerando la distribución (distribución con 1 grados de libertad), se puede determinar laregión de rechazo y la región de aceptación de con el nivel de significancia .
8/18/2019 Unidad IV. Pruebas de Hipótesis
10/22
Prof. Felipe R. Tuz Poot 100
a) Para las hipótesis del caso I, la región de rechazo es válida para cada valor que cumple:|| > ⁄ ,− b) Para las hipótesis del caso II, la región de rechazo es válida para cada valor t que cumple: >,− c) Para las hipótesis del caso III, la región de rechazo es válida para cada valor que cumple: < ,−
Notas1)
En el caso i) no importa el tamaño de muestra, siempre será válido utilizar el estadístico .2) En el caso ii) cuando el tamaño de muestra es grande, la distribución con 1 grados de
libertad se aproxima a la distribución normal estándar, por lo que podemos utilizar el
estadístico de prueba
√ con la desviación estándar poblacional estimada por la desviación estándar muestral .
3)
Cuando no se cumple ninguno de los casos i) y ii), es decir, se desconoce la distribución de la
que proviene la muestra y el tamaño de muestra es < 30 , no es posible utilizar losestadísticos y para resolver la prueba de hipótesis respecto a la media. En esta situaciónse emplea metodología estadística no paramétrica, que en este curso no será abordada.
Ejemplo En una fábrica de materiales se fabrican unas varillas con una resistencia de 4500 kg/cm 2. Un
ingeniero sospecha que cierta maquinaria tiene fallas en la fabricación y asegura que la máquina está
fabricando varillas con resistencia diferente a 4500 kg/cm2, por lo propone un ajuste a dichamaquinara. Con la finalidad de mostrar que la máquina está fallando, un día al azar se toma una
muestra aleatoria de 10 varillas de la producción, al probarlas a la tensión hasta la ruptura se obtieneuna resistencia media de 4200 kg./cm2, con una desviación estándar de 200 kg. /cm2. Compruebe
con un nivel de significancia de 0.05 si la máquina realmente necesita un ajuste. Considere que la
variable poblacional resistencia tiene distribución normal.
SoluciónLa muestra proviene de una población con distribución normal, se desconoce la desviación estándar
poblacional , y además el tamaño de muestra es pequeño, por lo que se usará la distribución destudent para estimar el promedio poblacional, (si el tamaño de muestra fuese grande podría usarses como estimación para y usar el estadístico de prueba , como se indica en la sección anterior).La hipótesis a probar es:
: 4500 : ≠ 4500.El estadístico de prueba es:
√ 4200 4500200 √ 10
30063.246 4.74 El valor crítico es ,− ., 2.262.La región de rechazo está dada por || > /,−. Entonces el valor del estadístico cae en la regiónde rechazo, por tanto se rechaza la hipótesis nula y se concluye que los datos favorecen la hipótesisplanteada por el ingeniero, por lo que se sugiere que la maquinaria entre a revisión con un 95% de
confianza.
8/18/2019 Unidad IV. Pruebas de Hipótesis
11/22
Prof. Felipe R. Tuz Poot 101
Prueba de hipótesis para la proporción
Prueba de hipótesis para la proporción poblacional , en muestras grandes ≥ .Como se ha mencionado en la sección de intervalos de confianza, la proporción observada de éxitos
en la muestra,
̂
, es un estimador de la proporción poblacional
, que en realidad resulta la media
de una población Bernoulli.
Las hipótesis que pueden ser de interés respecto a la proporción de una población son:
I : : ≠ II : : > III
: : < Considerando el error tipo I, el estadístico de prueba adecuado para cualquiera de las hipótesis
respecto a , planteadas es:
̂
la cual tiene aproximadamente una distribución normal estándar, justificada por el teorema dellímite central, debido a que el tamaño de la muestra es ≥ 30.En este estadístico de prueba:
̂ es la proporción poblacional estimada con el tamaño de muestra es la proporción hipotética planteada en la hipótesis nula y 1 Considerando la distribución aproximada de
es posible definir las regiones de rechazo para cada
hipótesis planteada, las cuales resultan ser:a) Para las hipótesis del caso I, la región de rechazo es válida para los valores de que cumplan|| > ⁄ b)
Para las hipótesis del caso II, la región de rechazo es válida para los valores de que cumplan > c) Para las hipótesis del caso III, la región de rechazo es válida para los valores de que cumplan <
EjemploUn fabricante de insecticidas para moscas, desea comprobar que una nueva marca “Matamos K” esmucho más efectivo que una determinada marca “X” que se encuentra en el mercado. La marca X
mata en promedio 800 de 1000 moscas. Para comprobar si la nueva marca es más efectiva, se realizaun experimento en el cual, se colocan 1000 moscas en un cuarto y se usa el insecticida “Matamos K”y resulta que sucumben 815. ¿De acuerdo a estos datos es estadísticamente más efectiva esta nueva
marca? Justifique con un 99% de confianza.
Solución
La hipótesis de interés a probar es: : 0.80 : > 0.80.Se está en el caso de que la muestra es grande, por lo que el siguiente proceso tiene validez
̂
8151000 0.815
8/18/2019 Unidad IV. Pruebas de Hipótesis
12/22
Prof. Felipe R. Tuz Poot 102
El estadístico de prueba es:
̂ ⁄ 0.8150.800 0.80.2 1000⁄
0.0150.01265 1.186 Además se tiene que el valor crítico es
. 2.33. Por lo tanto como el estadístico
1.186
calculado es tal que < . 2.33, es decir, el valor del estadístico no cae en la región de rechazo,no es posible rechazar a favor de la hipótesis alternativa.Se concluye que no hay razón suficiente para decir que el nuevo insecticida es más eficiente que el
de la marca X, es decir, los datos no apoyan a la hipótesis del fabricante.
Prueba de hipótesis para la varianza
Prueba de hipótesis para la varianza poblacional, , cuando la población tiene distribuciónnormal o aproximadamente normal
Para realizar la prueba de hipótesis para la varianza poblacional, sólo se abordará el caso máscomún en el que la media poblacional es desconocida. Hay muchas situaciones prácticas donde es el objetivo principal de una investigación experimental; así, este parámetro puede asumir una
importancia mucho mayor que la de la media poblacional. Por ejemplo, los instrumentos de medicióncientífica deben producir valores insesgados con un error de medición muy pequeño; el altímetro de
una aeronave que mide en promedio la altitud correcta sería de poco valor si la desviación estándardel error de medición fuese 2000 metros; los repuestos que se producen en un proceso industrial
deben tener un mínimo de variabilidad con el objeto de reducir el número de productos cuyo tamaño
esté fuera de número de productos defectuosos. Además, en general es deseable mantener unavarianza mínima en las mediciones para conseguir el control de determinados proceso y por lo tanto
minimizar el porcentaje de productos de poca calidad.
Las hipótesis de interés respecto a la varianza poblacional son:I : : ≠ II : : > III : : <
donde es una constante positiva, un valor hipotético.Es importante hacer énfasis de que bajo la condición de que la muestra obtenida es de una
distribución normal, se tiene, por la teoría de distribuciones muestrales y considerando el error tipo
I que el estadístico de prueba adecuado para cualquiera de las hipótesis establecidas para es: 1 La cual tiene una distribución Chi- cuadrada con 1 grados de libertad y donde
es la varianza establecida en la hipótesis nula es la varianza muestral con tamaño de muestra A partir de esta distribución correspondiente al estadístico de prueba, es posible definir las regionesde rechazo para cada hipótesis planteada:
8/18/2019 Unidad IV. Pruebas de Hipótesis
13/22
Prof. Felipe R. Tuz Poot 103
a) Para las hipótesis del caso I, la región de rechazo está formada por los valores de quecumplen que > ,− o < −,−
b) Para las hipótesis del caso II, la región de rechazo está formada por los valores de quecumplen que: > ,−
c) Para las hipótesis del caso III, la región de rechazo está formada por los valores de quecumplen que:
< −,−
EjemploUn experimentador está convencido de que su equipo de medición tiene una variabilidad medida por
una desviación estándar de 2. Durante un experimento, obtuvo las observaciones 4.1, 5.2, 10.2.¿Están en desacuerdo estos datos con su posición? Si esta respuesta es afirmativa, es necesaria la
revisión del equipo. Responda con un nivel de significancia de a 0.1. Supóngase que los datos demedición tienen una distribución normal.
Solución
La hipótesis que se desea probar es:
: 2 : ≠ 2
que es equivalente a : 4 : ≠ 4 La varianza muestral de estos datos es
12 ∑ ̅
= 10.57
El estadístico de prueba es
1
210.57
4 5.285
Se sabe que se rechaza si el valor que se obtiene de cumple que: 2 > 2,12 o 2 < 12,12
Los valores críticos obtenidos de la tabla de la distribución Ji-cuadrada son ,− ., 5.99 y −,− ., 0.103 , por lo que el valor del estadístico de prueba no cae en la región derechazo, no se puede rechazar la hipótesis nula a favor de la hipótesis alternativa. Como consecuencia
no hay razón suficiente para dar una revisión al equipo con 90% de confianza.
8/18/2019 Unidad IV. Pruebas de Hipótesis
14/22
Prof. Felipe R. Tuz Poot 104
PRUEBA DE HIPÓTESIS A PARTIR DE DOS MUESTRAS
Pruebas de hipótesis para diferencia de medias poblacionales, cuando lasdesviaciones estándar poblacionales y son conocidasSupóngase que se tienen dos muestras aleatorias:
, … , y
, … , . Las pruebas de hipótesis
aquí planteadas se establecen bajo cualquiera de las siguientes condiciones.
i) Las poblaciones de donde son extraídas las muestras tienen distribución normal o
aproximadamente normal y entre las muestras hay independencia.
ii) Las distribuciones poblacionales de donde son extraídas las muestras son desconocidas
pero los tamaños de las muestras son mayores o iguales a 30 y entre las muestras hay
independencia.
En el siguiente cuadro se presentan los posibles planteamientos de hipótesis con suscorrespondientes estadísticas de prueba y regiones de rechazo utilizando la distribución normal
estándar.
Hipótesisnula
Hipótesisalternativa Medida Estadísticade Prueba Región de rechazo
≠ ̅
|| > 2⁄ > > < <
El valor
se refiere a la posible diferencia entre las medias poblacionales. Cuando en el estudio se
desea probar si los promedios poblacionales son diferentes, entonces se considera 0 y losplanteamientos de las hipótesis se reducen a cualquiera de las dos formas siguientes que sepresentan a manera de ejemplo:
: 0 : ≠ 0 ó : : ≠ EjemploSe desea analizar el peso de las varillas fabricadas por dos compañías, por tanto se toman muestras
aleatorias de 100 varillas de acero que se fabrican en cada una de las compañías A y B. De la muestra
de la compañía A se obtiene un peso medio de 6.5 kg., asimismo, la muestra de la compañía B indicaun peso medio de 6.3 kg. Considerando que las desviaciones estándar poblacionales de cadacompañía son respectivamente 0.4 kg. y 0.3 kg. Se puede concluir que alguna de lascompañías fabrica las varillas con mayor peso? Responda estadísticamente con un 99% de confianza.
Solución
Se desea probar la hipótesis:
: : ≠ La información que se tiene es 100,̅ 6.5 ̅ 6.3 . Además las desviaciones sonconocidas, a saber,
0.4 kg y
0.3 kg. De manera natural, las muestras son independientes,
por lo que el estadístico de prueba es:
8/18/2019 Unidad IV. Pruebas de Hipótesis
15/22
Prof. Felipe R. Tuz Poot 105
̅
6.56.3 0.4100 0.3100
0.20.05 4
El valor crítico es / . 2.58 y como el valor del estadístico de prueba es tal que || >. 2.58, se rechaza la hipótesis nula a favor de la alternativa con una confianza del 99%, esdecir, los datos apoyan que efectivamente una de las fábricas produce varillas con mayor peso.
Prueba de hipótesis para diferencia de medias poblacionales cuando lasdesviaciones estándar poblacionales y son desconocidasSupóngase que se tienen dos muestras aleatorias X, … , Xn y Y, … , Yn y se cumple alguna de lassiguientes condiciones:
i) Las poblaciones de las cuales se extraen las muestras tienen distribución normal o aproximadamentenormal y entre las dos muestras hay independencia.
ii) Las distribuciones poblacionales de donde son extraídas las muestras son desconocidas pero lostamaños de las muestras son mayores o iguales a 30 y entre las dos muestras hay independencia.
Entonces, bajo la condición i), la prueba de hipótesis para se determina de acuerdo a algunode los dos casos siguientes:
Caso 1: En este caso, los posibles planteamientos de las hipótesis con sus correspondientes estadísticas de
prueba y regiones de rechazo utilizando la distribución de student, se presentan en el siguientecuadro.Hipótesis
nula Hipótesis
alternativa Medida Estadística dePrueba Región de rechazo ≠ ̅
1 1
2 −+−+−
|| > ⁄ , > > , < < ,
EjemploSe llevó a cabo un experimento para comparar el deterioro abrasivo de dos materiales laminadosdiferentes. Se probaron doce piezas del material 1, exponiendo cada una a una máquina para medir
el deterioro. De la misma manera, se probaron diez piezas del material 2. En cada caso, se observó la
profundidad del deterioro. Las muestras del material 1 dieron un deterioro promedio (registrado)
de 85 unidades con una desviación estándar muestral de 4, mientras que las muestras del material 2dieron un promedio de 81 y una desviación estándar muestral de 5. ¿Puede concluirse en el nivel de
8/18/2019 Unidad IV. Pruebas de Hipótesis
16/22
Prof. Felipe R. Tuz Poot 106
significancia de 0.05 que el deterioro abrasivo del material 1 excede al del material 2 por más de dos
unidades? Asuma que las poblaciones son aproximadamente normales con varianzas iguales.
SoluciónSi
y
representan las medias poblacionales de los deterioros abrasivos para el material 1 y 2
respectivamente, entonces se tienen las hipótesis siguientes:
: 2 : > 2 Se trata de una prueba de hipótesis de una cola a la derecha con 0.05 y 12 10 2 20 grados de libertad. De la tabla de distribución de student se obtiene el valor crítico de 1.725.De la información del ejemplo se tiene que:
̅ 85
4
12
̅ 81 5 10 La medida estadística de prueba es:
1116 9251 2 1 0 2 4.478 ̅ ̅ 1 1
85 81 24.478 112 110 1.04
La medida estadística de prueba 1.04 es menor que el valor crítico 1.725 por lo que cae en la región
de aceptación y se acepta la hipótesis nula.
Decisión: No se está en condiciones de concluir que el deterioro abrasivo del material 1 excede al del
material 2 por más de dos unidades, la muestra no aporta evidencia para esta conclusión.
EjemploSe deben eliminar gases ácidos de otros gases de refinería en una instalación de productos químicos,esto para reducir al mínimo la corrosión de las plantas. Dos métodos para eliminar estos gases
produjeron el ritmo de corrosión (mm./año), medidas que se representan a continuación:
Método A: 0.3, 0.7, 0.5, 0.8, 0.9, 0.7, 0.8Método B: 0.7, 0.8, 0.7, 0.6, 2.1, 0.6, 1.4, 2.3
¿Se puede concluir que el método A tiene una media menor en el ritmo de corrosión que el métodoB? Justifique estadísticamente con un nivel de significancia de 0.1. ¿Qué hipótesis se deben hacer para
comprobar la validez de la respuesta?
0 1.7251.04 t
0.45
8/18/2019 Unidad IV. Pruebas de Hipótesis
17/22
Prof. Felipe R. Tuz Poot 107
Solución
Se desea probar la hipótesis:
: : < Equivalente a:
: 0 : < 0 La información que se tiene es: ̅ 0.6714 0.0424 7 ̅ 1.15 0.4886 8
1 1 2 7 10.0424 8 10.48867 8 2 0.2827
Para poder utilizar el estadístico de prueba descrito previamente es necesario realizar los siguientes
supuestos: Las muestras aleatorias provienen de poblaciones con distribución normal y son
independientes.
Las poblaciones tienen desviaciones estándar iguales, o sea .Luego, el estadístico de prueba es:
̅ ̅ 1 ⁄ 1 ⁄ () 0.67141.15 1 7⁄ 1 8⁄ 0.2827 1.7392
Como 0.10, el valor crítico es ,+− ., 1.35. Como la estadística de prueba estal que < ., entonces se rechaza , es decir, los datos presentan evidencia para concluir queel método A tiene una media en el ritmo de corrosión más baja que el método B.
Caso 2: ≠ En este caso, los posibles planteamientos de las hipótesis con sus correspondientes estadísticas de
prueba y regiones de rechazo utilizando la distribución t de student, se presentan en el siguiente
cuadro.
Hipótesisnula Hipótesisalternativa Medida Estadística dePrueba Región de rechazo ≠ ̅
donde
⁄ 1
( )
1
|| > ⁄ , > > ,
< < ,
8/18/2019 Unidad IV. Pruebas de Hipótesis
18/22
Prof. Felipe R. Tuz Poot 108
EjemploUn fabricante de unidades reproductoras de video está probando el diseño de dos microcircuitos
para determinar si producen un flujo de corriente medio equivalente. El departamento de ingenieríade desarrollo ha obtenido los siguientes datos:
Para el Diseño 1
15
̅ 24.2
10
Para el Diseño 2 10 23.9 20 Se desea determinar si hay alguna diferencia en el flujo de corriente medio entre los dos diseños,
donde se supone que las poblaciones tienen distribución normal, pero no se desea suponer que las
varianzas son iguales. Utiliza un nivel de significancia de 0.1 para dar respuesta a esta hipótesis.
SoluciónLa hipótesis de interés a probar es:
: : ≠ Ya que se considera que los datos de las muestras provienen de distribuciones normales, además lasvarianzas son desconocidas y diferentes, el estadístico de prueba adecuado a emplear es:
24.2 23.9 1015 2010
0.31.632993 0.184
⁄ 1 ( ) 1 1015 2010
101514 20109 7.111
0.0320.444 14.93
es decir 15 pues el valor de se redondea al entero más cercano.El valor crítico es , ., 1.753 y como el estadístico de prueba es tal que || < /, seconcluye que no se rechaza por lo que los datos no proporcionan evidencia suficiente paraconcluir que existe diferencia entre las medias.
Una vez presentada la condición i) se abordará a continuación la condición ii) que tiene las siguientes
características:
Las distribuciones poblacionales son desconocidas Las desviaciones estándar y son desconocidas Los tamaños de las muestras son mayores o iguales a 30 y,
Las muestras son independientes.
Como las desviaciones estándar son desconocidas se estiman con las desviaciones muestrales por ser estos estimadores consistentes de sus desviaciones estándar poblacionalesrespectivas. Por ello pueden ser tratadas como desviaciones estándar poblacionales conocidas, lo que
permite utilizar la estadística de prueba y regiones de rechazo presentadas en la tabla siguiente:
8/18/2019 Unidad IV. Pruebas de Hipótesis
19/22
Prof. Felipe R. Tuz Poot 109
Hipótesisnula
H0
Hipótesisalternativa Medida Estadísticade Prueba Región de rechazo
≠ ̅
|| > ⁄
>
>
< < Esta tabla es exactamente la misma que la empleada en el caso cuando las muestras provienen dedistribuciones normales y sus desviaciones estándares son conocidas.
Prueba de hipótesis para la diferencia de proporciones
Intervalo de confianza para diferencia de proporciones poblacionales
, con muestras
mayores o iguales a 30.Cuando se tienen dos poblaciones en las cuales el interés radica en comparar las proporciones, al
igual que como se hizo con la diferencia de medias poblacionales, se realiza considerado un
estimador insesgado para la diferencia de proporciones y este estimador es ̂ ̂, con̂ y ̂ , donde es el número de éxitos obtenido del tamaño de muestra de unapoblación con distribución y es el número de éxitos obtenido del tamaño demuestra de una población con distribución .En el siguiente cuadro se presentan los posibles planteamientos de las hipótesis nula y alterna, lamedida estadística de prueba utilizando la distribución normal estándar, así como, las regiones de
rechazo correspondientes.
Hipótesisnula Hipótesisalternativa Medida Estadísticade Prueba Región de rechazo ≠ ̂ ̂ ̂ 1 1
̂ 1 ̂
|| > ⁄ > > < <
EjemploConsidere un proceso de producción que tiene una fracción defectuosa desconocida. A esteproceso se le realizan unas mejoras para reducir el porcentaje de defectuosos que está produciendo,
y queremos saber si estos cambios sí reducen sustancialmente la proporción de artículos defectuosos
del proceso. Para ello, se toma una muestra de 200 artículos del proceso original, y se encuentran 12defectuosos, por otro lado se examinan 150 artículos del nuevo proceso y se observan 6 defectuosos.
¿Cree usted que los cambios efectuados al proceso han reducido el porcentaje de artículosdefectuosos? Use un nivel de confianza del 95%.
SoluciónSean
y
proporciones poblacionales del proceso original y del nuevo respectivamente, entonces
se desea probar la hipótesis:
8/18/2019 Unidad IV. Pruebas de Hipótesis
20/22
Prof. Felipe R. Tuz Poot 110
: : > Los datos que se tienen son
12 6 200 150 por lo que las proporciones muestrales son
̂ 0.06 y ̂ 0.04 y además
̂ 1 2 6200150 0.05143
Ya que las muestras son grandes el estadístico de prueba adecuado es:
̂ ̂ ̂ 1 1 0.060.04 0.051430.94857 1200 1150
0.020.02386 0.8382
El valor crítico es . 1.64 y como el valor del estadístico es tal que < 1.64 entoncesla hipótesis nula no puede ser rechazada, es decir, los datos no presentan evidencia para concluir que
los cambios efectuados al proceso ayudan a disminuir el porcentaje de defectuosos con una confianzadel 95%.
Prueba de hipótesis para el cociente de varianzasPrueba de hipótesis para la igualdad de varianzas , poblaciones con distribuciónnormal.
Cuando nuestro objetivo es el de comparar las medias de dos poblaciones con distribución normal,el parámetro que se estudia es la diferencia de medias, ahora, si el objetivo es el de comparar las
variabilidad de las poblaciones, el parámetro que se estudia es el cociente de varianzas, , lajustificación es que en distribuciones muestrales se comprueba que el estadístico
tiene unadistribución −,− ( tamaño de muestra de y tamaño de muestra de ); en particular si o bien 1, entonces tiene la misma distribución de Fisher. En cambio no hay taljustificación si se usa diferencia de varianzas.En el siguiente cuadro se presentan los posibles planteamientos de las hipótesis con suscorrespondientes estadísticas de prueba y regiones de rechazo utilizando la distribución de Fisher.
8/18/2019 Unidad IV. Pruebas de Hipótesis
21/22
Prof. Felipe R. Tuz Poot 111
Hipótesisnula Hipótesisalternativa Medida Estadísticade Prueba Región de rechazo
≠
con
1
grados de libertad enel numerador y 1 grados de
libertad en el
denominador.
< ⁄ ,,
ó
> ⁄ ,, > > ,, < < 1 ,,
La notación , indica que se debe considerar el valor crítico de la tabla F-Fisher con gradosde libertad en el numerador, grados de libertad en el denominador y con un nivel de significancia.En las siguientes gráficas se presentan los diferentes casos de pruebas de hipótesis de una cola y dedos colas, así como las fórmulas para calcular los valores críticos; también se muestran las regiones
de rechazo identificadas como la parte sombreada. En el caso de pruebas de hipótesis de una cola, yasea a la izquierda o a la derecha, el nivel de significancia es el valor de α mientras que cuando la
prueba de hipótesis es de dos colas el nivel de significancia es /2.
Región de rechazo para la prueba de hipótesis cuando : <
Región de rechazo para la prueba de hipótesis cuando : >
f
f
a
8/18/2019 Unidad IV. Pruebas de Hipótesis
22/22
Prof. Felipe R. Tuz Poot 112
Región de rechazo para la prueba de hipótesis cuando : ≠ Ejemplo
Un médico asegura que la variabilidad entre el peso de las niñas ( ) y los niños () es diferente. Paracomprobar estadísticamente dicha afirmación se realiza el experimento de seleccionar dos muestras,una de 10 niñas y otra de 8 niños, de los cuales se tuvieron varianzas de 2.1 y 3.21 ,respectivamente. ¿Presentan las varianzas muestrales suficiente evidencia que indique que laafirmación del médico es cierta? Compruebe con un nivel de significancia de 0.1
Solución
Se desea probar la hipótesis
: : ≠ Supóngase que las poblaciones tienen distribuciones que son razonablemente monticulares y que
por lo tanto satisfacen la suposición de que las poblaciones son normales, dado esto el siguiente
proceso es válido, estadísticamente.
El estadístico de prueba es
2.13.21 0.6542
Se sabe que la región de rechazo es para cualquier valor que cumple cualquiera de los siguientescasos: > ,−,− o < ,−,−
−.
Se tiene que: ,−,− .,, 3.68 ,−,−− ( .,,)− 3.29− 0.3039.
Como el estadístico f no cumple con ninguna de las condiciones entonces no pertenece a la región derechazo. Como consecuencia no hay suficiente evidencia para concluir que la variación en pesos entre
los niños difiera con respecto a la variación en el peso entre las niñas con 90% de confianza. Los datosno apoyan a la hipótesis que plantea el médico.
f