Unidad IV. Pruebas de Hipótesis

8/18/2019 Unidad IV. Pruebas de Hipótesis

1/22

Prof. Felipe R. Tuz Poot 91

UNIDAD IV. PRUEBAS DE HIPÓTESIS

CONCEPTOS BÁSICOS DE PRUEBAS DE HIPÓTESIS

La inferencia estadística está relacionada con los métodos para obtener conclusiones o

generalizaciones acerca de una población. Estas conclusiones acerca de la población pueden estarrelacionadas con la forma de la distribución de una variable aleatoria, ó con los valores de uno ovarios parámetros de la misma.

El campo de la inferencia estadística se divide en dos:

a) Por un lado, el interés de la estimación de los parámetros de una distribución y,b)

Las pruebas de hipótesis.

En el caso de la estimación, se trata de elegir el valor de un parámetro de la población, mientras que

en las pruebas de hipótesis se trata de decidir entre aceptar o rechazar si un valor especificado del

parámetro corresponde a la población (por ejemplo, si el tiempo de vida de un artículo es un valor

o no lo es).

En el campo de las pruebas de hipótesis se pueden considerar dos áreas:

a) Pruebas de hipótesis respecto a los parámetros, para determinar si un parámetro de unadistribución toma o no un determinado valor, o si puede tomar un conjunto de valores y,

b) Pruebas de Bondad de Ajuste, para definir o establecer si un conjunto de datos se puede

modelar mediante una determinada distribución.

En las secciones siguientes solamente se aborda, el primer inciso, es decir, las pruebas de hipótesis.

Una hipótesis estadística es una proposición o conjetura que se hace de la población o poblacionesrespecto a sus respectivos parámetros. Por ejemplo, si con base en una muestra aleatoria se tiene

que decidir si un proceso está produciendo una determinada media, digamos µ 100, o si hay quedecidir si una determinada droga sirve a un grupo específico de pacientes, lo anterior, puedetraducirse en un lenguaje de “Pruebas de Hipótesis”, y utilizar metodologías estadísticas para tomaruna decisión al respecto.

Estadísticamente una prueba de hipótesis es una afirmación o conjetura de una o más poblaciones.

Nunca se sabe con absoluta certeza la verdad o falsedad de una hipótesis estadística, a no ser que se

examine la población entera. Esto último, por supuesto sería impráctico en la mayoría de las

situaciones, es por esto que en lugar de la población, se toma una muestra aleatoria representativa

de la población de interés y se utilizan los datos de tal muestra para proporcionar evidencia que

confirme o no la hipótesis planteada.

Una prueba de hipótesis consiste en contrastar dos hipótesis estadísticas. Tal contraste involucra latoma de decisión acerca de las hipótesis. La decisión consiste en rechazar o no una hipótesis en favorde la otra. En el proceso de una prueba de hipótesis para una toma de decisión estadística se

involucran dos tipos de hipótesis: Hipótesis nula e hipótesis alternativa , éstas se abordan con más

detalle a continuación.

Hipótesis Nula y Alternativa

La hipótesis nula denotada por es una declaración afirmando ningún cambio o ningún efecto en elestado de la naturaleza. se considera cierta, o sin cambio alguno salvo que los datos proporcionenevidencia convincente de que es falsa. Comúnmente es planteada con el objetivo de ser rechazada, ya

que se pretende probar que los datos dan evidencia de algún cambio.


2/22


La hipótesis alternativa es una declaración que contradice y es denotada por o bien . Esaceptada sólo si los datos proporcionan evidencia convincente de su verdad. Comúnmente es

planteada como la hipótesis del investigador, la cual es la que se pretende aceptar rechazando .Ejemplo Supóngase que se sospecha que los niños tienen un CI más alto si comen alimentos con aceite de

pescado durante seis meses.

La hipótesis alternativa :“Los niños que comen alimentos con aceite de pescado por seis meses tienen un CI mayor que los

niños que no lo hacen.

La hipótesis nula :“Los niños que comen alimentos con aceite de pescado durante seis meses no muestran un mayor CI

que los niños que no lo hacen”

En un experimento se consideran dos grupos: un grupo de control al que no se le proporciona

alimentos con aceite de pescado y otro grupo al que sí se le proporciona. A ambos grupos se les mideel CI al inicio del experimento y después de los seis meses del experimento.

De las pruebas del coeficiente intelectual del grupo de control, se encuentra un CI medio de 100 antes

del experimento y 100 después, esto es, no hay aumento.

Los niños alimentados con aceite de pescado muestran un aumento de 100 a 106. Esto parece ser un

aumento, pero aquí es donde la estadística entra en el proceso de comprobación de hipótesis. Es

necesario comprobar si el aumento es significativo como para afirmarlo a nivel poblacional.

Usando una prueba adecuada, el investigador puede comparar las dos medias finales de los dosgrupos (100 y 106), teniendo en cuenta el aumento, el número de datos en las muestras y laasignación al azar relativa de los grupos. El resultado permitirá determinar si existe evidencia

suficiente para apoyar si la conjetura hecha por el investigador es afirmativa.

Es importante tener en cuenta que, no rechazar la hipótesis nula no es lo mismo que aceptarla. Essólo que este experimento en particular no puso de manifiesto que el consumo de alimento con aceite

de pescado no afecta al coeficiente intelectual. Este principio se encuentra en la esencia de la pruebade hipótesis.

Errores de tipo I y tipo II

Al utilizar un proceso de prueba de hipótesis para tomar decisiones sobre el parámetro poblacional,

existe el riesgo de llegar a una conclusión equivocada, eso es, al aplicar la metodología de prueba dehipótesis, puede cometerse uno de dos tipos de error: el error de tipo I y el error de tipo II.

Error tipo I: Se presenta cuando se rechaza la hipótesis nula siendo cierta y no debería rechazarse.

Nivel de significancia. Es la probabilidad de cometer un error tipo I, denotado por alfa, . Nivel de confianza: Es la probabilidad de la decisión correcta de aceptar la hipótesis nula cuando esverdadera, esta probabilidad se denota por 1 .Error tipo II: Este tipo de error se presenta cuando no se rechaza la hipótesis nula siendo falsa ydebería rechazarse.


3/22


Característica de la prueba: Es la probabilidad de cometer un error de tipo II y se denota por . Potencia de la prueba o poder de la prueba. Es la probabilidad de la decisión correcta de rechazar la

hipótesis nula cuando es falsa, esta probabilidad es denotada por 1 .En la siguiente tabla se resumen las probabilidades según la toma de decisión en una prueba dehipótesis.

Estado de H0

Decisión es verdadera es falsa

Aceptar Decisión correcta1 a Nivel de confianza Error tipo II b característica de la pruebaRechazar Error tipo I

a Nivel de significancia Decisión correcta1 b potencia de la pruebaUna hipótesis es una afirmación sobre un parámetro poblacional, la cual será aceptada o rechazada

en base a la evidencia que proporciona la muestra. La hipótesis inicial que se define sobre la

población se llama hipótesis nula; pero si rechazamos esa hipótesis nula debemos tener una hipótesis

alternativa, la cual tomaremos como cierta si la hipótesis inicial o nula es falsa.

EjemploEn un juzgado se le acusa a una persona de un delito, desde el punto de vista legal la persona acusadase le considera inocente (hipótesis nula o inicial) hasta que se demuestre lo contrario. Si el juez con

todas las evidencias presentadas determina más allá de toda duda razonable que la persona esculpable; entonces rechaza la hipótesis nula y determina como verdadera una hipótesis alternativa

(¡culpable!).

Para que las reglas de decisión sean buenas, deben diseñarse de modo que minimicen los errores dedecisión, y no es una cuestión sencilla, porque para cualquier tamaño de la muestra, un intento de

disminuir un tipo de error (por ejemplo error tipo I) suele ir acompañado de un crecimiento del otro

tipo de error (error tipo II). En la práctica un tipo de error puede ser más grave que el otro, y debe

alcanzarse un compromiso que disminuya el error más grave, la única forma de disminuir ambos ala vez es aumentar el tamaño de la muestra, que no siempre es posible.

En general, en una prueba de hipótesis se trata de minimizar el error tipo I, es decir, “el error derechazar y aceptar la hipótesis alternativa”, por lo que hay que cuidar que la probabilidad deeste error sea lo más pequeña posible. Como se mencionó anteriormente, la hipótesis del

investigador se encuentra en la hipótesis alternativa, por lo que se tratará de buscar evidencia en la

P(Error tipo II) =

Bajo H0

P(Error tipo I) =

Bajo Ha

Valor crítico


4/22


muestra para rechazar la hipótesis nula y aceptar la alternativa, esto trae como consecuencia que se

tenga probabilidad de cometer el error tipo I pero con la probabilidad más pequeña.

Las dos decisiones posibles que se pueden hacer nos llevan a una de las dos siguientes conclusiones:

1) La conclusión de que hay suficiente evidencia para apoyar la hipótesis alternativa (rechazar

la hipótesis nula a favor de la alternativa)

2) La conclusión de que no hay pruebas suficientes que apoyen la hipótesis alternativa (no

rechazar la hipótesis nula a favor de la alternativa)

Estadístico de Prueba: El estadístico de prueba es el que permite tomar la decisión en una pruebade hipótesis establecida por el investigador, ya que es una función de la muestra con la característica

de tener una distribución, misma que se utiliza para calcular probabilidades que permiten definir la

región de rechazo y la región de aceptación respecto a la hipótesis nula. Sin el conocimiento de dicha

distribución no sería posible definir dichas regiones, pues todo lo relacionado a inferencia estadísticaes basado en probabilidades de una distribución teórica de la población.

Región de aceptación y de rechazo

Región de aceptación: La región de aceptación es un subconjunto de valores del estadístico deprueba para los cuales la hipótesis nula no se rechaza.

Región de rechazo: Es el conjunto de valores fuera de la región de aceptación. Si el valor delestadístico de prueba se encuentra dentro de esta región, la hipótesis nula es rechazada. En talescasos, se dice que la hipótesis nula ha sido rechazada con un nivel de significación .Valor crítico: Es el valor o el punto límite que divide a la región de rechazo y la región de aceptación.

En un proceso de prueba de hipótesis, para tomar la decisión con respecto a la hipótesis nula (aceptar

o rechazar esta hipótesis) se debe determinar el valor crítico en la distribución de la estadística de

prueba. El valor crítico divide la región de rechazo de la región de aceptación.

Por ejemplo, supóngase que se plantea una hipótesis respecto al parámetro µ y además el estadísticode prueba adecuado para la prueba es, el cual tiene una distribución normal estándar.Considerando la probabilidad del error tipo I, es decir estableciendo α, se utiliza la distribución de

probabilidad del estadístico de prueba para establecer las regiones de rechazo y las de aceptación

respecto a la hipótesis nula.

Si lo que se desea probar es:

: µ µ contra la hipótesis alternativa : µ ≠ µ con un nivel de significancia α (es decir, permitir el error tipo I con la probabilidad establecida)entonces las regiones de rechazo se presenta en la siguiente figura con 0.05


5/22


donde usando la distribución normal estándar son tales que: < /2 y > /2.

En el caso particular

0.05 se tiene que

1.96 1.96 Las áreas sombreadas en la figura, son las llamadas regiones críticas o zonas de rechazo de la hipótesis

nula, los valores y son denominados puntos críticos. Así que si al calcular el estadístico deprueba e, el valor de este se encuentra dentro de la región de rechazo, entonces se rechaza , encaso contrario, se dice que no hay suficiente evidencia para rechazarla. Ahora, si el valor de e

correspondiente a la muestra observada cae dentro de la zona de aceptación en la figura, el

investigador se inclinara a pensar que no reunió suficiente evidencia para poder rechazar la hipótesisnula a favor de la alternativa, aunque aquí también cabe la posibilidad de cometer un error en la

decisión, que será del tipo II.

En la práctica, los niveles de significancias más usuales son: 1%, 5% o bien el 10%.

Las pruebas de hipótesis pueden ser de una o de dos colas dependiendo del planteamiento que se

desee probar en la hipótesis alternativa. Si al establecer la hipótesis alternativa, ésta es de la forma: µ > µ, entonces se considera que se trata de una prueba de hipótesis de una cola a la derecha, osea, que la región de rechazo estará en el lado derecho de la distribución del estadístico de prueba y

se considera la prueba con nivel de significancia α; ahora, si se establece la hipótesis alternativa: µ < µ , entonces se trata de prueba de hipótesis de una cola a la izquierda y se especifica laprueba con nivel de significancia α; por último si el signo es de desigualdad en la hipótesis alterna osea, es : µ ≠ µ , se trata de una prueba de hipótesis de dos colas, una a la derecha y otra a laizquierda, como son dos las zonas de rechazo, se tendrá que dividir el nivel de significancia α entre

dos (éste el caso presentado en la figura anterior). Observe, en las siguientes gráficas se presentanlas regiones de rechazo que se dan en cada caso mencionado:

Prueba de hipótesis de una cola a la derecha (

: µ > µ)

95%

=0.025 =0.025

Región cr ítica o

zona de rechazo de

la hipótesis nula

Región crítica o

zona de rechazo de

la hipótesis nula

Zona de aceptación

de la hipótesis

nula

z


6/22


Prueba de hipótesis de una cola a la izquierda (: µ < µ)

Prueba de hipótesis de dos colas (: µ ≠ µ)Los pasos para realizar una prueba de hipótesis son los siguientes:

1. Plantear la hipótesis nula

2. Plantear la hipótesis alternativa3. Especificar el nivel de significancia

4.

Considerar el tamaño de muestra

5. Establecer los valores críticos que definen las regiones de rechazo de las de no rechazo.

6. Determinar cuál debe ser la estadística de prueba a emplear7.

Coleccionar los datos de la muestra y calcular el valor muestral de la Estadística de prueba

apropiada8. Determinar si la estadística de prueba calculada corresponde a la región de rechazo o la

región de aceptación. Recuérdese que la ubicación de estas regiones son respecto al signo de

desigualdad ≠,>,


7/22


estudio se desea comprobar estadísticamente si la media de combustión es 50 cm/s o no lo es, es

decir las hipótesis de interés son:

: µ 50 vs : µ ≠ 50 Supóngase que la región de no rechazo de es:

{̅: 48.5 ≤ ̅ ≤ 51.5} Suponiendo que la verdadera media es µ 52 , considerando 10 . El interés aquí es el dedeterminar la potencia de la prueba, para ello determínese la probabilidad del error tipo II es decir, . =Probabilidad (Aceptar cuando es falsa)

=Probabilidad (Aceptar cuando µ 52)=Probabilidad (48.5 ≤ ̅ ≤ 51.5 cuando µ 52) .−./√ ≤ ̅−./√ ≤ .−./√ 4.43 ≤ ≤ 0.63 0.63 ≤ ≤ 4.43 ≥ 0.63 ≥ 4.43

0.2643 0000 0.2643 Entonces la potencia de la prueba es: 1 1 0.2643 0.7357 cuando µ 52.La potencia de la prueba es una medida descriptiva y concisa de la sensibilidad de una estadística,

donde la sensibilidad se entiende como la habilidad de la prueba para detectar diferencias; en el caso

del ejemplo, la sensibilidad de la prueba para detectar la diferencia entre la rapidez de combustión

media de 50 cm/s y 52 es 0.7357, o sea, si la media verdadera es en realidad 52 cm/s, esta pruebarechazará : µ 50 y detectará esta diferencia en un 73.57% de las veces. Podría decirse tambiénque la prueba tiene la capacidad de rechazar

: µ 50 con un 73.57% de confianza cuando la

verdadera media es µ 52. Si este valor potencia, se considera muy bajo, el investigador podríaincrementar el tamaño de la muestra.


8/22


PRUEBA DE HIPÓTESIS A PARTIR DE UNA MUESTRA

Prueba de hipótesis para la media

Se comenzará estudiando las pruebas de hipótesis para la media de una sola población sobre la quese desea hacer inferencia. Los estadísticos a utilizar son: el estadístico

y el estadístico

, ¿cuál se

empleará? Pues dependerá de si se conoce o desconoce y considerando ciertas características dela muestra y la población.Prueba de hipótesis para la media con conocidaLas hipótesis que pueden ser de interés al investigador respecto a la media son:

I

: : ≠ II : : > III : : <

donde

es una constante.

Para las hipótesis establecidas aquí, es importante considerar que la prueba sólo es válida bajo

cualquiera de las siguientes condiciones:

i) la muestra aleatoria es obtenida de una población con distribución normal o aproximadamente

normal

ii) Se desconoce la distribución poblacional correspondiente a la muestra, pero el tamaño de lamuestra n es grande, mayor o igual a 30.

Así, por la teoría de distribuciones muestrales, y considerando el error tipo I se tiene que el

estadístico de prueba adecuado es:

√ donde: es la media muestral con el tamaño de muestra es la media poblacional planteada en la hipótesis nula es la desviación estándar poblacional.El estadístico tiene una distribución normal estándar o aproximadamente normal, entonces, laregión de rechazo de con el nivel de significancia es:

a) Para las hipótesis planteadas en I la región de rechazo está dada por los valores que se

obtienen de z y que cumplen || > ⁄ b) Para las hipótesis planteadas en II la región de rechazo está dada por los valores que obtienende z que cumplan >

c) Para las hipótesis planteadas en III la región de rechazo está dada por los valores que se

obtienen de z que cumplan < EjemploUn ingeniero establece que en promedio las mediciones del diámetro del tubo de albañil es mayor

que 30. Para comprobar que lo que establece el ingeniero efectivamente es lo correcto se toma una

muestra aleatoria de 100 tubos del cual resulta una media de 32 cm y una varianza de 4. ¿Apoya la

muestra la aseveración del ingeniero? Responda con un 95% de confianza.


9/22


Solución

La hipótesis que se desea probar es:

: 30 : > 30.Este ejemplo es el caso ii) planteado en esta sección pues es desconocida pero el tamaño demuestra

100 es grande.

Se estima la varianza poblacional a través de la varianza muestral 4. Así, el estadístico deprueba es

√ ≈ √

32 302√ 100 10

Y el valor crítico es z . 1.64 . Ya que calculada cumple que > . 1.64 entonces serechaza la hipótesis nula a favor de la hipótesis alternativa, esto es, se acepta la hipótesis que plantea

el ingeniero con un 95% de confianza.

Prueba de hipótesis para la media µ, con desconocida.Las hipótesis que pueden ser de interés al investigador respecto a la media son:

I

: : ≠ II : : > III : : <

donde es una constante.Para las hipótesis establecidas es importante que la muestra aleatoria obtenida esté bajo cualquiera

de las siguientes condiciones:

i) la muestra aleatoria es obtenida de una población con distribución normal o aproximadamentenormal

ii) Se desconoce la distribución poblacional correspondiente a la muestra, pero el tamaño de lamuestra n es grande, mayor o igual a 30.

Así, bajo cualquiera de estas condiciones que cumpla la muestra, se tiene por teoría de distribuciones

muestrales y considerando el error tipo I que, el estadístico de prueba adecuado para cualquiera delas hipótesis planteadas es:

√

el cual tiene una distribución con 1 grados de libertad y donde: es la media muestral con el tamaño de muestra es la media poblacional planteada en la hipótesis nula es la desviación estándar muestral.

Considerando la distribución (distribución con 1 grados de libertad), se puede determinar laregión de rechazo y la región de aceptación de con el nivel de significancia .


10/22


a) Para las hipótesis del caso I, la región de rechazo es válida para cada valor que cumple:|| > ⁄ ,− b) Para las hipótesis del caso II, la región de rechazo es válida para cada valor t que cumple: >,− c) Para las hipótesis del caso III, la región de rechazo es válida para cada valor que cumple: < ,−

Notas1)

En el caso i) no importa el tamaño de muestra, siempre será válido utilizar el estadístico .2) En el caso ii) cuando el tamaño de muestra es grande, la distribución con 1 grados de

libertad se aproxima a la distribución normal estándar, por lo que podemos utilizar el

estadístico de prueba

√ con la desviación estándar poblacional estimada por la desviación estándar muestral .

3)

Cuando no se cumple ninguno de los casos i) y ii), es decir, se desconoce la distribución de la

que proviene la muestra y el tamaño de muestra es < 30 , no es posible utilizar losestadísticos y para resolver la prueba de hipótesis respecto a la media. En esta situaciónse emplea metodología estadística no paramétrica, que en este curso no será abordada.

Ejemplo En una fábrica de materiales se fabrican unas varillas con una resistencia de 4500 kg/cm 2. Un

ingeniero sospecha que cierta maquinaria tiene fallas en la fabricación y asegura que la máquina está

fabricando varillas con resistencia diferente a 4500 kg/cm2, por lo propone un ajuste a dichamaquinara. Con la finalidad de mostrar que la máquina está fallando, un día al azar se toma una

muestra aleatoria de 10 varillas de la producción, al probarlas a la tensión hasta la ruptura se obtieneuna resistencia media de 4200 kg./cm2, con una desviación estándar de 200 kg. /cm2. Compruebe

con un nivel de significancia de 0.05 si la máquina realmente necesita un ajuste. Considere que la

variable poblacional resistencia tiene distribución normal.

SoluciónLa muestra proviene de una población con distribución normal, se desconoce la desviación estándar

poblacional , y además el tamaño de muestra es pequeño, por lo que se usará la distribución destudent para estimar el promedio poblacional, (si el tamaño de muestra fuese grande podría usarses como estimación para y usar el estadístico de prueba , como se indica en la sección anterior).La hipótesis a probar es:

: 4500 : ≠ 4500.El estadístico de prueba es:

√ 4200 4500200 √ 10

30063.246 4.74 El valor crítico es ,− ., 2.262.La región de rechazo está dada por || > /,−. Entonces el valor del estadístico cae en la regiónde rechazo, por tanto se rechaza la hipótesis nula y se concluye que los datos favorecen la hipótesisplanteada por el ingeniero, por lo que se sugiere que la maquinaria entre a revisión con un 95% de

confianza.


11/22


Prueba de hipótesis para la proporción

Prueba de hipótesis para la proporción poblacional , en muestras grandes ≥ .Como se ha mencionado en la sección de intervalos de confianza, la proporción observada de éxitos

en la muestra,

̂

, es un estimador de la proporción poblacional

, que en realidad resulta la media

de una población Bernoulli.

Las hipótesis que pueden ser de interés respecto a la proporción de una población son:

I : : ≠ II : : > III

: : < Considerando el error tipo I, el estadístico de prueba adecuado para cualquiera de las hipótesis

respecto a , planteadas es:

̂

la cual tiene aproximadamente una distribución normal estándar, justificada por el teorema dellímite central, debido a que el tamaño de la muestra es ≥ 30.En este estadístico de prueba:

̂ es la proporción poblacional estimada con el tamaño de muestra es la proporción hipotética planteada en la hipótesis nula y 1 Considerando la distribución aproximada de

es posible definir las regiones de rechazo para cada

hipótesis planteada, las cuales resultan ser:a) Para las hipótesis del caso I, la región de rechazo es válida para los valores de que cumplan|| > ⁄ b)

Para las hipótesis del caso II, la región de rechazo es válida para los valores de que cumplan > c) Para las hipótesis del caso III, la región de rechazo es válida para los valores de que cumplan <

EjemploUn fabricante de insecticidas para moscas, desea comprobar que una nueva marca “Matamos K” esmucho más efectivo que una determinada marca “X” que se encuentra en el mercado. La marca X

mata en promedio 800 de 1000 moscas. Para comprobar si la nueva marca es más efectiva, se realizaun experimento en el cual, se colocan 1000 moscas en un cuarto y se usa el insecticida “Matamos K”y resulta que sucumben 815. ¿De acuerdo a estos datos es estadísticamente más efectiva esta nueva

marca? Justifique con un 99% de confianza.

Solución

La hipótesis de interés a probar es: : 0.80 : > 0.80.Se está en el caso de que la muestra es grande, por lo que el siguiente proceso tiene validez

̂

8151000 0.815


12/22


El estadístico de prueba es:

̂ ⁄ 0.8150.800 0.80.2 1000⁄

0.0150.01265 1.186 Además se tiene que el valor crítico es

. 2.33. Por lo tanto como el estadístico

1.186

calculado es tal que < . 2.33, es decir, el valor del estadístico no cae en la región de rechazo,no es posible rechazar a favor de la hipótesis alternativa.Se concluye que no hay razón suficiente para decir que el nuevo insecticida es más eficiente que el

de la marca X, es decir, los datos no apoyan a la hipótesis del fabricante.

Prueba de hipótesis para la varianza

Prueba de hipótesis para la varianza poblacional, , cuando la población tiene distribuciónnormal o aproximadamente normal

Para realizar la prueba de hipótesis para la varianza poblacional, sólo se abordará el caso máscomún en el que la media poblacional es desconocida. Hay muchas situaciones prácticas donde es el objetivo principal de una investigación experimental; así, este parámetro puede asumir una

importancia mucho mayor que la de la media poblacional. Por ejemplo, los instrumentos de medicióncientífica deben producir valores insesgados con un error de medición muy pequeño; el altímetro de

una aeronave que mide en promedio la altitud correcta sería de poco valor si la desviación estándardel error de medición fuese 2000 metros; los repuestos que se producen en un proceso industrial

deben tener un mínimo de variabilidad con el objeto de reducir el número de productos cuyo tamaño

esté fuera de número de productos defectuosos. Además, en general es deseable mantener unavarianza mínima en las mediciones para conseguir el control de determinados proceso y por lo tanto

minimizar el porcentaje de productos de poca calidad.

Las hipótesis de interés respecto a la varianza poblacional son:I : : ≠ II : : > III : : <

donde es una constante positiva, un valor hipotético.Es importante hacer énfasis de que bajo la condición de que la muestra obtenida es de una

distribución normal, se tiene, por la teoría de distribuciones muestrales y considerando el error tipo

I que el estadístico de prueba adecuado para cualquiera de las hipótesis establecidas para es: 1 La cual tiene una distribución Chi- cuadrada con 1 grados de libertad y donde

es la varianza establecida en la hipótesis nula es la varianza muestral con tamaño de muestra A partir de esta distribución correspondiente al estadístico de prueba, es posible definir las regionesde rechazo para cada hipótesis planteada:


13/22


a) Para las hipótesis del caso I, la región de rechazo está formada por los valores de quecumplen que > ,− o < −,−

b) Para las hipótesis del caso II, la región de rechazo está formada por los valores de quecumplen que: > ,−

c) Para las hipótesis del caso III, la región de rechazo está formada por los valores de quecumplen que:

< −,−

EjemploUn experimentador está convencido de que su equipo de medición tiene una variabilidad medida por

una desviación estándar de 2. Durante un experimento, obtuvo las observaciones 4.1, 5.2, 10.2.¿Están en desacuerdo estos datos con su posición? Si esta respuesta es afirmativa, es necesaria la

revisión del equipo. Responda con un nivel de significancia de a 0.1. Supóngase que los datos demedición tienen una distribución normal.

Solución

La hipótesis que se desea probar es:

: 2 : ≠ 2

que es equivalente a : 4 : ≠ 4 La varianza muestral de estos datos es

12 ∑ ̅

= 10.57

El estadístico de prueba es

1

210.57

4 5.285

Se sabe que se rechaza si el valor que se obtiene de cumple que: 2 > 2,12 o 2 < 12,12

Los valores críticos obtenidos de la tabla de la distribución Ji-cuadrada son ,− ., 5.99 y −,− ., 0.103 , por lo que el valor del estadístico de prueba no cae en la región derechazo, no se puede rechazar la hipótesis nula a favor de la hipótesis alternativa. Como consecuencia

no hay razón suficiente para dar una revisión al equipo con 90% de confianza.


14/22


PRUEBA DE HIPÓTESIS A PARTIR DE DOS MUESTRAS

Pruebas de hipótesis para diferencia de medias poblacionales, cuando lasdesviaciones estándar poblacionales y son conocidasSupóngase que se tienen dos muestras aleatorias:

, … , y

, … , . Las pruebas de hipótesis

aquí planteadas se establecen bajo cualquiera de las siguientes condiciones.

i) Las poblaciones de donde son extraídas las muestras tienen distribución normal o

aproximadamente normal y entre las muestras hay independencia.

ii) Las distribuciones poblacionales de donde son extraídas las muestras son desconocidas

pero los tamaños de las muestras son mayores o iguales a 30 y entre las muestras hay

independencia.

En el siguiente cuadro se presentan los posibles planteamientos de hipótesis con suscorrespondientes estadísticas de prueba y regiones de rechazo utilizando la distribución normal

estándar.

Hipótesisnula

Hipótesisalternativa Medida Estadísticade Prueba Región de rechazo

≠ ̅

|| > 2⁄ > > < <

El valor

se refiere a la posible diferencia entre las medias poblacionales. Cuando en el estudio se

desea probar si los promedios poblacionales son diferentes, entonces se considera 0 y losplanteamientos de las hipótesis se reducen a cualquiera de las dos formas siguientes que sepresentan a manera de ejemplo:

: 0 : ≠ 0 ó : : ≠ EjemploSe desea analizar el peso de las varillas fabricadas por dos compañías, por tanto se toman muestras

aleatorias de 100 varillas de acero que se fabrican en cada una de las compañías A y B. De la muestra

de la compañía A se obtiene un peso medio de 6.5 kg., asimismo, la muestra de la compañía B indicaun peso medio de 6.3 kg. Considerando que las desviaciones estándar poblacionales de cadacompañía son respectivamente 0.4 kg. y 0.3 kg. Se puede concluir que alguna de lascompañías fabrica las varillas con mayor peso? Responda estadísticamente con un 99% de confianza.

Solución

Se desea probar la hipótesis:

: : ≠ La información que se tiene es 100,̅ 6.5 ̅ 6.3 . Además las desviaciones sonconocidas, a saber,

0.4 kg y

0.3 kg. De manera natural, las muestras son independientes,

por lo que el estadístico de prueba es:


15/22


̅

6.56.3 0.4100 0.3100

0.20.05 4

El valor crítico es / . 2.58 y como el valor del estadístico de prueba es tal que || >. 2.58, se rechaza la hipótesis nula a favor de la alternativa con una confianza del 99%, esdecir, los datos apoyan que efectivamente una de las fábricas produce varillas con mayor peso.

Prueba de hipótesis para diferencia de medias poblacionales cuando lasdesviaciones estándar poblacionales y son desconocidasSupóngase que se tienen dos muestras aleatorias X, … , Xn y Y, … , Yn y se cumple alguna de lassiguientes condiciones:

i) Las poblaciones de las cuales se extraen las muestras tienen distribución normal o aproximadamentenormal y entre las dos muestras hay independencia.

ii) Las distribuciones poblacionales de donde son extraídas las muestras son desconocidas pero lostamaños de las muestras son mayores o iguales a 30 y entre las dos muestras hay independencia.

Entonces, bajo la condición i), la prueba de hipótesis para se determina de acuerdo a algunode los dos casos siguientes:

Caso 1: En este caso, los posibles planteamientos de las hipótesis con sus correspondientes estadísticas de

prueba y regiones de rechazo utilizando la distribución de student, se presentan en el siguientecuadro.Hipótesis

nula Hipótesis

alternativa Medida Estadística dePrueba Región de rechazo ≠ ̅

1 1

2 −+−+−

|| > ⁄ , > > , < < ,

EjemploSe llevó a cabo un experimento para comparar el deterioro abrasivo de dos materiales laminadosdiferentes. Se probaron doce piezas del material 1, exponiendo cada una a una máquina para medir

el deterioro. De la misma manera, se probaron diez piezas del material 2. En cada caso, se observó la

profundidad del deterioro. Las muestras del material 1 dieron un deterioro promedio (registrado)

de 85 unidades con una desviación estándar muestral de 4, mientras que las muestras del material 2dieron un promedio de 81 y una desviación estándar muestral de 5. ¿Puede concluirse en el nivel de


16/22


significancia de 0.05 que el deterioro abrasivo del material 1 excede al del material 2 por más de dos

unidades? Asuma que las poblaciones son aproximadamente normales con varianzas iguales.

SoluciónSi

y

representan las medias poblacionales de los deterioros abrasivos para el material 1 y 2

respectivamente, entonces se tienen las hipótesis siguientes:

: 2 : > 2 Se trata de una prueba de hipótesis de una cola a la derecha con 0.05 y 12 10 2 20 grados de libertad. De la tabla de distribución de student se obtiene el valor crítico de 1.725.De la información del ejemplo se tiene que:

̅ 85

4

12

̅ 81 5 10 La medida estadística de prueba es:

1116 9251 2 1 0 2 4.478 ̅ ̅ 1 1

85 81 24.478 112 110 1.04

La medida estadística de prueba 1.04 es menor que el valor crítico 1.725 por lo que cae en la región

de aceptación y se acepta la hipótesis nula.

Decisión: No se está en condiciones de concluir que el deterioro abrasivo del material 1 excede al del

material 2 por más de dos unidades, la muestra no aporta evidencia para esta conclusión.

EjemploSe deben eliminar gases ácidos de otros gases de refinería en una instalación de productos químicos,esto para reducir al mínimo la corrosión de las plantas. Dos métodos para eliminar estos gases

produjeron el ritmo de corrosión (mm./año), medidas que se representan a continuación:

Método A: 0.3, 0.7, 0.5, 0.8, 0.9, 0.7, 0.8Método B: 0.7, 0.8, 0.7, 0.6, 2.1, 0.6, 1.4, 2.3

¿Se puede concluir que el método A tiene una media menor en el ritmo de corrosión que el métodoB? Justifique estadísticamente con un nivel de significancia de 0.1. ¿Qué hipótesis se deben hacer para

comprobar la validez de la respuesta?

0 1.7251.04 t

0.45


17/22


Solución

Se desea probar la hipótesis:

: : < Equivalente a:

: 0 : < 0 La información que se tiene es: ̅ 0.6714 0.0424 7 ̅ 1.15 0.4886 8

1 1 2 7 10.0424 8 10.48867 8 2 0.2827

Para poder utilizar el estadístico de prueba descrito previamente es necesario realizar los siguientes

supuestos: Las muestras aleatorias provienen de poblaciones con distribución normal y son

independientes.

Las poblaciones tienen desviaciones estándar iguales, o sea .Luego, el estadístico de prueba es:

̅ ̅ 1 ⁄ 1 ⁄ () 0.67141.15 1 7⁄ 1 8⁄ 0.2827 1.7392

Como 0.10, el valor crítico es ,+− ., 1.35. Como la estadística de prueba estal que < ., entonces se rechaza , es decir, los datos presentan evidencia para concluir queel método A tiene una media en el ritmo de corrosión más baja que el método B.

Caso 2: ≠ En este caso, los posibles planteamientos de las hipótesis con sus correspondientes estadísticas de

prueba y regiones de rechazo utilizando la distribución t de student, se presentan en el siguiente

cuadro.

Hipótesisnula Hipótesisalternativa Medida Estadística dePrueba Región de rechazo ≠ ̅

donde

⁄ 1

( )

1

|| > ⁄ , > > ,

< < ,


18/22


EjemploUn fabricante de unidades reproductoras de video está probando el diseño de dos microcircuitos

para determinar si producen un flujo de corriente medio equivalente. El departamento de ingenieríade desarrollo ha obtenido los siguientes datos:

Para el Diseño 1

15

̅ 24.2

10

Para el Diseño 2 10 23.9 20 Se desea determinar si hay alguna diferencia en el flujo de corriente medio entre los dos diseños,

donde se supone que las poblaciones tienen distribución normal, pero no se desea suponer que las

varianzas son iguales. Utiliza un nivel de significancia de 0.1 para dar respuesta a esta hipótesis.

SoluciónLa hipótesis de interés a probar es:

: : ≠ Ya que se considera que los datos de las muestras provienen de distribuciones normales, además lasvarianzas son desconocidas y diferentes, el estadístico de prueba adecuado a emplear es:

24.2 23.9 1015 2010

0.31.632993 0.184

⁄ 1 ( ) 1 1015 2010

101514 20109 7.111

0.0320.444 14.93

es decir 15 pues el valor de se redondea al entero más cercano.El valor crítico es , ., 1.753 y como el estadístico de prueba es tal que || < /, seconcluye que no se rechaza por lo que los datos no proporcionan evidencia suficiente paraconcluir que existe diferencia entre las medias.

Una vez presentada la condición i) se abordará a continuación la condición ii) que tiene las siguientes

características:

Las distribuciones poblacionales son desconocidas Las desviaciones estándar y son desconocidas Los tamaños de las muestras son mayores o iguales a 30 y,

Las muestras son independientes.

Como las desviaciones estándar son desconocidas se estiman con las desviaciones muestrales por ser estos estimadores consistentes de sus desviaciones estándar poblacionalesrespectivas. Por ello pueden ser tratadas como desviaciones estándar poblacionales conocidas, lo que

permite utilizar la estadística de prueba y regiones de rechazo presentadas en la tabla siguiente:


19/22


Hipótesisnula

H0

Hipótesisalternativa Medida Estadísticade Prueba Región de rechazo

≠ ̅

|| > ⁄

>

>

< < Esta tabla es exactamente la misma que la empleada en el caso cuando las muestras provienen dedistribuciones normales y sus desviaciones estándares son conocidas.

Prueba de hipótesis para la diferencia de proporciones

Intervalo de confianza para diferencia de proporciones poblacionales

, con muestras

mayores o iguales a 30.Cuando se tienen dos poblaciones en las cuales el interés radica en comparar las proporciones, al

igual que como se hizo con la diferencia de medias poblacionales, se realiza considerado un

estimador insesgado para la diferencia de proporciones y este estimador es ̂ ̂, con̂ y ̂ , donde es el número de éxitos obtenido del tamaño de muestra de unapoblación con distribución y es el número de éxitos obtenido del tamaño demuestra de una población con distribución .En el siguiente cuadro se presentan los posibles planteamientos de las hipótesis nula y alterna, lamedida estadística de prueba utilizando la distribución normal estándar, así como, las regiones de

rechazo correspondientes.

Hipótesisnula Hipótesisalternativa Medida Estadísticade Prueba Región de rechazo ≠ ̂ ̂ ̂ 1 1

̂ 1 ̂

|| > ⁄ > > < <

EjemploConsidere un proceso de producción que tiene una fracción defectuosa desconocida. A esteproceso se le realizan unas mejoras para reducir el porcentaje de defectuosos que está produciendo,

y queremos saber si estos cambios sí reducen sustancialmente la proporción de artículos defectuosos

del proceso. Para ello, se toma una muestra de 200 artículos del proceso original, y se encuentran 12defectuosos, por otro lado se examinan 150 artículos del nuevo proceso y se observan 6 defectuosos.

¿Cree usted que los cambios efectuados al proceso han reducido el porcentaje de artículosdefectuosos? Use un nivel de confianza del 95%.

SoluciónSean

y

proporciones poblacionales del proceso original y del nuevo respectivamente, entonces

se desea probar la hipótesis:


20/22


: : > Los datos que se tienen son

12 6 200 150 por lo que las proporciones muestrales son

̂ 0.06 y ̂ 0.04 y además

̂ 1 2 6200150 0.05143

Ya que las muestras son grandes el estadístico de prueba adecuado es:

̂ ̂ ̂ 1 1 0.060.04 0.051430.94857 1200 1150

0.020.02386 0.8382

El valor crítico es . 1.64 y como el valor del estadístico es tal que < 1.64 entoncesla hipótesis nula no puede ser rechazada, es decir, los datos no presentan evidencia para concluir que

los cambios efectuados al proceso ayudan a disminuir el porcentaje de defectuosos con una confianzadel 95%.

Prueba de hipótesis para el cociente de varianzasPrueba de hipótesis para la igualdad de varianzas , poblaciones con distribuciónnormal.

Cuando nuestro objetivo es el de comparar las medias de dos poblaciones con distribución normal,el parámetro que se estudia es la diferencia de medias, ahora, si el objetivo es el de comparar las

variabilidad de las poblaciones, el parámetro que se estudia es el cociente de varianzas, , lajustificación es que en distribuciones muestrales se comprueba que el estadístico

tiene unadistribución −,− ( tamaño de muestra de y tamaño de muestra de ); en particular si o bien 1, entonces tiene la misma distribución de Fisher. En cambio no hay taljustificación si se usa diferencia de varianzas.En el siguiente cuadro se presentan los posibles planteamientos de las hipótesis con suscorrespondientes estadísticas de prueba y regiones de rechazo utilizando la distribución de Fisher.


21/22


Hipótesisnula Hipótesisalternativa Medida Estadísticade Prueba Región de rechazo

≠

con

1

grados de libertad enel numerador y 1 grados de

libertad en el

denominador.

< ⁄ ,,

ó

> ⁄ ,, > > ,, < < 1 ,,

La notación , indica que se debe considerar el valor crítico de la tabla F-Fisher con gradosde libertad en el numerador, grados de libertad en el denominador y con un nivel de significancia.En las siguientes gráficas se presentan los diferentes casos de pruebas de hipótesis de una cola y dedos colas, así como las fórmulas para calcular los valores críticos; también se muestran las regiones

de rechazo identificadas como la parte sombreada. En el caso de pruebas de hipótesis de una cola, yasea a la izquierda o a la derecha, el nivel de significancia es el valor de α mientras que cuando la

prueba de hipótesis es de dos colas el nivel de significancia es /2.

Región de rechazo para la prueba de hipótesis cuando : <

Región de rechazo para la prueba de hipótesis cuando : >

f

f

a


22/22


Región de rechazo para la prueba de hipótesis cuando : ≠ Ejemplo

Un médico asegura que la variabilidad entre el peso de las niñas ( ) y los niños () es diferente. Paracomprobar estadísticamente dicha afirmación se realiza el experimento de seleccionar dos muestras,una de 10 niñas y otra de 8 niños, de los cuales se tuvieron varianzas de 2.1 y 3.21 ,respectivamente. ¿Presentan las varianzas muestrales suficiente evidencia que indique que laafirmación del médico es cierta? Compruebe con un nivel de significancia de 0.1

Solución

Se desea probar la hipótesis

: : ≠ Supóngase que las poblaciones tienen distribuciones que son razonablemente monticulares y que

por lo tanto satisfacen la suposición de que las poblaciones son normales, dado esto el siguiente

proceso es válido, estadísticamente.

El estadístico de prueba es

2.13.21 0.6542

Se sabe que la región de rechazo es para cualquier valor que cumple cualquiera de los siguientescasos: > ,−,− o < ,−,−

−.

Se tiene que: ,−,− .,, 3.68 ,−,−− ( .,,)− 3.29− 0.3039.

Como el estadístico f no cumple con ninguna de las condiciones entonces no pertenece a la región derechazo. Como consecuencia no hay suficiente evidencia para concluir que la variación en pesos entre

los niños difiera con respecto a la variación en el peso entre las niñas con 90% de confianza. Los datosno apoyan a la hipótesis que plantea el médico.

f

Unidad IV. Pruebas de Hipótesis

Documents

Transcript of Unidad IV. Pruebas de Hipótesis

Pruebas de-hipótesis-1

Pruebas de Hipótesis (1)

PRUEBAS DE HIPÓTESIS

Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

Lectura 2 - Pruebas de HipóTesis

Pruebas de hipótesis

Pruebas de Hipótesis parametricas

IV Unidad Las Hipótesis

Pruebas de hipótesis u32

Pruebas de Hipótesis Estadísticas

Pruebas de-hipótesis

Pruebas hipótesis correg

02 - Pruebas de hipótesis bivariadas

Introducción a las pruebas de hipótesis

Clases 4 Pruebas de Hipótesis

Selección de pruebas de hipótesis

Bioestadística. Pruebas de hipótesis 1 Bioestadística Tema: Pruebas de hipótesis.

Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO.

Pruebas de hipótesis. ¿Qué son las pruebas de hipótesis? Hipótesis (formulación coloquial) Las mujeres fuman más que los hombres Hipótesis (en términos.

Pruebas de hipótesis Por mi