Clase 12 - Prueba de Hipotesis
-
Upload
christianantonio -
Category
Documents
-
view
14 -
download
0
description
Transcript of Clase 12 - Prueba de Hipotesis
PRUEBAS DE HIPOTESIS
I.- INTRODUCCION
El objetivo de la prueba de hipótesis es probar la validez de una aseveración acerca de un
parámetro poblacional mediante el desarrollo de un procedimiento. Se aplican métodos para
tomar decisiones sobre poblacionales a partir de los resultados de una muestra aleatoria
escogida de esa población. Para llegar a tomar decisiones estadísticas se debe partir de
afirmaciones con respecto a la población en la que estamos interesados, donde tales
suposiciones pueden ser verdaderas o no. Una afirmación hecha sobre una población o
sobre sus parámetros deberá ser sometidas a comprobación experimental con el propósito
de saber si los resultados de una muestra aleatoria extraída de esa población contradice o no
tal afirmación.
2.- HIPOTESIS ESTADISTICAS
Una hipótesis Estadísticas es una declaración sobre el valor de un parámetro de la
población desarrollado con el fin de ponerlo a prueba.
Una hipótesis Estadísticas es cualquier información o suposición que se hace acerca del
tipo de distribución de probabilidad de la población o el valor o valores de uno o más
parámetros de la población.
Ejemplos:
El sueldo inicial medio de los egresados de un estudio de administración de cuatro
años es $2200 mensuales
El 80% de los que juegan regularmente a la lotería estatal nunca ganan más de $100
en un juego.
La proporción de casas con hábitos de reciclaje es mayor que 0.15
La varianza de los diámetros de ciertos arboles es 0.95 m2
La comisión mensual media de vendedores de computadoras es $2000
3.- DEFINICIONES BASICAS
3.1.- HIPOTESIS: Es una afirmación acerca de un parámetro poblacional.
3.2.- PRUEBA DE HIPOTESIS: Procedimiento basado en la evidencia muestral y la
teoría de probabilidad; se emplea para determinar si la hipótesis es una afirmación
razonable.
Una hipótesis podría ser que la comisión mensual media de vendedores de computadoras es
$2000. No es posible entrevistar a todos los agentes para determinar si en realidad la media
es $2000. El costo de localizar e interrogar a cada vendedor de computadoras seria
exorbitante. Para probar la validez de la afirmación debe seleccionarse una muestra de la
población formada por todos los vendedores de computadoras, calcular valores estadísticos
muéstrales y con base en determinadas reglas de decisión, rechazar o no rechazar la
hipótesis nula.
Para probar una hipótesis; se necesita saber las siguientes definiciones básicas:
Hipótesis Nula H0: Una declaración o afirmación sobre el valor de un parámetro
de la población.
Hipótesis Alternativa H1: Una declaración o afirmación que se acepta si los datos
de la muestra proporcionan evidencia de que la hipótesis nula es falsa.
Nivel de Significancia: La probabilidad de rechazar la hipótesis nula cuando es
verdadera.
Estadístico de Prueba: Un valor determinado a partir de la información muestral,
usado para determinar si se rechaza la hipótesis nula.
Valor Critico: Punto de división entre la región en la que se rechaza la hipótesis
nula y la región en la que no se rechaza la hipótesis nula.
3.3.- ERROR TIPO I y ERROR TIPO II:
El investigador no puede estudiar cada elemento de la población. Por tanto, se investiga a
partir de un tamaño de muestra representativo, donde existe la posibilidad en incurrir en dos
tipos de error:
Error Tipo I: Rechazar la hipótesis nula H0, cuando es verdadera.
El nivel significancia se define como la probabilidad de cometer el error tipo I y se denota
α= P[cometer un error de tipo I]
Error Tipo II: No rechazar la hipótesis nula H0, cuando es falsa.
El nivel significancia se define como la probabilidad de cometer el error tipo II y se denota
β= P[cometer un error de tipo II]
En la siguiente tabla se resumen las decisiones que pueden tomar el investigador y las
consecuencias posibles
Hipótesis Nula Investigador
No se rechaza Ho Se rechaza Ho
Ho es verdadera Decisión Correcta Error de Tipo I
Ho es falsa Error de Tipo II Decisión Correcta
3.4.- PROCEDIMIENTOS PARA REALIZAR UNA PRUEBA DE HIPOTESIS
4.- PRUEBA DE HIPOTESIS DE UNA COLA
Una prueba es de una cola cuando ubicamos la región de rechazo mediante el signo de
desigualdad en la hipótesis alternativa (< o >). La hipótesis alternativa, H1 indica
solamente una dirección.
Ejemplo:
El gerente de ventas de una empresa editorial de libros de texto, afirma que los
representantes de ventas hacen en promedio 40 llamadas semanales a profesores. Varios
representantes consideran que esta estimación es muy baja. Para investigar esto, se toma
una muestra aleatoria de 28 representantes de ventas y se encuentra que la media de
llamadas es 42. La desviación estándar muestral es 2.1 llamadas. Usando el nivel de
significancia de 0.05. ¿Se puede concluir que el número medio de llamadas semanales por
representante es mayor que 40?
Paso 1: Se plantean las
hipótesis nula y alternativa
Paso 2: Se selecciona el
nivel de significancia
Paso 3: Se identifica el
estadístico de prueba
Paso 4: Se formula la regla
de decisión
Paso 5: Conclusión
u = Número medio de llamadas semanales por representante
H0: u ≤ 40
H1: u > 40
Nivel de significancia: α=0.05
Valor crítico: 1.645
Ejemplos:
H0: Las comisiones anuales ganadas por corredores de bienes a tiempo completo
son a lo más de $35000. (µ≤$35000)
H1: Las comisiones anuales ganadas por corredores de bienes a tiempo completo
son más de $35000. (µ>$35000)
H0: La velocidad de autos que viajan en la ciudad es por lo menos de 60 millas por
hora. (µ≥60)
H1: La velocidad de autos que viajan en la ciudad es menos de 60 millas por hora.
(µ<60)
H0: Al menos el 20% de los clientes pagan en efectivo su consumo de gasolina.
(p≥0.20)
H1: Menos del 20% de los clientes pagan en efectivo su consumo de gasolina.
(p<0.20)
5.- PRUEBAS DE SIGNIFICANCIA DE DOS COLAS
Re gion de Re chazo α=0. 05
zα=1.6450
no se rechaza H 0
Una prueba es con dos colas cuando no se especifica ninguna dirección en la hipótesis
alterna H1
Ejemplo:
De acuerdo con el presidente del sindicato local, el ingreso bruto medio de plomeros en el
área tiene una distribución normal, con una media de $30000 y una desviación estándar de
$3000. Recientemente, un reportero de investigación para un canal de televisión encontró,
en una muestra de 120 plomeros, que el ingreso medio bruto es de $30500. Al nivel de
significancia de 0.05, ¿se puede concluir que el ingreso medio bruto no es igual a $30000?
u = Ingreso medio bruto de plomeros
H0: u = 40
H1: u ≠ 40
Nivel de significancia: α=0.05
Región de rechazo: 0.025
Valores críticos: -1.96 y 1.96
Ejemplos:
H0: La cantidad pagada por los clientes en el centro comercial es igual a $25.
(µ=$25).
H1: La cantidad pagada por los clientes en el centro comercial no es igual a $25.
(µ≠$25).
H0: El precio de un galón de gasolina es igual a $1.54. (µ≠$1.54).
H1: El precio de un galón de gasolina no es igual a $1.54. (µ≠$1.54).
6.- PRUEBA DE HIPOTESIS ACERCA DE LA MEDIA DE UNA POBLACIÓN
no se rechaza H 0
zα /2=−1.96 zα /2=1.96
Re gion de Re chazoα2=0.025Re gion de Re chazo
α2=0. 025
NORMAL CON VARIANZA POBLACIONAL CONOCIDA
Sea X1, X2, …., Xn una muestra aleatoria tomada de una población N(u, σ2), donde, σ2 es
conocida
6.1.- Contraste Unilateral hacia la Derecha
Hipótesis:
Nivel de Significancia:
Estadígrafo de Contraste:
Región crítica: La región critica de la prueba de tamaño α será de la forma:
Se rechaza Ho si:
6.2.- Contraste Unilateral hacia la Izquierda
Hipótesis:
Nivel de Significancia:
Estadígrafo de Contraste:
Región crítica: La región critica de la prueba de tamaño α será de la forma:
Se rechaza Ho si:
H0 :u≤u0 vs H1 :u>u0
Z=x̄−u0
σ /√n
α (0<α<1 )
C={x>μ0+σ√n
Zα}={z=x̄−μ0
σ√n
>Zα}Z>Zα
Z0
1−α
α
zα
H0 :u≥u0 vs H1 :u<u0
α (0<α<1 )
Z=x̄−u0
σ /√n
C={x<μ0−σ√n
Zα}={z= x̄−μ0
σ /√n<−Zα}
Z<−Zα
6.3.- Contraste Bilateral
Hipótesis:
Nivel de Significancia:
Estadígrafo de Contraste:
Región crítica: La región crítica será de la forma:
Se rechaza Ho si:
7.- PRUEBA DE HIPOTESIS ACERCA DE LA MEDIA DE UNA POBLACIÓN
Z −zα
α
0
1−α
H0 :u=u0 vs H1 :u≠u0
α (0<α<1 )
Z=x̄−u0
σ /√n
C={x<μ0−σ√n
Zα /2 o x>μ0+σ√n
Zα /2}={|Z|=|x−u0
σ /√n|>Zα /2}
|Z|>Zα /2
−zα /2 zα /20
Re gion de aceptacionRe gion critica
α2
Re gion criticaα2
NORMAL CON VARIANZA POBLACIONAL DESCONOCIDA
Sea X1, X2, …., Xn una muestra aleatoria tomada de una población N(u, σ2), donde, u y σ2
son desconocidas, y sean:
7.1.- Contraste Bilateral
7.1.1.- Muestras Grandes: n>30
Hipótesis:
Nivel de Significancia:
Estadígrafo de Contraste:
Región critica:
Se rechaza Ho si:
7.1.2.- Muestras Pequeñas: n≤30
Hipótesis:
Nivel de Significancia:
Estadígrafo de Contraste:
Región critica:
Se rechaza Ho si:
X=∑i=1
n
X i
n1
S2=∑i=1
n
( X i−X )2
n−1
H0 :u=u0 vs H1 :u≠u0
α (0<α<1 )
Z=x̄−u0
S /√n
C={|Z|=|x−u0
S /√n|>Zα /2}
|Z|>Zα /2
H0 :u=u0 vs H1 :u≠u0
α (0<α<1 )
T=x̄−u0
S /√n
C={|T|=|x−u0
S /√n|> tα /2, (n−1)}
|T|>tα /2 , (n−1)
7.2.- Contraste Unilateral
7.2.1.- Muestras Grandes: n>30
Hipótesis:
Nivel de Significancia:
Estadígrafo de Contraste:
Región critica:
Se rechaza Ho si:
7.2.2.- Muestras Pequeñas: n≤30
Hipótesis:
Nivel de Significancia:
Estadígrafo de Contraste:
Región critica:
Se rechaza Ho si:
0
1−αα2
α2
−t α /2, (n−1) t α /2, (n−1)
H0 :u≤u0 vs H1 :u>u0
α (0<α<1 )
Z=x̄−u0
S /√n
C={x>μ0+S√n
Zα}={z=x̄−μ0
S/√n>Zα}
Z>Zα
H0 :u≤u0 vs H1 :u>u0
T=x̄−u0
S /√n
α (0<α<1 )
C={x>μ0+S√n
tα , (n−1)}={T=x̄−μ0
S /√n> tα , (n−1)}
T> tα , (n−1)
8.- PRUEBA DE HIPOTESIS ACERCA DE UNA PROPORCION
Sea X1, X2, …, Xn una muestra aleatoria de una población Bernoulli B(1, p) donde p es la
proporción poblacional. El estimador máximo verosímil de p es:
Para n suficientemente grande n>30, se sabe que:
8.1.- Contraste Bilateral
Hipótesis:
Nivel de Significancia:
Estadígrafo de Contraste:
Región critica:
Se rechaza Ho si:
T0 t α , (n−1)
1−α
α
p¿
=
∑i=1
n
X i
n =Numero de exito en la muestra
n
p¿
≈N ( p ,p(1−p )
n)
H0 : p=p0 vs H1 : p≠p0
α (0<α<1 )
Z=p¿
−p0
√ p0(1−p0 )n
C={|Z|=|p¿
−p0
√ p0 (1−p0 )n
|>Zα /2}|Z|>Zα /2
8.2.- Contraste Unilateral
Hipótesis:
Nivel de Significancia:
Estadígrafo de Contraste:
Región critica:
Se rechaza Ho si: Z>Zα /2
α2
α2
−zα /2 zα /20
1−α
H0 : p≤p0 vs H1 : p> p0
α (0<α<1 )
Z=p¿
−p0
√ p0(1−p0 )n
C={p¿
> p0+Zα √ p0(1−p0)n }={z=
p¿
−p0
√ p0 (1−p0 )n
>Zα}
ZZα0
α
1−α
9.- PRUEBA DE HIPOTESIS ACERCA DE UNA VARIANZA
Sea X1, X2, …., Xn una muestra aleatoria de tamaño n seleccionada de una población
normal con media u y varianza σ2 parámetros desconocidos, y sea la varianza muestral:
Entonces la variable aleatoria tiene distribución chi-cuadrado con n-1 grados de libertad.
Esta estadística se utiliza para obtener la región critica de la prueba de hipótesis acerca de
una varianza
9.1.- Prueba de Hipótesis Unilateral por la Derecha
Hipótesis:
Nivel de Significancia:
Estadígrafo de Contraste:
Región crítica: La región critica de la prueba de tamaño α será de la forma:
9.2.- Prueba de Hipótesis Unilateral por la Izquierda:
Hipótesis:
Nivel de Significancia:
Estadígrafo de Contraste:
Región crítica:
9.3.- Prueba de Hipótesis Bilateral:
Hipótesis:
Nivel de Significancia:
S2=∑i=1
n
( X i−X )2
n−1
χ2=(n−1)S
2
σ o
2≈ χ2(n−1)
H0 :σ2
≤σ o
2
vs H1 :σ2
>σ o
2
χ2=(n−1)S
2
σ o
2
α (0<α<1 )
C={ χ 2
> χ α (n−1 )
2 }
H0 :σ2
≥σ o
2
vs H1 :σ2
<σ o
2
χ2=(n−1)S
2
σ o
2
α (0<α<1 )
C={ χ2< χ α (n−1)2 }
H0 :σ2
=σ o
2
vs H1 :σ2
≠σ o
2
α (0<α<1 )
Estadígrafo de Contraste:
Región crítica:
10.- VALOR DE p EN LA PRUEBA DE HIPOTESIS
Valor-p es la probabilidad de observar un valor muestral tan extremo, que el valor observado, dado
que la hipótesis nula es verdadera.
Si el valor-p es más pequeño que el nivel de significancia, se rechaza H0. (p<α)
Si el valor-p es más grande que el nivel de significancia, H0 no se rechaza. (p>α)
Calculo del Valor de p
Prueba de una cola: valor-p = P{z ≥valor absoluto del estadístico de prueba}
Prueba de dos colas: valor-p = 2P{z ≥ valor absoluto del estadístico de prueba}
Ejemplo:
χ2
=(n−1)S
2
σ o
2
C={ χ 2
=(n−1)S
2
σ o
2 < χ (1−α2
)(n−1)
2
o χ2
> χ (1−α2
)(n−1)
2 }
0χ ( α
2)(n−1 )
2
χ (1−α2
)(n−1)
2
Zα /2=−2. 58 Z1=1 .55 Zα /2=2 . 580
P (Z>Z1 )=P (Z>1.55 )=0.5−P ( Z ≤ 1.55 )=0.5−0.4394=0.0606
Parta calcular el valor de p, se necesita considerar la región de los valores mayores y menores de
1.55 (debido que la región de rechazo se encuentra en ambas colas).
Como la distribución es de dos colas se usa la formula:
Valor−p=2 P (Z ≥ Z1 )=2∗0.0606=0.1212
No se rechaza Ho si: p>α entonces 0.1212 > 0.01