Clase 12 - Prueba de Hipotesis

17
PRUEBAS DE HIPOTESIS I.- INTRODUCCION El objetivo de la prueba de hipótesis es probar la validez de una aseveración acerca de un parámetro poblacional mediante el desarrollo de un procedimiento. Se aplican métodos para tomar decisiones sobre poblacionales a partir de los resultados de una muestra aleatoria escogida de esa población. Para llegar a tomar decisiones estadísticas se debe partir de afirmaciones con respecto a la población en la que estamos interesados, donde tales suposiciones pueden ser verdaderas o no. Una afirmación hecha sobre una población o sobre sus parámetros deberá ser sometidas a comprobación experimental con el propósito de saber si los resultados de una muestra aleatoria extraída de esa población contradice o no tal afirmación. 2.- HIPOTESIS ESTADISTICAS Una hipótesis Estadísticas es una declaración sobre el valor de un parámetro de la población desarrollado con el fin de ponerlo a prueba. Una hipótesis Estadísticas es cualquier información o suposición que se hace acerca del tipo de distribución de probabilidad de la población o el valor o valores de uno o más parámetros de la población. Ejemplos: El sueldo inicial medio de los egresados de un estudio de administración de cuatro años es $2200 mensuales

description

Estadistica I

Transcript of Clase 12 - Prueba de Hipotesis

Page 1: Clase 12 - Prueba de Hipotesis

PRUEBAS DE HIPOTESIS

I.- INTRODUCCION

El objetivo de la prueba de hipótesis es probar la validez de una aseveración acerca de un

parámetro poblacional mediante el desarrollo de un procedimiento. Se aplican métodos para

tomar decisiones sobre poblacionales a partir de los resultados de una muestra aleatoria

escogida de esa población. Para llegar a tomar decisiones estadísticas se debe partir de

afirmaciones con respecto a la población en la que estamos interesados, donde tales

suposiciones pueden ser verdaderas o no. Una afirmación hecha sobre una población o

sobre sus parámetros deberá ser sometidas a comprobación experimental con el propósito

de saber si los resultados de una muestra aleatoria extraída de esa población contradice o no

tal afirmación.

2.- HIPOTESIS ESTADISTICAS

Una hipótesis Estadísticas es una declaración sobre el valor de un parámetro de la

población desarrollado con el fin de ponerlo a prueba.

Una hipótesis Estadísticas es cualquier información o suposición que se hace acerca del

tipo de distribución de probabilidad de la población o el valor o valores de uno o más

parámetros de la población.

Ejemplos:

El sueldo inicial medio de los egresados de un estudio de administración de cuatro

años es $2200 mensuales

El 80% de los que juegan regularmente a la lotería estatal nunca ganan más de $100

en un juego.

La proporción de casas con hábitos de reciclaje es mayor que 0.15

La varianza de los diámetros de ciertos arboles es 0.95 m2

La comisión mensual media de vendedores de computadoras es $2000

3.- DEFINICIONES BASICAS

3.1.- HIPOTESIS: Es una afirmación acerca de un parámetro poblacional.

3.2.- PRUEBA DE HIPOTESIS: Procedimiento basado en la evidencia muestral y la

teoría de probabilidad; se emplea para determinar si la hipótesis es una afirmación

razonable.

Page 2: Clase 12 - Prueba de Hipotesis

Una hipótesis podría ser que la comisión mensual media de vendedores de computadoras es

$2000. No es posible entrevistar a todos los agentes para determinar si en realidad la media

es $2000. El costo de localizar e interrogar a cada vendedor de computadoras seria

exorbitante. Para probar la validez de la afirmación debe seleccionarse una muestra de la

población formada por todos los vendedores de computadoras, calcular valores estadísticos

muéstrales y con base en determinadas reglas de decisión, rechazar o no rechazar la

hipótesis nula.

Para probar una hipótesis; se necesita saber las siguientes definiciones básicas:

Hipótesis Nula H0: Una declaración o afirmación sobre el valor de un parámetro

de la población.

Hipótesis Alternativa H1: Una declaración o afirmación que se acepta si los datos

de la muestra proporcionan evidencia de que la hipótesis nula es falsa.

Nivel de Significancia: La probabilidad de rechazar la hipótesis nula cuando es

verdadera.

Estadístico de Prueba: Un valor determinado a partir de la información muestral,

usado para determinar si se rechaza la hipótesis nula.

Valor Critico: Punto de división entre la región en la que se rechaza la hipótesis

nula y la región en la que no se rechaza la hipótesis nula.

3.3.- ERROR TIPO I y ERROR TIPO II:

El investigador no puede estudiar cada elemento de la población. Por tanto, se investiga a

partir de un tamaño de muestra representativo, donde existe la posibilidad en incurrir en dos

tipos de error:

Error Tipo I: Rechazar la hipótesis nula H0, cuando es verdadera.

El nivel significancia se define como la probabilidad de cometer el error tipo I y se denota

α= P[cometer un error de tipo I]

Error Tipo II: No rechazar la hipótesis nula H0, cuando es falsa.

El nivel significancia se define como la probabilidad de cometer el error tipo II y se denota

β= P[cometer un error de tipo II]

En la siguiente tabla se resumen las decisiones que pueden tomar el investigador y las

consecuencias posibles

Hipótesis Nula Investigador

Page 3: Clase 12 - Prueba de Hipotesis

No se rechaza Ho Se rechaza Ho

Ho es verdadera Decisión Correcta Error de Tipo I

Ho es falsa Error de Tipo II Decisión Correcta

3.4.- PROCEDIMIENTOS PARA REALIZAR UNA PRUEBA DE HIPOTESIS

4.- PRUEBA DE HIPOTESIS DE UNA COLA

Una prueba es de una cola cuando ubicamos la región de rechazo mediante el signo de

desigualdad en la hipótesis alternativa (< o >). La hipótesis alternativa, H1 indica

solamente una dirección.

Ejemplo:

El gerente de ventas de una empresa editorial de libros de texto, afirma que los

representantes de ventas hacen en promedio 40 llamadas semanales a profesores. Varios

representantes consideran que esta estimación es muy baja. Para investigar esto, se toma

una muestra aleatoria de 28 representantes de ventas y se encuentra que la media de

llamadas es 42. La desviación estándar muestral es 2.1 llamadas. Usando el nivel de

significancia de 0.05. ¿Se puede concluir que el número medio de llamadas semanales por

representante es mayor que 40?

Paso 1: Se plantean las

hipótesis nula y alternativa

Paso 2: Se selecciona el

nivel de significancia

Paso 3: Se identifica el

estadístico de prueba

Paso 4: Se formula la regla

de decisión

Paso 5: Conclusión

Page 4: Clase 12 - Prueba de Hipotesis

u = Número medio de llamadas semanales por representante

H0: u ≤ 40

H1: u > 40

Nivel de significancia: α=0.05

Valor crítico: 1.645

Ejemplos:

H0: Las comisiones anuales ganadas por corredores de bienes a tiempo completo

son a lo más de $35000. (µ≤$35000)

H1: Las comisiones anuales ganadas por corredores de bienes a tiempo completo

son más de $35000. (µ>$35000)

H0: La velocidad de autos que viajan en la ciudad es por lo menos de 60 millas por

hora. (µ≥60)

H1: La velocidad de autos que viajan en la ciudad es menos de 60 millas por hora.

(µ<60)

H0: Al menos el 20% de los clientes pagan en efectivo su consumo de gasolina.

(p≥0.20)

H1: Menos del 20% de los clientes pagan en efectivo su consumo de gasolina.

(p<0.20)

5.- PRUEBAS DE SIGNIFICANCIA DE DOS COLAS

Re gion de Re chazo α=0. 05

zα=1.6450

no se rechaza H 0

Page 5: Clase 12 - Prueba de Hipotesis

Una prueba es con dos colas cuando no se especifica ninguna dirección en la hipótesis

alterna H1

Ejemplo:

De acuerdo con el presidente del sindicato local, el ingreso bruto medio de plomeros en el

área tiene una distribución normal, con una media de $30000 y una desviación estándar de

$3000. Recientemente, un reportero de investigación para un canal de televisión encontró,

en una muestra de 120 plomeros, que el ingreso medio bruto es de $30500. Al nivel de

significancia de 0.05, ¿se puede concluir que el ingreso medio bruto no es igual a $30000?

u = Ingreso medio bruto de plomeros

H0: u = 40

H1: u ≠ 40

Nivel de significancia: α=0.05

Región de rechazo: 0.025

Valores críticos: -1.96 y 1.96

Ejemplos:

H0: La cantidad pagada por los clientes en el centro comercial es igual a $25.

(µ=$25).

H1: La cantidad pagada por los clientes en el centro comercial no es igual a $25.

(µ≠$25).

H0: El precio de un galón de gasolina es igual a $1.54. (µ≠$1.54).

H1: El precio de un galón de gasolina no es igual a $1.54. (µ≠$1.54).

6.- PRUEBA DE HIPOTESIS ACERCA DE LA MEDIA DE UNA POBLACIÓN

no se rechaza H 0

zα /2=−1.96 zα /2=1.96

Re gion de Re chazoα2=0.025Re gion de Re chazo

α2=0. 025

Page 6: Clase 12 - Prueba de Hipotesis

NORMAL CON VARIANZA POBLACIONAL CONOCIDA

Sea X1, X2, …., Xn una muestra aleatoria tomada de una población N(u, σ2), donde, σ2 es

conocida

6.1.- Contraste Unilateral hacia la Derecha

Hipótesis:

Nivel de Significancia:

Estadígrafo de Contraste:

Región crítica: La región critica de la prueba de tamaño α será de la forma:

Se rechaza Ho si:

6.2.- Contraste Unilateral hacia la Izquierda

Hipótesis:

Nivel de Significancia:

Estadígrafo de Contraste:

Región crítica: La región critica de la prueba de tamaño α será de la forma:

Se rechaza Ho si:

H0 :u≤u0 vs H1 :u>u0

Z=x̄−u0

σ /√n

α (0<α<1 )

C={x>μ0+σ√n

Zα}={z=x̄−μ0

σ√n

>Zα}Z>Zα

Z0

1−α

α

H0 :u≥u0 vs H1 :u<u0

α (0<α<1 )

Z=x̄−u0

σ /√n

C={x<μ0−σ√n

Zα}={z= x̄−μ0

σ /√n<−Zα}

Z<−Zα

Page 7: Clase 12 - Prueba de Hipotesis

6.3.- Contraste Bilateral

Hipótesis:

Nivel de Significancia:

Estadígrafo de Contraste:

Región crítica: La región crítica será de la forma:

Se rechaza Ho si:

7.- PRUEBA DE HIPOTESIS ACERCA DE LA MEDIA DE UNA POBLACIÓN

Z −zα

α

0

1−α

H0 :u=u0 vs H1 :u≠u0

α (0<α<1 )

Z=x̄−u0

σ /√n

C={x<μ0−σ√n

Zα /2 o x>μ0+σ√n

Zα /2}={|Z|=|x−u0

σ /√n|>Zα /2}

|Z|>Zα /2

−zα /2 zα /20

Re gion de aceptacionRe gion critica

α2

Re gion criticaα2

Page 8: Clase 12 - Prueba de Hipotesis

NORMAL CON VARIANZA POBLACIONAL DESCONOCIDA

Sea X1, X2, …., Xn una muestra aleatoria tomada de una población N(u, σ2), donde, u y σ2

son desconocidas, y sean:

7.1.- Contraste Bilateral

7.1.1.- Muestras Grandes: n>30

Hipótesis:

Nivel de Significancia:

Estadígrafo de Contraste:

Región critica:

Se rechaza Ho si:

7.1.2.- Muestras Pequeñas: n≤30

Hipótesis:

Nivel de Significancia:

Estadígrafo de Contraste:

Región critica:

Se rechaza Ho si:

X=∑i=1

n

X i

n1

S2=∑i=1

n

( X i−X )2

n−1

H0 :u=u0 vs H1 :u≠u0

α (0<α<1 )

Z=x̄−u0

S /√n

C={|Z|=|x−u0

S /√n|>Zα /2}

|Z|>Zα /2

H0 :u=u0 vs H1 :u≠u0

α (0<α<1 )

T=x̄−u0

S /√n

C={|T|=|x−u0

S /√n|> tα /2, (n−1)}

|T|>tα /2 , (n−1)

Page 9: Clase 12 - Prueba de Hipotesis

7.2.- Contraste Unilateral

7.2.1.- Muestras Grandes: n>30

Hipótesis:

Nivel de Significancia:

Estadígrafo de Contraste:

Región critica:

Se rechaza Ho si:

7.2.2.- Muestras Pequeñas: n≤30

Hipótesis:

Nivel de Significancia:

Estadígrafo de Contraste:

Región critica:

Se rechaza Ho si:

0

1−αα2

α2

−t α /2, (n−1) t α /2, (n−1)

H0 :u≤u0 vs H1 :u>u0

α (0<α<1 )

Z=x̄−u0

S /√n

C={x>μ0+S√n

Zα}={z=x̄−μ0

S/√n>Zα}

Z>Zα

H0 :u≤u0 vs H1 :u>u0

T=x̄−u0

S /√n

α (0<α<1 )

C={x>μ0+S√n

tα , (n−1)}={T=x̄−μ0

S /√n> tα , (n−1)}

T> tα , (n−1)

Page 10: Clase 12 - Prueba de Hipotesis

8.- PRUEBA DE HIPOTESIS ACERCA DE UNA PROPORCION

Sea X1, X2, …, Xn una muestra aleatoria de una población Bernoulli B(1, p) donde p es la

proporción poblacional. El estimador máximo verosímil de p es:

Para n suficientemente grande n>30, se sabe que:

8.1.- Contraste Bilateral

Hipótesis:

Nivel de Significancia:

Estadígrafo de Contraste:

Región critica:

Se rechaza Ho si:

T0 t α , (n−1)

1−α

α

p¿

=

∑i=1

n

X i

n =Numero de exito en la muestra

n

p¿

≈N ( p ,p(1−p )

n)

H0 : p=p0 vs H1 : p≠p0

α (0<α<1 )

Z=p¿

−p0

√ p0(1−p0 )n

C={|Z|=|p¿

−p0

√ p0 (1−p0 )n

|>Zα /2}|Z|>Zα /2

Page 11: Clase 12 - Prueba de Hipotesis

8.2.- Contraste Unilateral

Hipótesis:

Nivel de Significancia:

Estadígrafo de Contraste:

Región critica:

Se rechaza Ho si: Z>Zα /2

α2

α2

−zα /2 zα /20

1−α

H0 : p≤p0 vs H1 : p> p0

α (0<α<1 )

Z=p¿

−p0

√ p0(1−p0 )n

C={p¿

> p0+Zα √ p0(1−p0)n }={z=

p¿

−p0

√ p0 (1−p0 )n

>Zα}

ZZα0

α

1−α

Page 12: Clase 12 - Prueba de Hipotesis

9.- PRUEBA DE HIPOTESIS ACERCA DE UNA VARIANZA

Sea X1, X2, …., Xn una muestra aleatoria de tamaño n seleccionada de una población

normal con media u y varianza σ2 parámetros desconocidos, y sea la varianza muestral:

Entonces la variable aleatoria tiene distribución chi-cuadrado con n-1 grados de libertad.

Esta estadística se utiliza para obtener la región critica de la prueba de hipótesis acerca de

una varianza

9.1.- Prueba de Hipótesis Unilateral por la Derecha

Hipótesis:

Nivel de Significancia:

Estadígrafo de Contraste:

Región crítica: La región critica de la prueba de tamaño α será de la forma:

9.2.- Prueba de Hipótesis Unilateral por la Izquierda:

Hipótesis:

Nivel de Significancia:

Estadígrafo de Contraste:

Región crítica:

9.3.- Prueba de Hipótesis Bilateral:

Hipótesis:

Nivel de Significancia:

S2=∑i=1

n

( X i−X )2

n−1

χ2=(n−1)S

2

σ o

2≈ χ2(n−1)

H0 :σ2

≤σ o

2

vs H1 :σ2

>σ o

2

χ2=(n−1)S

2

σ o

2

α (0<α<1 )

C={ χ 2

> χ α (n−1 )

2 }

H0 :σ2

≥σ o

2

vs H1 :σ2

<σ o

2

χ2=(n−1)S

2

σ o

2

α (0<α<1 )

C={ χ2< χ α (n−1)2 }

H0 :σ2

=σ o

2

vs H1 :σ2

≠σ o

2

α (0<α<1 )

Page 13: Clase 12 - Prueba de Hipotesis

Estadígrafo de Contraste:

Región crítica:

10.- VALOR DE p EN LA PRUEBA DE HIPOTESIS

Valor-p es la probabilidad de observar un valor muestral tan extremo, que el valor observado, dado

que la hipótesis nula es verdadera.

Si el valor-p es más pequeño que el nivel de significancia, se rechaza H0. (p<α)

Si el valor-p es más grande que el nivel de significancia, H0 no se rechaza. (p>α)

Calculo del Valor de p

Prueba de una cola: valor-p = P{z ≥valor absoluto del estadístico de prueba}

Prueba de dos colas: valor-p = 2P{z ≥ valor absoluto del estadístico de prueba}

Ejemplo:

χ2

=(n−1)S

2

σ o

2

C={ χ 2

=(n−1)S

2

σ o

2 < χ (1−α2

)(n−1)

2

o χ2

> χ (1−α2

)(n−1)

2 }

0χ ( α

2)(n−1 )

2

χ (1−α2

)(n−1)

2

Zα /2=−2. 58 Z1=1 .55 Zα /2=2 . 580

Page 14: Clase 12 - Prueba de Hipotesis

P (Z>Z1 )=P (Z>1.55 )=0.5−P ( Z ≤ 1.55 )=0.5−0.4394=0.0606

Parta calcular el valor de p, se necesita considerar la región de los valores mayores y menores de

1.55 (debido que la región de rechazo se encuentra en ambas colas).

Como la distribución es de dos colas se usa la formula:

Valor−p=2 P (Z ≥ Z1 )=2∗0.0606=0.1212

No se rechaza Ho si: p>α entonces 0.1212 > 0.01