Post on 13-Sep-2015
description
69
DEPARTAMENTO DE ESTADSTICA Y MATEMTICAS
UNIDAD 3
PRUEBAS DE HIPTESIS
2.2. Dos muestras: Pruebas para diferencia de medias
Se dispone de una muestra aleatoria de tamao n de una poblacin normal X que tiene
media X y varianza 2
X ; tambin se dispone de una muestra aleatoria de tamao m de
una poblacin normal Y que tiene media Y y varianza 2
Y . Queremos comparar las
medias poblacionales. Para ello vamos a realizar las siguientes pruebas
0 0 0 0 0 0
0 0 0
: : :
1) 2) 3)
: : :
X Y X Y X Y
a X Y a X Y a X Y
H D H D H D
vs vs vs
H D H D H D
La estadstica de prueba es X Y . Aceptamos H0 cuando la diferencia entre el valor observado de la estadstica de prueba en la muestra no sea muy diferente del valor
propuesto 0D para X Y . Para buscar diferencias significativas entre estas cantidades
utilizamos la distribucin de X Y para ello es necesario saber la manera en que se tomaron las muestras; es decir, es necesario saber si las muestras son dependientes o
independientes; tambin se requiere conocer como son las distribuciones poblacionales,
saber si las varianzas son o no conocidas y los tamaos muestrales.
2.2.1. Contrastes basados en muestras independientes:
Supongamos que se tienen muestra aleatorias independientes de tamaos n y m de dos
poblaciones X e Y que son normales con medias X y Y y varianzas de una muestra 2
X
y 2Y conocidas. En este caso, la distribucin de la estadstica de prueba es:
0
2 2~ (0,1)
X Y
X Y DZ N
n m
Esta estadstica la utilizaremos para buscar diferencias significativas entre X Y y D0. Con base en esta estadstica se tiene que las regiones crticas de tamao y los valores p para los tres contrastes anteriores son las siguientes:
70
Prueba bilateral.
0 0
0
:
:
X Y
a X Y
H D
vs
H D
En este caso parece razonable rechazar H0 cuando el valor observado para X Y en la
muestra sea suficientemente diferente del valor propuesto 0D para X Y . Entonces,
valores grandes de la estadstica Z en cualquier direccin nos conducen a rechazar H0; por
esta razn,
2 2. . / o RC z z z z z Entonces, rechazamos H0 a favor de Ha y concluimos que 0X Y D cuando
02 2
( ). .c
X Y
x y Dz R C
n m
El valor p para la prueba es:
2 cp valor P Z z
Prueba unilateral derecha.
0 0
0
:
:
X Y
a X Y
H D
vs
H D
En este caso parece razonable rechazar H0 cuando el valor observado para X Y en la
muestra sea suficientemente mayor que el valor propuesto 0D para X Y ; por lo tanto, valores extremos en la cola derecha de la estadstica Z nos conducen a rechazar H0. Por esta
razn, la regin crtica de tamao y el valor p son:
. . /RC z z z
Entonces, rechazamos H0 a favor de Ha y concluimos que 0X Y D cuando
02 2
( ). .c
X Y
x y Dz R C
n m
71
El valor p es:
cp valor P Z z
Prueba unilateral izquierda.
0 0
0
:
:
X Y
a X Y
H D
vs
H D
En este caso parece razonable rechazar H0 cuando el valor observado para X Y en la
muestra sea suficientemente menor que el valor propuesto 0D para X Y ; por esta
razn, la regin crtica y el valor p para un nivel de significancia preestablecido para esta prueba son:
. . /RC z z z
Entonces, rechazamos H0 a favor de Ha y concluimos que 0X Y D cuando
02 2
( ). .c
X Y
x y Dz R C
n m
El valor p es:
cp valor P Z z
Observaciones:
a) Los contrastes anteriores siguen siendo vlidos aun cuando las poblaciones no sean normales, siempre que los tamaos muestrales son grandes.
b) Los contrastes anteriores siguen siendo vlidos aun cuando las varianzas poblacionales
sean desconocidas, en este caso las reemplazamos por las varianzas muestrales 2 XS y 2
YS , pero se requiere que los tamaos muestrales sean grandes. En este caso, la
estadstica de prueba es
02 2
~ (0,1)
X Y
X Y DZ N
S S
n m
Adems, el valor calculado de la estadstica es:
02 2
( )c
X Y
x y Dz
s s
n m
Las regiones crticas y los valores p son los mismos que antes.
72
Ejemplo 4. Se cree que el promedio verbal para el nmero de respuestas correctas para la
prueba SAT para los hombres es mayor que el de las mujeres por ms de 10 puntos. Las
muestras aleatorias para ambos sexos arrojaron los siguientes resultados:
Hombres Mujeres
Tamao muestral = 125 100
Media muestral = 480 460
Desviacin estndar muestral = 60 52
Asuma normalidad.
a) Utilizar un nivel de significancia del 5% para determinar si se encuentra apoyada la creencia por la evidencia muestral. Cul es el p valor?
b) Suponga que la verdadera diferencia es de 11 puntos. Cul es la potencia de la prueba anterior?
Solucin:
Sea X = Calificacin en la prueba verbal SAT para los hombres esta variable tiene una
media poblacional X y una varianza 2
X desconocida. De una muestra aleatoria de
tamao n = 125 se obtiene 480, 60XX S
De una muestra aleatoria de tamao m = 100 de Y que representa la calificacin en la
prueba verbal SAT para los mujeres. Esta variable tiene una media poblacional Y y una
varianza 2Y desconocida. De de la muestra se obtiene 460, 52YY S
Se cree que el promedio para los hombres est por encima del de las mujeres por ms de 10
puntos. Lo anterior lo podemos indicar como 10X Y , pues la cantidad X Y nos
indica en qu cantidad la media poblacional de X est por encima de la de Y. Entonces
a) Utilizar un nivel de significancia del 5% para probar la creencia; para ello, debemos realizar la siguiente prueba de hiptesis:
0 : 10
: 10
X Y
a X Y
H
vs
H
Esta es una prueba unilateral derecha para la diferencia de medias poblacionales de dos
poblaciones independientes con varianzas poblacionales desconocidas y tamaos
muestrales grandes, entonces la estadstica de prueba para el contraste es
0
2 2~ (0,1)
X Y
X Y DZ N
S S
n m
73
La regin crtica es
0.05. . / 1.645RC z z z z
Usando la informacin muestral se obtiene que el valor calculado de la estadstica de
prueba es:
2 2
480 460 ( 10)1.34
60 52
125 100
cz
Como 1.34 . .cz R C entonces no es posible rechazar H0 y esto nos permite inferir que
posible que los hombres superen a las mujeres en esa prueba pero no lo hacen por ms
de 10 puntos.
El valor p para la prueba es:
1.34 0.0901 0.05p valor P Z Entonces rechazamos H0.
b) Si la verdadera diferencia es 11 10X Y , entonces la hiptesis nula es falsa y para
este valor la potencia de la prueba es:
0 0Rechazar / es falsa
1.645 / 11c X Y
Potencia P H H
P Z
Para encontrar esta probabilidad hay que tener en cuenta
2 2
10c
X Y
X YZ
S S
n m
Entonces,
2 2
101.645 / 11X Y
X Y
X YPotencia P
S S
n m
Como la verdadera media no es 10 sino que es 11, entonces la estadstica anterior est
mal estandarizada. Para corregir este problema restamos 1 en el numerador de la parte
izquierda de la expresin anterior y esta misma cantidad se resta al lado derecho, y as se
obtiene que
74
2 2 2 2
2 2
10 1 11.645
11.645 1.51 0.0655
60 52
125 100
X Y X Y
X YPotencia P
S S S S
n m n m
P Z
Ejemplo 4.1. Un fabricante afirma que la tensin de ruptura promedio del hilo A excede a
las hilo B en al menos 12 kilogramos. Para probar esta afirmacin se pusieron a prueba 50
hilos de cada tipo bajo condiciones controladas. El hilo tipo A tuvo una tensin promedio
de 86.7 kilogramos con una desviacin estndar de 6.28; mientras que el hilo tipo B tuvo
una tensin promedio de 77.8 kilogramos con una desviacin estndar de 5.61. Utilice un
nivel de significancia del 5% para probar la afirmacin del fabricante. Encuentre el valor p
de la prueba.
Solucin:
Sea X = La tensin de ruptura del hilo tipo A y X es la tensin de ruptura promedio de
hilo.
Sea Y = La tensin de ruptura del hilo tipo B y Y es la tensin de ruptura promedio de
hilo.
En la muestra aleatoria de tamao n = 50 de X se obtiene 86.7 y 6.28Xx S y en la
muestra de tamao m = 50 de Y se obtiene 77.8 y 5.61Yy S
El fabricante afirma que la resistencia promedio del hilo tipo A excede a la del hilo tipo B
en al menos 12 kilogramos y esto quiere decir que 12X Y , entonces debemos probar
a un nivel de significancia 0.05 lo siguiente:
0 : 12
: 12
X Y
a X Y
H
vs
H
Esta es una prueba unilateral izquierda para la diferencia entre dos medias poblacionales de
poblaciones independientes con varianzas poblaciones desconocidas y tamaos muestrales
grandes; por lo tanto, la estadstica de prueba es:
02 2
~ (0,1)
X Y
X Y DZ N
S S
n m
75
Entonces, la regin critica de para es
0.05. . / 1.645RC z z z
Para tomar la decisin buscamos
2 2 2 2
12 86.7 77.8 122.6031
6.28 5.61
50 50
c
X Y
x yz
S S
n m
Como 2.6031 . .cz R C , entonces rechazamos H0 y concluimos que la afirmacin de
fabricante no es cierta.
Ahora bien, el valor p para esta prueba es:
( 2.6031) 0.0046 0.05cp valor P Z z
Entonces, rechazamos H0.
El caso de varianzas poblacionales desconocidas pero iguales:
Un caso de particular inters es en el que las varianzas poblacionales son desconocidas,
pero podemos suponer que son iguales. En este caso, la estadstica de prueba es:
0( 2)~
1 1n m
p
X Y Dt t
Sn m
Donde,
2 2( 1) ( 1)
2x Y
p
n S m SS
n m
Entonces, las regiones crticas y los valores p para los contrastes alternativos son las
siguientes:
Prueba bilateral:
( 2, 2) ( 2, 2) 2. . / o 2n m n m n m cRC t t t t t p valor P t t
Prueba unilateral derecha.
( , 2) 2. . / n m n m cRC t t t p valor P t t
Prueba unilateral izquierda.
76
( , 2) 2. . / n m n m cRC t t t p valor P t t
En cualquiera de los tres casos anteriores se rechaza H0 cuando . .ct R C donde
0
1 1c
p
x y Dt
Sn m
Ejemplo 5. A finales de la dcada de los setenta se descubri que la sustancia
carcionognica NDMA se formaba durante el proceso de secado de la malta verde, la cual
se empleaba para fabricar cerveza. A principios de los ochenta se desarroll un nuevo
proceso para el secado de la malta, el cual minimizaba la formacin de NDMA. Se tomaron
muestras aleatorias de una cerveza domstica que se fabric empleando ambos procesos, y
se midieron los niveles de NDMA en partes por billn. Los resultados estn en la tabla
adjunta:
Proceso 6 4 5 5 6 5 5 6 4 6 7 4
Anterior
Proceso 2 1 2 2 1 0 3 2 1 0 1 1
propuesto
Si se supone que se muestrearon dos poblaciones normales e independientes con varianzas
iguales, existe alguna razn para creer, a un nivel de significancia del 5% que ha
disminuido la cantidad de NDMA en ms de dos partes por billn con el empleo del nuevo
proceso? Encuentre el p valor para el contraste.
Solucin:
Sea X = Cantidad NDMA que se forma en el secado de la malta verde en el proceso
anterior. Entonces, se puede afirmar que 2~ ( , )XX N
Sea Y = Cantidad NDMA que se forma en el secado de la malta verde en el proceso nuevo.
Entonces, se puede afirmar que 2~ ( , )YY N
En lo anterior se asume que las varianzas poblacionales son iguales. Adems, podemos
asumir independencia entre las poblaciones X e Y.
Ahora bien, X Y representa la reduccin promedio verdadera en partes por billn por el
empleo del nuevo proceso. Entonces nos piden contrastar que la reduccin es superior a dos
partes por billn; esto es hay que realizar el siguiente contraste de hiptesis:
0 : 2
: 2
X Y
a X Y
H
vs
H
77
Para la realizacin de la prueba se toman dos muestras aleatorias independientes de
tamaos 12n y 12m de las poblaciones X e Y, respectivamente. Ahora, de las muestras se obtiene que:
Summary Statistics X Y ------------------------------------------------------------Count 12 12 Average 5.25 1.33333 Variance 0.931818 0.787879 Standard deviation 0.965307 0.887625 Sum 63.0 16.0 ------------------------------------------------------------
Dado que las poblaciones son normales, independientes con varianzas desconocidas pero
iguales, entonces la estadstica de prueba para el contraste es:
0( 2) (20 20 2) (18)~
1 1n m
p
X Y Dt t t t
Sn m
Donde
2 211 11 11 0.931818 11 0.787879
0.9272822 22
x Yp
S SS
Entonces, la regin crtica de tamao 0.05 es:
(0.05,22). . / 1.717RC t t t Ahora, el valor calculado de la estadstica de prueba es:
05.25 1.33 2
5.0718451 1 1 1
0.9272812 12
c
p
x y Dt
Sn m
Ahora, como
5.071845 . .ct R C
Entonces, rechazamos H0 y concluimos que con el empleo del nuevo proceso de secado de
la malta verde se produce una reduccin en NDMA en ms de dos partes por billn.
2.2.2. Contrastes basados en muestras dependiente (datos pareados):
En este caso suponemos que se tiene una muestra aleatoria de n pares de observaciones de
la forma 1 1 2 2( , ),( , ), , ( , )n nX Y X Y X Y de dos poblaciones normales dependientes X e Y que
tienen medias X y Y . Queremos determinar si 0X Y D o no lo es. Para realizar
78
la prueba definimos la v.a 2~ ( , )D DD X Y N con D X Y y 2
D es
desconocida. Las pruebas para determinar si 0D X Y D se basan en la estadstica
0 0( 1)~
/ /n
D D
D D X Y Dt t
S n S n
donde DD X Y S son media y desviacin estndar de las diferencia entre X e Y.
Entonces, las regiones criticas de tamao y el p valor para las tres pruebas anteriores son las siguientes:
Prueba bilateral:
0 0
0
:
:
D X Y
a D X Y
H D
vs
H D
La regin crtica y el p valor son:
( /2, 1) ( /2, 1) 1. . / 2n n n cRC t t t t t p valor P t t Prueba unilateral derecha:
0 0
0
:
:
D X Y
a D X Y
H D
vs
H D
La regin crtica y el p valor son:
( , 1) 1. . / n n cRC t t t p valor P t t
Prueba unilateral izquierda:
0 0
0
:
:
D X Y
a D X Y
H D
vs
H D
La regin crtica y p valor son
( /2, 1) 1. . / n n cRC t t t p valor P t t
En cualquiera de los tres casos anteriores se rechaza H0 cuando ct RC donde
0
/c
d
d Dt
S n
79
Donde dd s son media y desviacin estndar muestral de las diferencias muestrales.
Observacin: Usado la estadstica
( 1)( ) ( )
~/ /
X Y X Yn
D D
D X Yt t
S n S n
Se obtiene que el intervalo de confianza del 100(1 )% para ( )X Y es
( / 2, 1) ( / 2, 1)d d
n X Y n
s sd t d t
n n
Ejemplo 6: Se llev a cabo un estudio para determinar el grado en el cual el alcohol
entorpece la habilidad de pensamiento para llevar a cabo una tarea. Se seleccionaron al
azar diez personas de distintas caractersticas y se les pidi que participaran en el
experimento. Despus de proporcionarles la informacin pertinente, cada persona llev a
cabo el experimento sin nada de alcohol en su organismo. Entonces, la tarea volvi a
llevarse a cabo, despus de que cada persona haba consumido una cantidad suficiente de
alcohol para tener un contenido en su organismo de 0.1%. Los tiempos antes y despus
(en minutos) estn en la siguiente tabla.
Participante Antes (X) Despus (Y) Despus Antes = D
1 28 39 11
2 22 45 23
3 55 67 12
4 45 61 16
5 32 46 14
6 35 58 23
7 40 51 11
8 25 34 9
9 37 48 11
10 20 30 10
Media - muestral 33.9 47.9 14
Desviacin estndar muestral 10.90 11.80 5.14
Suponiendo que los tiempos antes y despus se pueden modelar por una distribucin
normal, puede concluirse a un nivel de significancia del 5% que el tiempo despus es
mayor que el tiempo promedio antes por ms de 10 minutos? Encuentre el p valor para el contraste. Construya un intervalo de confianza del 95% para la diferencia entre los
tiempos promedio despus menos antes.
Solucin: Sea D = Y X = Diferencia de tiempos despus antes ~ 2( , )D y X DN
con varianza desconocida, donde 2~ ( , )y yY N es el tiempo despus y 2~ ( , )X XX N
80
es el tiempo antes. Los resultados muestrales para la variable D estn en la tabla anterior y
nos muestran que 14d y 5.14ds .
Observe se est suponiendo que el tiempo promedio despus es mayor que el tiempo
promedio antes; entonces D Y X representa en cuanto el tiempo promedio despus
supera al tiempo promedio antes y se espera que lo supere en ms de 10 minutos. Por lo
tanto, debemos contrastar a un nivel de significancia del 5% las siguientes hiptesis:
0
0
: 10
: 10
D Y X
D Y X
H
vs
H
La estadstica de prueba para este contraste es
0 (10)10
~/ / 10D D
D D Dt t
S n S
La regin crtica de tamao = 0.05 es
RC = (0.05,9)/ 1.833t t t El valor calculado de la estadstica a partir de la informacin muestral es
10 14 10
2.461/ 10 5.14/ 10
c
d
dt
S
Como tc = 2.461 pertenece a la regin crtica, entonces se rechaza H0 y podemos concluir
que el tiempo promedio despus es mayor que el tiempo promedio antes por ms de 10
minutos.
2.3. PRUEBAS PARA VARIANZAS.
Caso 1. Una sola muestra: Pruebas para la varianza de una poblacin normal.
Se quiere probar el valor 20 para la varianza
2 de una poblacin normal. Para la prueba
usaremos la estadstica muestral 2XS proveniente de una muestra aleatoria de tamao n
tomada de la poblacin de inters. Los contrastes que vamos realizar son los siguientes:
1)
2 2
0 0
2 2
0
:
:a
H
vs
H
; 2)
2 2
0 0
2 2
0
:
:a
H
vs
H
y 3)
2 2
0 0
2 2
0
:
:a
H
vs
H
En cualquiera de los casos, la estadstica de prueba bajo H0 cierta es
81
22 2
12
0
( 1)~X n
n S
Con esta estadstica pretendemos buscar diferencias significativas entre la varianza
muestral 2XS y el valor propuesto
2
0 para la varianza poblacional y de esta forma
rechazaremos la hiptesis nula. Ahora, para un nivel de significancia preestablecido, las regiones crticas y los valores p para los contrastes anteriores son:
Prueba bilateral: 2 2
0 0
2 2
0
:
:a
H
vs
H
Rechazaremos la hiptesis nula cuando el valor observado de la varianza muestral sea
suficientemente diferente del valor propuesto y esto ocurre cuando el valor muestral de la
estadstica de prueba sea un valor extremo de la distribucin 21n . Por lo tanto, la regin
crtica de tamao es:
2 2 2 2 2( 2, 1) (1 2, 1). . / n nRC
Si
22
2
0
( 1).Xc
n sR C
rechazamos H0 en favor de la alternativa.
El valor p para esta prueba viene dado como:
2 2 2
1
2 2 2
1
2 ( ) si 1
2 ( ) si 1
n c c
n c c
P X Xp valor
P X X
Prueba unilateral derecha:
2 2
0 0
2 2
0
:
:a
H
vs
H
Rechazaremos la hiptesis nula cuando el valor observado de la varianza muestral sea
suficientemente mayor que el valor propuesto para sta y esto ocurre cuando el valor muestral de la estadstica de prueba sea un valor extremo en la cola derecha de la
distribucin 2 1n . Por lo tanto, la regin crtica de tamao es:
2 2 2( , 1). . / nRC
82
Si
22
2
0
( 1).Xc
n sR C
rechazamos H0 en favor de la alternativa.
El p valor para esta prueba es: Valor p = 2 21( )n cP
Prueba unilateral izquierda:
2 2
0 0
2 2
0
:
:a
H
vs
H
Rechazaremos la hiptesis nula cuando el valor observado de la varianza muestral sea
suficientemente menor que el valor propuesto para sta. Por lo tanto, la regin crtica de tamao es:
2 2 2(1 , 1). . / nRC
Si
22
2
0
( 1).Xc
n sR C
rechazamos H0 en favor de la alternativa.
El p valor para esta prueba es: Valor p 2 21n cP
Ejemplo 7: (Ejercicio 9.43 del texto de Canavos) En un proceso de llenado, la tolerancia
para el peso de los recipientes es de ocho gramos. Para reunir este requisito, la desviacin
estndar en el proceso debe ser de dos gramos. Los pesos de 25 recipientes seleccionados
al azar dieron una desviacin estndar de 2.8 gramos.
a) Si los pesos se encuentran normalmente distribuidos, determine si la varianza de stos es diferente del valor necesario. Emplese un nivel de significancia del 2%.
b) Para qu valores de la varianza muestral no puede rechazarse la hiptesis nula del apartado anterior? Se encuentran estos valores equidistantes del valor necesario de la
varianza? Cmo deberan ser? Comente.
Ejemplo 7.1.: El gerente de una planta sospecha que el nmero de piezas que produce un
trabajador en particular por da, flucta ms all del valor normal esperado. El gerente
decide observar el nmero de piezas que produce este trabajador durante diez das,
seleccionados stos al azar. Los resultados son: 15, 12, 8, 13, 12, 15, 16, 9, 8, y 14. Si se
sabe que la desviacin estndar para todos los trabajadores es de 2 unidades y si el nmero
de stas que se produce diariamente, se encuentra modelado en forma adecuada por una
distribucin normal, a un nivel de significancia del 5%, tiene apoyo la sospecha del
gerente? Obtener el p valor para el contraste.
Solucin:
Sea X = Nmero de piezas que produce un trabajador particular por da ~ Normal.
83
De la muestra aleatoria dada se obtiene 12.2x y 2 8.84444Xs . El gerente sospecha que
= desviacin estndar de X > 2. Dada la informacin anterior nos piden contrastar a un
nivel de significancia del 5% ( = 0.05) la sospecha. Esto es, hay que realizar con = 0.05 la siguiente prueba de hiptesis:
2
0 0
2
: 2 : 4
: 2 : 4a a
H H
vs vs
H H
La estadstica de prueba para este contraste es
2 22 2
92
0
( 1) 9~
4
n S S
La regin crtica de tamao = 0.05 es
2 2 2(0.05,9). . / 16.92RC El valor calculado de la estadstica de prueba es
22 9 9 8.84444 19.8999
4 4c
s
Ahora, como 2 19.8999 (19.8999 16.92)c RC , entonces rechazamos H0 y
concluimos que el nmero de piezas que produce este trabajador por da flucta ms all
del valor normal esperado.
El p valor = 29 18.8999P . De la tabla se concluye que 0.01 < p valor < 0.02. Entonces, para un nivel de significancia del 5% se rechaza H0, pues el p valor < 0.05.
Caso 2: Pruebas para la igualdad de varianzas de dos poblaciones normales.
Sean 2 2 y X YS S las varianzas muestrales de dos muestras aleatorias independientes de
tamaos n y m de dos poblaciones X e Y que tienen varianzas poblacionales 2 2 y X Y ,
respectivamente. Queremos comparar las varianzas poblacionales; para ello utilizaremos
las varianzas muestrales y la estadstica de prueba es:
2 2
( 1, 1)2 2~Y X n m
X Y
SF
S
Usando esta estadstica vamos a realizar los siguientes contrastes:
84
1)
2 2
0
2 2
:
:
X Y
a X Y
H
vs
H
2)
2 2
0
2 2
:
:
X Y
a X Y
H
vs
H
Bajo H0 cierta, la estadstica de prueba se reduce a
2
( 1, 1)2~X n m
Y
SF F
S
Entonces, rechazaremos H0 cuando haya mucha diferencia entre las varianzas muestrales
y esto quiere decir que 2XS es mucho mayor o mucho menor que
2
YS ; entonces las regiones
las regiones crticas de tamao y los valores p para los dos contrates anteriores son:
Prueba bilateral:
( 2, 1, 1) (1 2, 1, 1)
( 2, 1, 1)
1. . / o n m n m
m n
R C F F F F FF
( 1, 1)
( 1, 1)
2 ( ) si 1
2 ( ) si 1
n m c c
n m c c
P F F Fp valor
P F F F
Prueba unilateral derecha:
( , 1, 1). . / n mRC F F F ( 1, 1)( )n m cp valor P F F
En cualquiera de los dos casos rechazamos H0 a favor de la alternativa Ha cuando 2
2
Xc
Y
sF
s caiga en la regin crtica.
Ejemplo 8: Un inversionista desea comparar el riesgo asociado con dos diferente
mercados, A y B. El riesgo de un mercado se mide por la variacin en los cambios diarios
de precios. El inversionista piensa que el riesgo asociado con el mercado B es mayor que
el del mercado A. Se obtienen muestras aleatorias independientes de 21 cambios diarios de
precios para el mercado A y de 16 para el mercado B. Se obtienen los siguientes
resultados:
Mercado A Mercado B
Tamao 21 16
Media 0.3 0.3
Desviacin estndar 0.25 0.45
85
a) Si se supone que las muestras provienen de dos poblaciones normales e independientes a
un nivel de significancia del 5% encuentra apoyo la creencia del inversionista?
Encuentre el p valor de la prueba. b) Si la varianza muestral de A es la dada, cul es el mximo valor de la varianza muestral
de B con base en n = 16 que no llevar al rechazo de la hiptesis nula del apartado
anterior?
Solucin:
Sean X = Cambios diarios de precios en el mercado A ~ Normal y 2X la variacin en los
cambios diarios de precios en este mercado; por lo tanto, 2X representa el riesgo en el
mercado A.
Sea tambin Y = Cambios diarios de precios en el mercado B ~ Normal y 2Y la variacin
en los cambios diarios de precios en este mercado; por lo tanto, 2Y representa el riesgo en
el mercado B.
Tambin se tiene que las poblaciones son independientes. De las muestras aleatorias se
obtiene
21, 0.25, 16, 0.45X yn S m S
Nos piden usar el nivel de significancia del 0.05 y la informacin anterior, para contrastar la creencia del inversionista de que el riesgo asociado con el mercado B es
mayor que el del mercado A. Esto es, hay que realizar el contraste siguiente:
2 2
0
2 2
:
:
Y X
a Y X
H
vs
H
La estadstica de prueba para este contraste es:
2
( 1, 1) (15,20)2~Y m n
X
SF F F
S
Entonces, la regin crtica de tamao 0.05 es:
(0.05,15,20) (0.05,15,20). . / 2.20RC F F F F
El valor calculado de la estadstica de prueba es
2 2
2 2
0.45 0.20253.24
0.25 0.0625Y
c
X
sF
s
86
Ahora, como 3.24 . .cF R C entonces rechazamos 2 2
0 : X YH y concluimos que el
riesgo asociado al mercado A es menor que el del mercado B.
Finalmente, el valor p de la prueba es
(15,20)( 3.24) 0.05p valor P F
Ejemplo 8.1: Se conjetura que las acciones de una compaa sufriran ms variacin en una
industria con competencia en precios que una en las que existiera un duopolio o colusin
tcita. En un estudio sobre la industria de generadores, se hall que en cuatro aos de
competencia en precios, la variacin en las acciones fue de 114.09. En los siguientes siete
aos, en los cuales hubo duopolio y colusin tcita, esta variacin fue de 16.08. Asumir que
los datos pueden considerarse como muestras aleatorias independientes de dos poblaciones
normales. Contrastar a un nivel de significancia del 5% la conjetura. Encontrar el p valor para esta pueda.
2.4. PRUEBAS CONCERNIENTES A PROPORCIONES.
PRUEBAS PARA UNA PROPORCIN.
En muchos problemas prcticos se requiere realizar contrastes sobre la proporcin
poblacional . Estos contrastes tienen la forma:
0 0 0 0 0 0
0 0 0
: : :
1) , 2) 3)
: : :a a a
H H H
vs vs vs
H H H
La estadstica de prueba para estos contrastes es:
/X n = proporcin de xitos en la muestra de tamao n observada.
La hiptesis nula ser rechazada a favor de la alternativa cuando haya diferencias
significativas entre /X n sea suficientemente diferente del valor propuesto 0 , para
buscar diferencias significativas entre estas dos cantidades, utilizaremos la siguiente
estadstica
0
0 0
~ (0,1)
(1 ) aZ N
n
Usando la estadstica anterior se obtiene que las regiones crticas de tamao y el p valor para las pruebas anteriores son las siguientes:
87
Prueba bilateral: En este caso rechazamos H0 cuando el valor observado para la proporcin
muestral /X n sea suficientemente diferente del valor propuesto 0 para ; por lo
tanto,
2 2. . / RC z z z z z
Si 0 0 0( ) (1 )cz n RC , entonces rechazamos H0 a favor de la hiptesis
alternativa. Adems, el p valor para esta prueba es
p valor = 2 ( )cP Z z
Prueba unilateral derecha: En este caso rechazamos H0 cuando la proporcin muestral
estimada /X n sea suficientemente mayor que el valor 0 propuesto para ; por lo
tanto, la regin crtica es
2. . /RC Z Z z
Si 0 0 0( ) (1 )cz n RC , entonces rechazamos H0 a favor de la hiptesis
alternativa. Adems, el p valor para esta prueba es
p valor = ( )cP Z z
Prueba unilateral derecha: En este caso rechazamos H0 cuando la proporcin muestral
estimada /X n sea suficientemente menor que el valor 0 propuesto para la proporcin
poblacional, entonces la regin crtica es
2. . /RC Z Z z
Si 0 0 0( ) (1 )cz n RC , entonces rechazamos H0 a favor de la hiptesis
alternativa. Adems, el p valor para esta prueba es
p valor = ( )cP Z z
Ejemplo 9: Una organizacin de salud se interesa en actualizar su informacin con
respecto a la proporcin de hombres que fuman. Con base en estudios previos, se cree que
la proporcin es de 40%. La organizacin lleva a cabo una encuesta en la que se selecciona
en forma aleatoria 1200 hombres a los cuales se les pregunta sus hbitos de fumador. De
los 1200, 420 son fumadores. Ser que la evidencia anterior apoya la nocin de que la
proporcin de hombres que fuman es diferente del 40%? Emplee un nivel de significancia
del 1% ( = 0.01). Encuentre el p valor para esta prueba
88
PRUEBAS PARA DOS PROPORCIONES
Queremos comparar dos proporciones poblacionales; para ello, supondremos que se tienen
dos muestras aleatorias independientes. La primera muestra es de Xn observaciones de una
poblacin X que tiene una proporcin poblacional es X y la proporcin muestral resultante
es X XX n . La segunda muestra consta de Yn observaciones de una poblacin Y cuya
proporcin poblacional es Y y la proporcin muestral resultante es Y YY n .
Para comparar las proporciones poblacionales realizaremos los siguientes contrastes
alternativos:
1) 0 0 0: : :
1) 2) 3)
: : :
X Y X Y X Y
a X Y a X Y a X Y
H H H
vs vs vs
H H H
Para tamaos muestrales grandes, la estadstica de prueba para los tres contrastes anteriores
es la siguiente:
0 0 0 0
~ (0,1)
(1 ) (1 )
X Y
a
X Y
Z N
n n
Donde,
0
X X Y Y
X Y X Y
n n X Y
n n n n
Entonces, en virtud de la estadstica anterior se tiene que las regiones crticas de tamao y los valores p son los siguientes:
Prueba bilateral.
2 2. . / o 2 ( )cRC Z Z z Z z p valor P Z z
Prueba unilateral derecha.
. . / ( )cRC Z Z z p valor P Z z
Prueba unilateral izquierda.
. . / ( )cRC Z Z z p valor P Z z
89
En cualquiera de los tres casos, cuando cz , que es el valor calculado de la estadstica de
prueba a partir de la informacin muestral, caiga en la regin crtica rechazamos la
hiptesis nula H0 en favor de la alternativa.
Ejemplo 10: Un economista al servicio del estado desea determinar si la frecuencia de
desempleo en dos reas urbanas del estado son diferentes. Con base en muestras aleatorias
de tamao 500 de cada ciudad, el economista encuentra 35 personas desempleadas en un
rea y 25 en la otra. Bajo las suposiciones apropiadas y con un nivel de significancia del
5% existe alguna razn para creer que las frecuencias de desempleo en las dos reas son
diferentes? Cul es el valor p? Solucin:
En la primera regin se tiene que:
X = Nmero de desempleados en la primera regin
X = la proporcin de desempleo en la primera regin.
A partir de la informacin muestral se obtiene que la proporcin muestral resultante para
esta regin es 35/500 0.07X .
En la segunda regin se tiene que:
Y = Nmero de desempleados en la segunda regin
Y = la proporcin de desempleo en la segunda regin.
A partir de la informacin muestral se obtiene que la proporcin muestral resultante para la
segunda regin es 25/500 0.05Y .
Nos piden contrastar al 5% ( = 0.05) de significancia si la frecuencia de desempleo en estas regiones es diferente. Esto es, debemos realizar el siguiente contraste de hiptesis
0 0: : 0
: : 0
X Y X Y
a X Y a X Y
H H
vs vs
H H
La estadstica de prueba para este contraste es
0 0 0 0
~ (0,1)
(1 ) (1 )
X Y
a
X Y
Z N
n n
Donde la proporcin comn estimada es
0
X X Y Y
X Y
n n
n n
= 35 25 0.06
500 500X Y
X Y
n n
90
Entonces, la regin crtica de tamao = 0.05 para el contraste es
0.025 0.025. . / 0 / 1.96 0 1.96RC Z Z z Z z Z Z Z
El valor calculado de la estadstica es
0 0 0 0
0.07 0.058.8652
0.06(1 0.06) 0.06(1 0.06)(1 ) (1 )500 500
X Y
X Y
Z
n n
Como 8.8652cz RC , entonces rechazamos H0 a favor de H1 y concluimos que las
frecuencias de desempleo en las dos regiones es diferente.
El p valor = 2 ( ) 2 ( 8.8652) 0cP Z z P Z . Por lo tanto, la hiptesis nula se rechaza
a cualquier nivel de significancia.