1 Distribuciones Muestrales
-
Upload
fulanitoskr -
Category
Documents
-
view
1.445 -
download
19
Transcript of 1 Distribuciones Muestrales
UNIDAD1
DISTRIBUCIONES
M U E S T R A L E SOBJETIVO EDUCACIONAL
Al término de esta unidad el alumno:
Conocerá, comprenderá y aplicará la distribución muestral adecuada, de
acuerdo a la situación que se le presente.
Introducción
El campo de la inferencia estadística trata básicamente con las generalizaciones y predicciones;
es decir, deseamos conocer las características de una población o parámetros por medio de las
características de una muestra o estadísticos.
Población. Una población consiste en la totalidad de las observaciones en
las cuales se está interesado.
Muestra. Una muestra es un subconjunto de una población.
Si las inferencias de la muestra de una población han de ser válidas, es importante obtener
muestras representativas de la población. Para eliminar cualquier posibilidad de sesgo, en el
procedimiento muestral, es conveniente seleccionar una muestra aleatoria en el sentido de que
las observaciones se realicen independientemente y al azar.
1
SPC Nivel Intermedio ____________________________________________________________________________
Muestra Aleatoria. Sean X1 , X2 ,…, X n variables aleatorias independientes,
cada una con la misma distribución de probabilidad f(x). se define entonces
a X1 , X2 ,…, X n como la muestra aleatoria de tamaño n de la población
f(x) y se expresa su función de probabilidad conjunta como
f ( x1 , x2 ,… , xn )= f ( x1 ) f ( x2)⋯f ( xn )
Parámetro. Una característica numérica de una población.
Estadístico. Cualquier función de las variables aleatorias que constituyen
una muestra aleatoria se l lama estadístico y representa una característica
numérica de una muestra.
Distribución Muestral. La distribución de probabilidad de un estadístico
recibe el nombre de distribución muestral.
Error Estándar. Es la desviación estándar de un estadístico en su
distribución muestral.
1.1 Teorema del Límite central
Suponga que se toma una muestra aleatoria de tamaño n de una población con media μ
y
varianza σ 2
. Cada observación en la muestra X1 , X2 ,…, X n
es una variable aleatoria
distribuida normal e independientemente, con μ
y varianza σ 2
. Entonces por la propiedad
reproductiva de la distribución normal se concluye que la media muestral
2 José Armando Rodríguez Romo
________________________________________________________________________ Distribuciones Muestrales
x̄=
x1+x2+⋯+xn
n
tiene una distribución normal con media
μ x̄=μ+μ+⋯+μ
n=μ
y varianza
σ x̄2=σ2+σ2+⋯+σ2
n2=σ2
n
Si se muestre una población que tiene una distribución desconocida, la distribución muestral de
la media seguirá siendo aproximadamente normal μ
y varianza σ 2/n
, si el tamaño de la
muestra es grande ( n≥30
). Este punto es uno de los teoremas más útiles en estadística; se le
conoce como teorema del límite central.
Teorema del Límite central. Si es una muestra aleatoria de tamaño n tomada de una
población (finita o infinita) con media μ y varianza σ2
, y si x̄ es la media muestral,
entonces la forma límite de la distribución de
z= x̄−μσ /n
conforme n→∞ , es la distribución normal estándar n( z ; 0 , 1) .
1.2 Distribución Muestral de la Media. Conocida
La aproximación normal para x̄
por lo general será satisfactoria sin importar la forma de la
población. Si n < 30, la aproximación es buena sólo si la población no es muy diferente de una
distribución normal y, si se sabe que la población es normal, la distribución muestral de x̄
José Armando Rodríguez Romo 3
SPC Nivel Intermedio ____________________________________________________________________________
seguirá siendo una distribución normal exacta sin importar qué tan pequeño sea el tamaño de
las muestras.
Ejemplo 1 Una empresa eléctrica fabrica focos que tiene una duración que se distribuye en
forma normal, con una media de 800 horas y una desviación estándar de 40 horas.
Encuentre la probabilidad de que una muestra aleatoria de 16 focos tenga una vida
promedio de 775 horas.
Solución
Sean: X = duración de los focos, en horas
X ~ Normal (μ=800 , σ=40
)
X > 0
x1 , x2 ,…xn n variables aleatorias independientes
x̄=∑i=1
n
x i
n
x̄ ~Normal ( μ x̄=800 , σ x̄=40 /√16=10)
x̄>0
z= x̄−μσ /√n
z ~n( 0 , 1)
−∞<z <+∞
Entonces:
P( x̄<775 )=F( z=775−80010 )=F (z=−2. 50 )=0 . 0062
4 José Armando Rodríguez Romo
________________________________________________________________________ Distribuciones Muestrales
Por lo tanto, esperamos que sólo 6 de cada mil muestras, de tamaño 16, tengan una media
muestral inferior a 775 horas.
José Armando Rodríguez Romo 5
SPC Nivel Intermedio ____________________________________________________________________________
EJERCICIOS 1
1. Si se extraen todas las muestras posibles de tamaño 16 de una población normal con media igual a 50 y desviación estándar igual a 5, ¿cuál es la probabilidad de que una media muestral ¯X caiga en el intervalo
que va de μ x̄−1 . 9σ x̄
a μ x̄+1 .9 σ x̄
? Suponga que las medias muestrales se pueden medir con cualquier grado de precisión.
2. Si el error estándar de la media para la distribución de muestras aleatorias de tamaño 36 de una población grande o infinita es 2, ¿qué tan grande debe ser el tamaño de la muestra para reducir el error estándar a 1.2?
3. Una máquina de refrescos se ajusta para que la cantidad de bebida que sirve promedie 240 ml con una desviación estándar de 15 ml. La máquina se verifica periódicamente tomando una muestra de 40 bebidas y se calcula el contenido promedio. Si la media de las 40 bebidas es
un valor dentro del intervalo de μ x̄±2σ x̄
, se piensa que la máquina opera satisfactoriamente; de otra forma se ajusta. Un funcionario de la compañía encuentra
que la media de 40 bebidas es x̄=236
ml y concluye que la máquina no necesita ajuste. ¿Esta fue una decisión razonable?
4. Las estaturas de 1000 estudiantes están distribuidas aproximadamente de forma normal con una media de 175.5 cm y una desviación estándar de 6.9 cm. Si se extraen 200 muestras aleatorias de tamaño 25 de esta población y las medias se registran al décimo de cm más cercano,
determine el número de medias muestrales que caen
a) entre 172.5 y 175.8 cm inclusive;
b) por debajo de 172.0 cm
5. Si cierta máquina fabrica resistores eléctricos que tienen una resistencia media de 40 ohms y una desviación estándar de 2 ohms, ¿cuál es la probabilidad de que una muestra aleatoria de 36 de estos resistores tenga una resistencia combinada de más de 1458 ohms?
6. La vida media de una máquina para hacer pasta es de 7 años con una desviación estándar de 1 año. Suponga que las vidas de estas máquinas siguen aproximadamente una distribución normal, encuentre
a) la probabilidad de que la vida media de una muestra aleatoria de 9 de estas máquinas caiga entre 6.4 y 7.2 años;
b) el valor de x̄
a la derecha del cual caería el 15% de las medias calculadas de muestras aleatorias de tamaño 9.
7. El tiempo que el cajero de un banco con servicio en el automóvil atiende a un cliente es una variable aleatoria con una
media, μ=3.2
minutos y una desviación
estándar, σ=1 .6
minutos. Si se observa una muestra aleatoria de 64 clientes, encuentre la probabilidad de que su tiempo medio sea
a) a lo más de 2.7 minutos
b) más de 3.5 minutos
c) más de 3.2 min pero menos de 3.4 min.
6 José Armando Rodríguez Romo
_______________________________________________________________________ Distribuciones Muestrales
José Armando Rodríguez Romo 7
SPC Nivel Intermedio ____________________________________________________________________________
1.2 Distribución Muestral de la Media. Desconocida. Distribución t – Student
Teorema 2.5. Sea Z una variable aleatoria normal estándar y V una variable aleatoria Ji-
cuadrada con v grados de libertad. Si Z y V son independientes, entonces la distribución
de la variable aleatoria T, donde
T= Z
√V /vestá dada por
h( t )=Γ [( v+1)/2 ]Γ (v /2 )√ πv (1+ t2
v )−(v+1 )/2
, −∞<t <+∞
Esta se conoce como la distribución t con v grados de libertad.
Corolario Sean X1 , X2 ,…X n variables aleatorias independientes que son todas
normales con media μ y desviación estándar σ . Sean
x̄=∑i=1
n x i
n y s2=∑
i=1
n ( x i− x̄ )2
n−1 ,
Entonces la variable aleatoria T= x̄−μ
s /√n tiene una distribución t con v = n – 1 grados de
libertad.
Para las aplicaciones de la distribución t Student (Tabla 3 del Apéndice), utilizaremos el
procedimiento siguiente:
Sean: X = una variable aleatoria continua
X ~ Normal ( μ , σ=? )−∞<x <+∞
x1 , x2 ,…xn n variables aleatorias independientes (n < 30)
x̄=∑i=1
n
x i
n ;s=√∑i=1
n
x i2−(∑
i=1
n
x i)2
/n
n−1
8 José Armando Rodríguez Romo
_______________________________________________________________________ Distribuciones Muestrales
T= x̄−μs /√n
T ~T Student ( v=n−1 gl)
−∞<T <+∞
Entonces:
a) P(X<a)=F( a)=F (t= a−μ
s/√n )
b) P(X>b)=1−F (b )=1−F (t=b−μ
s /√n )
c) P(a<X<b )=F (b )−F (a )=F (t=b−μ
s /√n )−F (t= a−μs /√n )
d) P(a>X>b )=F (a )+1−F (b )=F (t=a−μ
s /√n )+1−F (t=b−μs /√n )
Ejemplo 2 Un fabricante de focos afirma que su producto durará en promedio de 500 horas de
trabajo. Para verificar este promedio, esta persona prueba 25 focos cada mes. Si el valor
de t calculado cae entre −t0. 05
y t0.05
, él se encuentra satisfecho con esta afirmación.
¿Qué conclusión deberá él sacar de una muestra que tiene una media de x̄=518
horas y
una desviación estándar s=40
horas? Asuma que la distribución de los tiempos de vida
es normal?
Sean: X = tiempos de vida de los focos producidos por un fabricante, en horas
X ~ Normal ( μ=500 , σ=? )
x>0
x1 , x2 ,…xn n=25 variables aleatorias independientes (n < 30)
x̄=∑i=1
n
x i
n ;s=√∑i=1
n
x i2−(∑
i=1
n
x i)2
/n
n−1
José Armando Rodríguez Romo 9
SPC Nivel Intermedio ____________________________________________________________________________
T= x̄−μs /√n
T ~T Student ( v=n−1=24 gl)
−∞<T <+∞
Entonces: De la Tabla 3 obtenemos el valor de t0.05 para 24 grados de libertad. Por lo tanto, el
fabricante estará de acuerdo con esta afirmación si una muestra de 25 focos da un valor
de t entre -1.711 y 1.711.
T= x̄−μs/n
=518−50040 /√25
=2 .25
De aquí que el fabricante está en condiciones de concluir que sus focos duran más de 500
horas.
EJERCICIOS 2
1. Para la distribución T-Student encuentre:
a) t0.025 cuando v = 14
b)−t0. 10 cuando v = 10
c)t0.995
cuando v = 7
2. Para la distribución T-Student encuentre:
a) P(T <2. 3365 cuando v = 7b) P(T >1. 318 ) cuando v = 24c) P(−1.356<T <2 .179 cuando v = 12
d)P(T >−2. 567 )
cuando v = 17
3. Para la distribución T-Student encuentre:
a) P(−t 0. 005<T <t 0.01)
b) P(T >−t0. 025 )
4. Dada una muestra aleatoria de tamaño 24 de una distribución normal, con desconocida, encuentre k tal que
a) P(−2. 07<T<k )=0. 965
b) P(k<T<2 . 81)=0. 095
c)P(−k<T <k )=0 . 90
5. Una empresa manufacturera afirma que las baterías que utiliza en sus juegos electrónicos duran un promedio de 30 horas. Para mantener este promedio, se prueban 16 baterías cada mes. Si el valor
de t que se calcula cae entre −t0. 025
y t0.025
, la empresa queda satisfecha con su afirmación. ¿Qué conclusiones extraería la empresa de una muestra
que tiene una media x̄=27 . 5
hr y una
desviación estándar de s=5
hr? Suponga que la distribución de duraciones de las baterías es aproximadamente normal.
6. Una población normal con varianza desconocida tiene una media de 20. ¿Se tiene posibilidad de obtener una muestra aleatoria de tamaño 9 de esta
10 José Armando Rodríguez Romo
_______________________________________________________________________ Distribuciones Muestrales
población con una desviación estándar de 4.1? si no, ¿que conclusión sacaría?
7. Un fabricante de cierta marca de barras de cereal bajo en grasa afirma que su contenido promedio de grasa saturada
es 0.5 gramos. En una muestra aleatoria de 8 barras de cereal de esta marca el contenido de grasa saturada fue 0.6, 0.7, 0.7, 0.3, 0.4, 0.5, 0.4 y 0.2. ¿Estaría de acuerdo con esta afirmación?
1.3 Distribución Muestral de la Proporción
Suponga que una población es infinita y tiene una distribución binomial con P y Q = 1 P siendo
las probabilidades respectivas de que cualquier elemento exhibe o no cierta propiedad.
Consideremos todas las muestras posibles de tamaño n extraídas de esta población, y para cada
muestra determinemos el estadístico que es la proporción p̂ de éxitos. Entonces obtenemos
una distribución muestral de proporciones cuya media μ p̂ y desviación estándar σ p̂ están
dadas por
μ p̂=P y
σ p̂=√ PQn
=√ P(1−P )n
Para valores grandes de n (tales que nP≥5
y nQ≥5
), la distribución muestral se aproxima
a una distribución normal.
Ejemplo 3 Encuentre la probabilidad de que en 120 lanzamientos de una moneda balanceada a)
entre 40% y 60%, inclusive, sean águilas, b) 5/8 o más sean águilas.
Solución
Sean: X = número de águilas en una muestra de 120 lanzamientos
X ~ Binomial(n = 120, P= 0.50)
X = 0, 1, 2., . . . , 120
Pero
nP≥5 y nQ≥5
José Armando Rodríguez Romo 11
SPC Nivel Intermedio ____________________________________________________________________________
p̂~ Normal ( μ p̂=P=0 .50 , σ p̂=√ PQn
=√ 0 .5×0 .5120
=0.0456)
0< p̂<1
z=p̂± 1
2n−P
σ p̂
z ~n( 0 , 1)−∞<z <+∞
Entonces:
a)
P(0 . 4≤ p̂≤0. 6 )=F (z=0 .6+0 .0417−0 .50 . 0456 )−F (z=0 . 4−0 .00417−0 .5
0 .0456 )
P(0 . 4≤ p̂≤0. 6 )=F ( z=2. 28 )−F ( z=−2 .28 )=0 . 9887−0. 0113=0 . 9774
Por lo tanto, esperamos que 97.74% de las muestras, de tamaño 120, tengan una proporción de
águilas entre el 40% y 60%.
EJERCICIOS 3
1. Se ha encontrado que el 2% de las herramientas producidas por cierta máquina son
defectuosas. ¿Cuál es la probabilidad de que un cargamento de 400 de esas herramientas
sean defectuosas a) 3% o más, b) 2% o menos?
2. Los resultados de una elección demostraron que cierto candidato recibió el 46% de los votos.
Determine la probabilidad de que una encuesta de a) 200, b) 1000 personas de la población
votante seleccionadas al azar de la población ha mostrado mayoría de votos a favor del
candidato.
3. Un fabricante despacha 1000 lotes, cada uno de 100 bombillas eléctricas. Si normalmente el
5% de las bombillas es defectuoso, ¿en cuántos lotes esperaría usted encontrar a) menos de
90 bombillas buenas, b) 98 o más bombillas buenas?
1.4 Distribución Muestral de la Varianza. Distribución Ji-Cuadrada
Teorema 2.4. Si s2
es la varianza de una muestra aleatoria de tamaño n tomada de una
población normal que tiene la varianza σ2
, entonces la estadística
12 José Armando Rodríguez Romo
_______________________________________________________________________ Distribuciones Muestrales
χ2=(n−1)s2
σ2=∑
i=1
n ( x i− x̄ )2
σ2
tiene una distribución Ji-cuadrada con v = n – 1 grados de l ibertad.
Para las aplicaciones de la distribución 2 (Tabla 2 del Apéndice), utilizaremos el procedimiento
siguiente:
Sean: X = una variable aleatoria continua
X ~ Normal ( μ , σ2 )
−∞<X<+∞
x1 , x2 ,…xn n variables aleatorias independientes
s2=∑i=1
n
xi2−(∑
i=1
n
x i)2
/n
n−1
χ2=(n−1)s2
σ2
χ2 ~ Ji−cuadrada ( v=n−1 gl ) )
χ2>0Entonces:
a) P( s<a)=P (s2<a2 )=F( χ2=
(n−1 ) a2
σ2 )b)
P( s>b )=P (s2>b2)=1−F ( χ2=(n−1) b2
σ2 )
c)
P(a<s<b )=P(a2<s2<b2 )=F ( χ 2=(n−1) b2
σ 2 )−F ( χ 2=( n−1) a2
σ 2 )Ejemplo 4 Se sabe que la duración de los cinescopios para televisión fabricados por una
compañía se distribuye en forma normal con una media de 3000 horas y una desviación
estándar de 60 horas. Si se seleccionan 10 de estos cinescopios al azar, hallar la probabilidad de
que la varianza muestral: a) no exceda de 2360 horas2, b) se encuentre entre 2360 y 6768
horas2.
José Armando Rodríguez Romo 13
SPC Nivel Intermedio ____________________________________________________________________________
Sean: X = duración de los cinescopios, en horas
X ~ Normal (μ=3000 , σ=60 )
X > 0
x1 , x2 ,…xn n =10 variables aleatorias independientes
s2=∑i=1
n
xi2−(∑
i=1
n
x i)2
/n
n−1
χ2=(n−1)s2
σ2
χ2 ~ Ji−cuadrada ( v=9 gl) )
χ2>0Entonces:
a) P( s2<2360)=F ( χ2=
9 (2360 )602 )=F ( χ2=5 . 90)=0 .25
Por lo tanto, esperamos que 25 de cada cien muestras, de tamaño 10, tengan una varianza
muestral inferior a 2360 horas2.
b) P(2360<s2<6768 )=F ( χ2=
9(6768 )602 )−F ( χ2=
9(2360)602 )
=F ( χ2=16 . 92 )−F ( χ2=5. 90 )=0 . 95−0 .25 = 0.70
Por lo tanto, esperamos que 70 de cada cien muestras, de tamaño 10, tengan una varianza
muestral mayor de 2360 horas2 pero menor de 6768 horas2.
1. Para una distribución Ji-cuadrada encuentre
a) χ0 . 0252
cuando v = 15 b) χ0 . 012
cuando v = 7 c)χ0 . 052
cuando v = 24
2. Para una distribución Ji-cuadrada encuentre los siguiente:
a) χ0 . 0052
cuando v = 5 b) χ0 . 052
cuando v = 19 c) χ0 . 012
cuando v = 12
3. Para una distribución Ji-cuadrada encuentre χ α2
tal que
14 José Armando Rodríguez Romo
EJERCICIOS 4
_______________________________________________________________________ Distribuciones Muestrales
a) P( χ2> χα2 )=0 . 99 cuando v = 4
b) P( χ2> χα2 )=0 . 025 cuando v =19
c)P(37 . 65< χ2< χα
2 )=0 .045 si v = 25
3. Encuentre la Probabilidad de que una muestra aleatoria de 25 observaciones, de una
población normal con varianza σ 2=6
, tenga una varianza muestral s2
a) mayor que 9.1 b) entre 3.462 y 10.745
4. Las calificaciones de un examen de colocación que se aplicó a estudiantes e primer año de licenciatura durante los últimos 5 años están aproximadamente distribuidos de forma
normal con una media de μ=74
y una varianza σ 2=8
. ¿consideraría aún que σ 2=8
es un valor válido de la varianza si una muestra aleatoria de 20 estudiantes que realizan este
examen de colocación este año obtienen un valor de s2=20
?
5. Muestre que la varianza de s2 para muestras aleatorias de tamaño n de una población normal disminuye conforma n se hace grande.
José Armando Rodríguez Romo 15