1 Distribuciones Muestrales

17
UNIDAD 1 DISTRIBUCIONES MUESTRALES OBJETIVO EDUCACIONAL Al término de esta unidad el alumno: Conocerá, comprenderá y aplicará la distribución muestral adecuada, de acuerdo a la situación que se le presente. Introducción El campo de la inferencia estadística trata básicamente con las generalizaciones y predicciones; es decir, deseamos conocer las características de una población o parámetros por medio de las características de una muestra o estadísticos. Población. Una población consiste en la totalidad de las observaciones en las cuales se está interesado. Muestra. Una muestra es un subconjunto de una población. 1

Transcript of 1 Distribuciones Muestrales

Page 1: 1 Distribuciones Muestrales

UNIDAD1

DISTRIBUCIONES

M U E S T R A L E SOBJETIVO EDUCACIONAL

Al término de esta unidad el alumno:

Conocerá, comprenderá y aplicará la distribución muestral adecuada, de

acuerdo a la situación que se le presente.

Introducción

El campo de la inferencia estadística trata básicamente con las generalizaciones y predicciones;

es decir, deseamos conocer las características de una población o parámetros por medio de las

características de una muestra o estadísticos.

Población. Una población consiste en la totalidad de las observaciones en

las cuales se está interesado.

Muestra. Una muestra es un subconjunto de una población.

Si las inferencias de la muestra de una población han de ser válidas, es importante obtener

muestras representativas de la población. Para eliminar cualquier posibilidad de sesgo, en el

procedimiento muestral, es conveniente seleccionar una muestra aleatoria en el sentido de que

las observaciones se realicen independientemente y al azar.

1

Page 2: 1 Distribuciones Muestrales

SPC Nivel Intermedio ____________________________________________________________________________

Muestra Aleatoria. Sean X1 , X2 ,…, X n variables aleatorias independientes,

cada una con la misma distribución de probabilidad f(x). se define entonces

a X1 , X2 ,…, X n como la muestra aleatoria de tamaño n de la población

f(x) y se expresa su función de probabilidad conjunta como

f ( x1 , x2 ,… , xn )= f ( x1 ) f ( x2)⋯f ( xn )

Parámetro. Una característica numérica de una población.

Estadístico. Cualquier función de las variables aleatorias que constituyen

una muestra aleatoria se l lama estadístico y representa una característica

numérica de una muestra.

Distribución Muestral. La distribución de probabilidad de un estadístico

recibe el nombre de distribución muestral.

Error Estándar. Es la desviación estándar de un estadístico en su

distribución muestral.

1.1 Teorema del Límite central

Suponga que se toma una muestra aleatoria de tamaño n de una población con media μ

y

varianza σ 2

. Cada observación en la muestra X1 , X2 ,…, X n

es una variable aleatoria

distribuida normal e independientemente, con μ

y varianza σ 2

. Entonces por la propiedad

reproductiva de la distribución normal se concluye que la media muestral

2 José Armando Rodríguez Romo

Page 3: 1 Distribuciones Muestrales

________________________________________________________________________ Distribuciones Muestrales

x̄=

x1+x2+⋯+xn

n

tiene una distribución normal con media

μ x̄=μ+μ+⋯+μ

n=μ

y varianza

σ x̄2=σ2+σ2+⋯+σ2

n2=σ2

n

Si se muestre una población que tiene una distribución desconocida, la distribución muestral de

la media seguirá siendo aproximadamente normal μ

y varianza σ 2/n

, si el tamaño de la

muestra es grande ( n≥30

). Este punto es uno de los teoremas más útiles en estadística; se le

conoce como teorema del límite central.

Teorema del Límite central. Si es una muestra aleatoria de tamaño n tomada de una

población (finita o infinita) con media μ y varianza σ2

, y si x̄ es la media muestral,

entonces la forma límite de la distribución de

z= x̄−μσ /n

conforme n→∞ , es la distribución normal estándar n( z ; 0 , 1) .

1.2 Distribución Muestral de la Media. Conocida

La aproximación normal para x̄

por lo general será satisfactoria sin importar la forma de la

población. Si n < 30, la aproximación es buena sólo si la población no es muy diferente de una

distribución normal y, si se sabe que la población es normal, la distribución muestral de x̄

José Armando Rodríguez Romo 3

Page 4: 1 Distribuciones Muestrales

SPC Nivel Intermedio ____________________________________________________________________________

seguirá siendo una distribución normal exacta sin importar qué tan pequeño sea el tamaño de

las muestras.

Ejemplo 1 Una empresa eléctrica fabrica focos que tiene una duración que se distribuye en

forma normal, con una media de 800 horas y una desviación estándar de 40 horas.

Encuentre la probabilidad de que una muestra aleatoria de 16 focos tenga una vida

promedio de 775 horas.

Solución

Sean: X = duración de los focos, en horas

X ~ Normal (μ=800 , σ=40

)

X > 0

x1 , x2 ,…xn n variables aleatorias independientes

x̄=∑i=1

n

x i

n

x̄ ~Normal ( μ x̄=800 , σ x̄=40 /√16=10)

x̄>0

z= x̄−μσ /√n

z ~n( 0 , 1)

−∞<z <+∞

Entonces:

P( x̄<775 )=F( z=775−80010 )=F (z=−2. 50 )=0 . 0062

4 José Armando Rodríguez Romo

Page 5: 1 Distribuciones Muestrales

________________________________________________________________________ Distribuciones Muestrales

Por lo tanto, esperamos que sólo 6 de cada mil muestras, de tamaño 16, tengan una media

muestral inferior a 775 horas.

José Armando Rodríguez Romo 5

Page 6: 1 Distribuciones Muestrales

SPC Nivel Intermedio ____________________________________________________________________________

EJERCICIOS 1

1. Si se extraen todas las muestras posibles de tamaño 16 de una población normal con media igual a 50 y desviación estándar igual a 5, ¿cuál es la probabilidad de que una media muestral ¯X caiga en el intervalo

que va de μ x̄−1 . 9σ x̄

a μ x̄+1 .9 σ x̄

? Suponga que las medias muestrales se pueden medir con cualquier grado de precisión.

2. Si el error estándar de la media para la distribución de muestras aleatorias de tamaño 36 de una población grande o infinita es 2, ¿qué tan grande debe ser el tamaño de la muestra para reducir el error estándar a 1.2?

3. Una máquina de refrescos se ajusta para que la cantidad de bebida que sirve promedie 240 ml con una desviación estándar de 15 ml. La máquina se verifica periódicamente tomando una muestra de 40 bebidas y se calcula el contenido promedio. Si la media de las 40 bebidas es

un valor dentro del intervalo de μ x̄±2σ x̄

, se piensa que la máquina opera satisfactoriamente; de otra forma se ajusta. Un funcionario de la compañía encuentra

que la media de 40 bebidas es x̄=236

ml y concluye que la máquina no necesita ajuste. ¿Esta fue una decisión razonable?

4. Las estaturas de 1000 estudiantes están distribuidas aproximadamente de forma normal con una media de 175.5 cm y una desviación estándar de 6.9 cm. Si se extraen 200 muestras aleatorias de tamaño 25 de esta población y las medias se registran al décimo de cm más cercano,

determine el número de medias muestrales que caen

a) entre 172.5 y 175.8 cm inclusive;

b) por debajo de 172.0 cm

5. Si cierta máquina fabrica resistores eléctricos que tienen una resistencia media de 40 ohms y una desviación estándar de 2 ohms, ¿cuál es la probabilidad de que una muestra aleatoria de 36 de estos resistores tenga una resistencia combinada de más de 1458 ohms?

6. La vida media de una máquina para hacer pasta es de 7 años con una desviación estándar de 1 año. Suponga que las vidas de estas máquinas siguen aproximadamente una distribución normal, encuentre

a) la probabilidad de que la vida media de una muestra aleatoria de 9 de estas máquinas caiga entre 6.4 y 7.2 años;

b) el valor de x̄

a la derecha del cual caería el 15% de las medias calculadas de muestras aleatorias de tamaño 9.

7. El tiempo que el cajero de un banco con servicio en el automóvil atiende a un cliente es una variable aleatoria con una

media, μ=3.2

minutos y una desviación

estándar, σ=1 .6

minutos. Si se observa una muestra aleatoria de 64 clientes, encuentre la probabilidad de que su tiempo medio sea

a) a lo más de 2.7 minutos

b) más de 3.5 minutos

c) más de 3.2 min pero menos de 3.4 min.

6 José Armando Rodríguez Romo

Page 7: 1 Distribuciones Muestrales

_______________________________________________________________________ Distribuciones Muestrales

José Armando Rodríguez Romo 7

Page 8: 1 Distribuciones Muestrales

SPC Nivel Intermedio ____________________________________________________________________________

1.2 Distribución Muestral de la Media. Desconocida. Distribución t – Student

Teorema 2.5. Sea Z una variable aleatoria normal estándar y V una variable aleatoria Ji-

cuadrada con v grados de libertad. Si Z y V son independientes, entonces la distribución

de la variable aleatoria T, donde

T= Z

√V /vestá dada por

h( t )=Γ [( v+1)/2 ]Γ (v /2 )√ πv (1+ t2

v )−(v+1 )/2

, −∞<t <+∞

Esta se conoce como la distribución t con v grados de libertad.

Corolario Sean X1 , X2 ,…X n variables aleatorias independientes que son todas

normales con media μ y desviación estándar σ . Sean

x̄=∑i=1

n x i

n y s2=∑

i=1

n ( x i− x̄ )2

n−1 ,

Entonces la variable aleatoria T= x̄−μ

s /√n tiene una distribución t con v = n – 1 grados de

libertad.

Para las aplicaciones de la distribución t Student (Tabla 3 del Apéndice), utilizaremos el

procedimiento siguiente:

Sean: X = una variable aleatoria continua

X ~ Normal ( μ , σ=? )−∞<x <+∞

x1 , x2 ,…xn n variables aleatorias independientes (n < 30)

x̄=∑i=1

n

x i

n ;s=√∑i=1

n

x i2−(∑

i=1

n

x i)2

/n

n−1

8 José Armando Rodríguez Romo

Page 9: 1 Distribuciones Muestrales

_______________________________________________________________________ Distribuciones Muestrales

T= x̄−μs /√n

T ~T Student ( v=n−1 gl)

−∞<T <+∞

Entonces:

a) P(X<a)=F( a)=F (t= a−μ

s/√n )

b) P(X>b)=1−F (b )=1−F (t=b−μ

s /√n )

c) P(a<X<b )=F (b )−F (a )=F (t=b−μ

s /√n )−F (t= a−μs /√n )

d) P(a>X>b )=F (a )+1−F (b )=F (t=a−μ

s /√n )+1−F (t=b−μs /√n )

Ejemplo 2 Un fabricante de focos afirma que su producto durará en promedio de 500 horas de

trabajo. Para verificar este promedio, esta persona prueba 25 focos cada mes. Si el valor

de t calculado cae entre −t0. 05

y t0.05

, él se encuentra satisfecho con esta afirmación.

¿Qué conclusión deberá él sacar de una muestra que tiene una media de x̄=518

horas y

una desviación estándar s=40

horas? Asuma que la distribución de los tiempos de vida

es normal?

Sean: X = tiempos de vida de los focos producidos por un fabricante, en horas

X ~ Normal ( μ=500 , σ=? )

x>0

x1 , x2 ,…xn n=25 variables aleatorias independientes (n < 30)

x̄=∑i=1

n

x i

n ;s=√∑i=1

n

x i2−(∑

i=1

n

x i)2

/n

n−1

José Armando Rodríguez Romo 9

Page 10: 1 Distribuciones Muestrales

SPC Nivel Intermedio ____________________________________________________________________________

T= x̄−μs /√n

T ~T Student ( v=n−1=24 gl)

−∞<T <+∞

Entonces: De la Tabla 3 obtenemos el valor de t0.05 para 24 grados de libertad. Por lo tanto, el

fabricante estará de acuerdo con esta afirmación si una muestra de 25 focos da un valor

de t entre -1.711 y 1.711.

T= x̄−μs/n

=518−50040 /√25

=2 .25

De aquí que el fabricante está en condiciones de concluir que sus focos duran más de 500

horas.

EJERCICIOS 2

1. Para la distribución T-Student encuentre:

a) t0.025 cuando v = 14

b)−t0. 10 cuando v = 10

c)t0.995

cuando v = 7

2. Para la distribución T-Student encuentre:

a) P(T <2. 3365 cuando v = 7b) P(T >1. 318 ) cuando v = 24c) P(−1.356<T <2 .179 cuando v = 12

d)P(T >−2. 567 )

cuando v = 17

3. Para la distribución T-Student encuentre:

a) P(−t 0. 005<T <t 0.01)

b) P(T >−t0. 025 )

4. Dada una muestra aleatoria de tamaño 24 de una distribución normal, con desconocida, encuentre k tal que

a) P(−2. 07<T<k )=0. 965

b) P(k<T<2 . 81)=0. 095

c)P(−k<T <k )=0 . 90

5. Una empresa manufacturera afirma que las baterías que utiliza en sus juegos electrónicos duran un promedio de 30 horas. Para mantener este promedio, se prueban 16 baterías cada mes. Si el valor

de t que se calcula cae entre −t0. 025

y t0.025

, la empresa queda satisfecha con su afirmación. ¿Qué conclusiones extraería la empresa de una muestra

que tiene una media x̄=27 . 5

hr y una

desviación estándar de s=5

hr? Suponga que la distribución de duraciones de las baterías es aproximadamente normal.

6. Una población normal con varianza desconocida tiene una media de 20. ¿Se tiene posibilidad de obtener una muestra aleatoria de tamaño 9 de esta

10 José Armando Rodríguez Romo

Page 11: 1 Distribuciones Muestrales

_______________________________________________________________________ Distribuciones Muestrales

población con una desviación estándar de 4.1? si no, ¿que conclusión sacaría?

7. Un fabricante de cierta marca de barras de cereal bajo en grasa afirma que su contenido promedio de grasa saturada

es 0.5 gramos. En una muestra aleatoria de 8 barras de cereal de esta marca el contenido de grasa saturada fue 0.6, 0.7, 0.7, 0.3, 0.4, 0.5, 0.4 y 0.2. ¿Estaría de acuerdo con esta afirmación?

1.3 Distribución Muestral de la Proporción

Suponga que una población es infinita y tiene una distribución binomial con P y Q = 1 P siendo

las probabilidades respectivas de que cualquier elemento exhibe o no cierta propiedad.

Consideremos todas las muestras posibles de tamaño n extraídas de esta población, y para cada

muestra determinemos el estadístico que es la proporción p̂ de éxitos. Entonces obtenemos

una distribución muestral de proporciones cuya media μ p̂ y desviación estándar σ p̂ están

dadas por

μ p̂=P y

σ p̂=√ PQn

=√ P(1−P )n

Para valores grandes de n (tales que nP≥5

y nQ≥5

), la distribución muestral se aproxima

a una distribución normal.

Ejemplo 3 Encuentre la probabilidad de que en 120 lanzamientos de una moneda balanceada a)

entre 40% y 60%, inclusive, sean águilas, b) 5/8 o más sean águilas.

Solución

Sean: X = número de águilas en una muestra de 120 lanzamientos

X ~ Binomial(n = 120, P= 0.50)

X = 0, 1, 2., . . . , 120

Pero

nP≥5 y nQ≥5

José Armando Rodríguez Romo 11

Page 12: 1 Distribuciones Muestrales

SPC Nivel Intermedio ____________________________________________________________________________

p̂~ Normal ( μ p̂=P=0 .50 , σ p̂=√ PQn

=√ 0 .5×0 .5120

=0.0456)

0< p̂<1

z=p̂± 1

2n−P

σ p̂

z ~n( 0 , 1)−∞<z <+∞

Entonces:

a)

P(0 . 4≤ p̂≤0. 6 )=F (z=0 .6+0 .0417−0 .50 . 0456 )−F (z=0 . 4−0 .00417−0 .5

0 .0456 )

P(0 . 4≤ p̂≤0. 6 )=F ( z=2. 28 )−F ( z=−2 .28 )=0 . 9887−0. 0113=0 . 9774

Por lo tanto, esperamos que 97.74% de las muestras, de tamaño 120, tengan una proporción de

águilas entre el 40% y 60%.

EJERCICIOS 3

1. Se ha encontrado que el 2% de las herramientas producidas por cierta máquina son

defectuosas. ¿Cuál es la probabilidad de que un cargamento de 400 de esas herramientas

sean defectuosas a) 3% o más, b) 2% o menos?

2. Los resultados de una elección demostraron que cierto candidato recibió el 46% de los votos.

Determine la probabilidad de que una encuesta de a) 200, b) 1000 personas de la población

votante seleccionadas al azar de la población ha mostrado mayoría de votos a favor del

candidato.

3. Un fabricante despacha 1000 lotes, cada uno de 100 bombillas eléctricas. Si normalmente el

5% de las bombillas es defectuoso, ¿en cuántos lotes esperaría usted encontrar a) menos de

90 bombillas buenas, b) 98 o más bombillas buenas?

1.4 Distribución Muestral de la Varianza. Distribución Ji-Cuadrada

Teorema 2.4. Si s2

es la varianza de una muestra aleatoria de tamaño n tomada de una

población normal que tiene la varianza σ2

, entonces la estadística

12 José Armando Rodríguez Romo

Page 13: 1 Distribuciones Muestrales

_______________________________________________________________________ Distribuciones Muestrales

χ2=(n−1)s2

σ2=∑

i=1

n ( x i− x̄ )2

σ2

tiene una distribución Ji-cuadrada con v = n – 1 grados de l ibertad.

Para las aplicaciones de la distribución 2 (Tabla 2 del Apéndice), utilizaremos el procedimiento

siguiente:

Sean: X = una variable aleatoria continua

X ~ Normal ( μ , σ2 )

−∞<X<+∞

x1 , x2 ,…xn n variables aleatorias independientes

s2=∑i=1

n

xi2−(∑

i=1

n

x i)2

/n

n−1

χ2=(n−1)s2

σ2

χ2 ~ Ji−cuadrada ( v=n−1 gl ) )

χ2>0Entonces:

a) P( s<a)=P (s2<a2 )=F( χ2=

(n−1 ) a2

σ2 )b)

P( s>b )=P (s2>b2)=1−F ( χ2=(n−1) b2

σ2 )

c)

P(a<s<b )=P(a2<s2<b2 )=F ( χ 2=(n−1) b2

σ 2 )−F ( χ 2=( n−1) a2

σ 2 )Ejemplo 4 Se sabe que la duración de los cinescopios para televisión fabricados por una

compañía se distribuye en forma normal con una media de 3000 horas y una desviación

estándar de 60 horas. Si se seleccionan 10 de estos cinescopios al azar, hallar la probabilidad de

que la varianza muestral: a) no exceda de 2360 horas2, b) se encuentre entre 2360 y 6768

horas2.

José Armando Rodríguez Romo 13

Page 14: 1 Distribuciones Muestrales

SPC Nivel Intermedio ____________________________________________________________________________

Sean: X = duración de los cinescopios, en horas

X ~ Normal (μ=3000 , σ=60 )

X > 0

x1 , x2 ,…xn n =10 variables aleatorias independientes

s2=∑i=1

n

xi2−(∑

i=1

n

x i)2

/n

n−1

χ2=(n−1)s2

σ2

χ2 ~ Ji−cuadrada ( v=9 gl) )

χ2>0Entonces:

a) P( s2<2360)=F ( χ2=

9 (2360 )602 )=F ( χ2=5 . 90)=0 .25

Por lo tanto, esperamos que 25 de cada cien muestras, de tamaño 10, tengan una varianza

muestral inferior a 2360 horas2.

b) P(2360<s2<6768 )=F ( χ2=

9(6768 )602 )−F ( χ2=

9(2360)602 )

=F ( χ2=16 . 92 )−F ( χ2=5. 90 )=0 . 95−0 .25 = 0.70

Por lo tanto, esperamos que 70 de cada cien muestras, de tamaño 10, tengan una varianza

muestral mayor de 2360 horas2 pero menor de 6768 horas2.

1. Para una distribución Ji-cuadrada encuentre

a) χ0 . 0252

cuando v = 15 b) χ0 . 012

cuando v = 7 c)χ0 . 052

cuando v = 24

2. Para una distribución Ji-cuadrada encuentre los siguiente:

a) χ0 . 0052

cuando v = 5 b) χ0 . 052

cuando v = 19 c) χ0 . 012

cuando v = 12

3. Para una distribución Ji-cuadrada encuentre χ α2

tal que

14 José Armando Rodríguez Romo

EJERCICIOS 4

Page 15: 1 Distribuciones Muestrales

_______________________________________________________________________ Distribuciones Muestrales

a) P( χ2> χα2 )=0 . 99 cuando v = 4

b) P( χ2> χα2 )=0 . 025 cuando v =19

c)P(37 . 65< χ2< χα

2 )=0 .045 si v = 25

3. Encuentre la Probabilidad de que una muestra aleatoria de 25 observaciones, de una

población normal con varianza σ 2=6

, tenga una varianza muestral s2

a) mayor que 9.1 b) entre 3.462 y 10.745

4. Las calificaciones de un examen de colocación que se aplicó a estudiantes e primer año de licenciatura durante los últimos 5 años están aproximadamente distribuidos de forma

normal con una media de μ=74

y una varianza σ 2=8

. ¿consideraría aún que σ 2=8

es un valor válido de la varianza si una muestra aleatoria de 20 estudiantes que realizan este

examen de colocación este año obtienen un valor de s2=20

?

5. Muestre que la varianza de s2 para muestras aleatorias de tamaño n de una población normal disminuye conforma n se hace grande.

José Armando Rodríguez Romo 15