UNIDAD II DISTRIBUCIONES MUESTRALESvirtual.usalesiana.edu.bo/web/conte/archivos/4384.pdf ·...

15
34

Transcript of UNIDAD II DISTRIBUCIONES MUESTRALESvirtual.usalesiana.edu.bo/web/conte/archivos/4384.pdf ·...

34

34

UNIDAD II

DISTRIBUCIONES MUESTRALES

Competencia:

-El estudiante debe saber utilizar las diferentes distribuciones muestrales ,es decir las diferentes

distribuciones de cualquier estadístico estimado a partir de muestras aleatorias para realizar

eficientemente la Inferencia Estadística

Objetivos.

-Utilizar correctamente el concepto de muestra aleatoria en las diferentes distribuciones

muestrales ,para realizar generalizaciones respecto de una población en base a estadísticos

Descripción general de la unidad:

-Esta unidad comprende el desarrollo de los siguientes conceptos:Población-Parámetro Muestra

aleatoria-Estadístico; Distribución muestral:de la Media ,Diferencia de Medias,de la Proporción y

la diferencia de Proporciones,de la Varianza y razón de Varianzas,con sus respectivas

distribuciones especiales como: la “t” student,La Normal,La “Chi Cuadrado” y La “F” de Fisher.

Lectura:Millar/Freund/Jonson “Probabilidad y Estadística para Ingenieros”Edo.de

México 1992 Pgs. 187 al 205

Bibliografía Básica: Moya y Saravia (1988) “Probabilidad e Inferencia Estadística((2ª

ed) Perú .Pags.559 al 623

Referencia electrónica:

http://www.itcomitan.edu.mx/tutoriales/estadística/contenido/unidad_2_4.html

35

INTRODUCCIÓN Se llama distribución muestral, cuando la variable resulta ser un estadístico o estadígrafo, calculado en base a los datos de una m.a. Estos estadísticos se utilizan para realizar inferencia estadística para la toma de decisiones, respecto alguna característica de la población ó respecto a la distribución de la misma. Para desarrollar las distribuciones muéstrales es necesario recordar algunos conceptos básicos: POBLACION f(x);P(x);X,Y Estadísticamente población es el conjunto de todas las observaciones posibles que puede tomas una v.a. X. Por lo tanto la distribución de la población es la distribución de la v.a. X. Las poblaciones de acuerdo a su magnitud pueden ser: POBLACIONES FINITAS (N) Son aquellas que están limitadas o acotadas POBLACIONES INFINITAS Son aquellas que no están imitadas, estadísticamente las poblaciones muy grandes se las consideran infinitas. - El proceso para obtener la información de toda la población es el CENSO PARÁMETROS Son todas las medidas descriptivas que caracterizan a la población como por ejemplo la

media = , la varianza 2 etc. Los parámetros se denotan con las letras griegas MUESTRA ALEATORIA

(m.a n) una m.a. de tamaño “n” es un subconjunto representativo de la población, el proceso para obtener la información se llama muestreo ESTADISTICO, Son todas las medidas descriptivas que se obtienen a partir de la información de al m.a. como por ejemplo: la media = x , la varianza= S2 etc. Generalmente se las denota con

las letras castellanas. DEFINICIÓN DE m.a.

Dada una población f(x);P(x) ó X con media y varianza 2 Se llama m.a. De tamaño “n” al conjunto de n.v.a X1, X2,... Xn tal que satisfacen 2 requisitos:

1. Xi son independientes donde la distribución conjunta es a) Si X es discreta )()()....()(),....,( 2121 xPXpXPXPXXXP nn

b) Sí X ex continua )()()....()(),....,( 2121 xfXfXfXfXXXf nn

2. Xi tienen la misma distribución X a) f(xi) = f(x)ó P (xi)= P(x); i=1,2…n

b) 2)(;)( ii xVxE

36

Nota. Esta definición es valida cuando:

1. La población es infinita con ó sin reposición 2. La población es finita, con reposición

Ejemplo

Sea una población X N ( , 2), se toma un m.a. tamaño n X1, X2,... Xn

a) Escribir la función de probabilidad conjunta de la m.a.

b) Sí n = 6 ; =20; 2 =25 Calcular la probabilidad de que b) X1 +X3+ X4 -X6 sea mayor que 52

DEFINICIÓN

como X N ( , 2) sabemos que f(x)=

2

2

1

2

1x

e

a) la función de probabilidad conjunta de la m.a. de tamaño “n” es

f(X1, X2,... Xn)=

n

n

iini

x

exfxfxfxfxf

2

2

1

2

1)()()()...()( 2

b) Sí X1 +X3+ X4 -X6 =Y por la propiedad reproductiva Y N( y y2), donde:

y=E(Y)=E(X1 +X3+ X4 -X6)= E(X1)+E(X3)+E( X4 )-E(X6)=20+20+20-20=40

y2=V(Y)= V(X1 +X3+ X4 -X6)= V(X1)+V(X3)+V( X4 )-V(X6)=25+25+25-25=100

y=10

Mediante el teorema central del limiteY

YYZ ; (0.1)

1151.02.112.112.110

405252 FZPZPZYP

DISTRIBUCIÓN MUESTRAL DE LA MEDIA

Sea una población X con media y varianza 2 del cual se toma una m.a. de tamaño n: X1, X2,... Xn del cual se obtiene su media muestral x

Se cumple: a) ;)(xE

b) n

xV2

)(

37

c) nx

Z ; N (0.1)

Nota

1) Cuando xnn

N j

2

cuando n 30, no importa si la población es

discreto o continuo

2) Cuando n 2 si X N( , 2) x n

N2

3) Si el muestreo es sin reemplazo de una población finita de tamaño N

V x1

22

N

nN

nx factor de corrección

Ejemplo Suponiendo que una población consta de los siguientes valores observados:3,4,7,9,12. Calcular

a) La media y Varianza poblacionales b) Determinar la distribución muestral de la media de la m.a. de tamaño 2 escogidos

con reposición c) Se extrae una m.a de tamaño 36 con reposición cual la 85 xP

SOLUCIÓN

Como N 5 75

129743

N

xi

2863.3;8.105

547

5

299)( 2222 xPx

b) La distribución muestral de la media se obtiene mediante:

12.12

12.9

12.7

12.4

12.3

9.12

9.9

9.7

9.4

9.3

7.12

7.9

7.7

7.4

7.3

4.12

4.9

4.7

4.4

4.3

3.12

3.9

3.7

3.4

3.3

12

9

7

4

3

12

5.10

5.9

8

5.7

12

5.10

9

8

5.6

6

9

5.9

8

7

5.5

5

8

5.6

5.5

4

5.3

4

5.7

6

5

5.3

3

3

x

x

x

x

x

x P( x ) x P( x ) 2x P( x )

3

3.5

4

5

5.5

6

6.5

7

7.5

8

9

9.5

10.5

12 25

1

252

252

251

254

252

251

252

252

252

252

251

252

251

253

2512

259

25144

TOTAL 25

175

38

4.5725

1360)(

725

175

2222 xPxxV

xPxxEx

x

c) Se extrae una m.a. tamaño 36 con reposición

n = 36 sabemos que xnx

Zyn

2

,

7

2863.3

3678

2863.3

367512863.32 ZP

9664.009664.065.3)83.1(

65.383.183.165.3

FF

ZPZPZP

DISTRIBUCIONES ESPECIALES UTILIZADAS EN PRUEBAS Cuando las m.a, son pequeñas n<30 no se pueden suponer que la distribución muestral es NORMAL, TAMPOCO SE PUEDE APLICAR EL teorema central del limite, por lo que se debe recurrir otras distribuciones muéstrales las especiales que estén relacionadas con la NORMAL;entre estas distribuciones tenemos: la CHI-cuadrado, la t-Student y la F de Fisher

DISTRIBUCIÓN CHI CUADRADO 22 XÓX R

Es un caso particular de la distribución gamma, tiene muchas aplicaciones entre ellas para la construcción de IC y las pruebas de Hipótesis de la Varianza DEFINICION

Sean r v.a. independientes: Z1,Z2,…Zr tal que Zi N (0.1)

Sumando los cuadrados r

i

ir ZZZZ1

2222

21

2rX grados de libertas, Sii

FUNCIÓN DE DENSIDAD

XeXxfXV

r rx0;

2

122

22

1

2

;esc Donde = función gamma

r = grados de libertad o Nº de variables

R=1

R=3 R=7 R=10

39

CARACTERÍSTICAS

1) A medida que aumente los grados de libertad tienden a normalizarse

2) LA MEDIA rxE )( 2

3) LA VARIANZA rxE 2)( 22

PROPIEDAD REPRODUCTIVA Sean K v.a. independiente: X1, X2,... Xk tal que Xi ~ X2

(ri)

Si sumamos 2

iX ~ 2

1

k

i

ir

X

FUNCIÓN DE DISTRIBUCIÓN

dxxfXxPxFx

)()(2

0

2

Cuando 11 22 XxPXxP

USO DE TABLAS Dada la importancia y la complejidad de su calculo, se tiene confeccionado tablas, en base a la función de distribución con 2 entradas, donde: La 1ra columna representa los grados de libertad “r” La 1ra fila representa el nivel de significancia ó probabilidad 10

La intersección de fila columna de le valor critico 2X

Ejemplo 1

X ~ 2

26X Determinar las siguientes probabilidades

a) 29.17xP

b) 88.38xP

c) 64.4584.13 xP

d) 40xP

SOLUCIÓN Como v=26

1

F(x)

40

a) 10.029.17 210.0XxPxP

b) 05.095.01188.38188.38 295.0XxPxPxP

c) 965.0025.099.084.1364.4564.4584.13 2025.0

299.0 XxPXxPxPxPxP

d) 96.040 296.0XxPxP mediante interpolación

96.0409.41

975.0

9.3840

95.0

975.0

9.4140

95.0

9.38

Ejemplo 2

Si X 2rX hallar los valores críticos:

a) “a” tal que 30999.0 rsiaxP

b) “a” y “b” tal que 1395.0 rsibxaP ; además 023.0bxP

c) “a” tal que 8015.0 rsiaxP

a) 7.59999.07.5930999.0 axPrsiaxP

b) 95.0)(95.0 axPbxPbxaP

como 7.24975.0025.01025.0)(1025.0)( bbxPbxP

c) 8015.0 rsiaxP

interpolando

8267.13533.018.2

015.0

01.0

53.0

18.2

025.001.0

025.0015.0

18.265.1

18.2

01.0

65.1

015.0025.0

18.2

a

a

aa

DISTRIBUCIÓN MUESTRAL DE LA VARIANZA DEFINICIÓN

Sea una v.a. ó una población X N( , 2) donde ,y 2 son desconocidos, por lo tanto se toma una m.a. de tamaño n para estimar la media x y la varianza S2 tal que

41

a) x y S2.son dos estadísticos independientes donde n

xxS

i

2

2 además la

varianza muestral insesgada es 1

ˆ2

2

n

xxS

i

b) El estadístico2

2ˆ1 SnX2(n-1) g.d.l. cuando n

c) n

nSE

22 1

d) 2

2nS X2(n-1) g.d.l.

Ejemplo

Se tiene una población X N( , 2)del cual se toma una m.a. tamaño 15 y se tiene S2. Calcular:

a) 9427.13107.02

2SP ;

b) 0814.2ˆ

3329.02

2SP

SOLUCION a)

98.001.099.0

6605.41405.291405.296605.4

)15(9427.115.03107.09427.13107.0

2

01.0

2

14

2

99.0

2

14

2

14

2

14

2

14

2

142

2

XXPXXP

XPXPXP

XPS

P

;

b)

98.001.0991.0

6606.491396.291396.26606.4

)14(20814.0)14(3329.00814.2ˆ

3329.0

214

214

214

2142

2

XPXPXP

XPS

P

DISTRIBUCIÓN t –STUDENT (T) - Es otra distribución relacionada con la NORMAL y la gamma que se usa principalmente en las estimaciones y en las pruebas de hipótesis de la media cuando las m.a. son pequeñas:n<30 DEFINICIÓN Sean 2 variables aleatorias independientes:

- Z N(0.1); Y 2RX dividiendo ambas variables

r

Y

ZT Se dice que tiene una distribución t-student con v grados de libertad Sii

42

FUNCION DE PROBABILIDAD

tr

tfr

t

r

r

:12

2

2

1

Esta distribución está completamente determinado solo por el parámetro r Gráficamente tienen las siguientes características

1) Es simétrica con respecto t=0= 2) Cuando n o v se hace grande tiende a normalizarse 3) Tiene mayor dispersión que la normal

t=0= ESPERANZA MATEMÁTICA

1;0)()( rdttftTExE

VARIANZA

2;2

0)()()( 22222 vr

rdttftttETV

USO DE TABLAS Dada la importancia en la Estadística Inferencial y la complejidad de su calculo, se tiene confeccionado tablas con 2 entradas. Esta tabla esta confeccionada en función de la acumulada tTP Donde en la primera

fila se tiene los percentiles o probabilidades en la primera columna se tiene los grados de libertad n ó r, la intersección de fila columna corresponde a los valores críticos

t Porque dttftTPt

)(

Como la distribución es simétrica itt

N(0.1)

r=5

r=3

f(t)

t

43

Ejemplo Determinar el valor critico de 90.0tTP con v=5 g.d.l.

SOLUCIÓN

90.0176.1TP

EJEMPLO 2 Determinar el valor crítico de 10.0tTP con v=5 g.d.l.

SOLUCIÓN

010476.190.010.01 TPtTPtTP

DISTRIBUCIÓN DE S

nx t(n-1)g.d.l.

LA V. A. O ESTADÍSTICO Ejemplo Si x es la media y S2 es la varianza de una m.a. de tamaño 9 seleccionado de una

población NORMAL con media 90 Calcular

245.075.0995.0

7059.03549.33549.37059.0

91183.192353.01183.190

2353.0

888 TPTPTP

TPs

xP

DISTRIBUCIÓN F O DE FISHER X órrF 21,21 ,; rrf

Esta distribución especial generalmente se utiliza para comparar las varianzas de 2 v.a independientemente o de 2 poblaciones normales, mediante los IC y las pruebas de hipótesis sobre sus varianzas mediante la razón de las mismas DEFINICIÓN

Sean 2 v.a. independientes V 2

2rx y r 2

2rx

Si se donde 2

1

rV

rU

F ...)( 21 ldgrrF Sii

44

FUNCIÓN DE DENSIDAD

Zvv

Zfvv

vv

F

vv

0;

0

22

212

21

2

12

2

1

21

Cuya gráfica nos permite determinar sus características

1) A medida que aumentan los grados de libertad tienen a normalizarse de manera positiva

MEDIA

2;2

)()( 2

2

2 vv

vFEF

2) VARIANZA

4;4)2(

2)()( 2

22

21

21222 v

vvv

vvZvFVF

FUNCIÓN DE DISTRIBUCIÓN O ACUMULADA

fFPxF

Cuando 11 fFPFFP

criticovf .

USO DE TABLAS Se tiene 3 entradas: La 1ra columna representa los g.d.l. del denominado r2

La 2da columna representa la probabilidad (p= )

La 1ra fila representa los grados de libertad (g.d.l.) del numerador r1

La intersección de filas columnas nos da el valor critico f

ff(2)

F(10.2)

F(10.2)

1-

F(x)

45

Ejemplo 1

Si X )5.4(F hallar probabilidades

a) 39.7xP

b) 4.11xP

c) 8xP

d) 0645.0xP

Solución Como v1= 4: v2=5 a) 975.039.7 975.0fxPxP

b) 01.099.0114.1114.11 99.0fxPxPxP

c) 9773.08 9773.0fxPxP interpolando

Ejemplo 2

Si F F(6,10) Hallar el valor “c”(valor crítico) tal que a) 99.0cxP

b) 05.0cxP

SOLUCIÓN

a) 246.099.0246.099.0 cxPcxP

b) 22.395.022.3

95.005.0105.0

cxP

cxPcxPcxP

DISTRIBUCIÓN MUESTRAL DE LA PROPORCION

Sea una población X b(n.p) Donde se desconoce p, se toma una m.a. tamaño “n”: X1,

X2,... Xn se estima la proporción n

x

np

X ...X X n21

Donde

1) xEnn

xEpE p

1)( de la distribución binomial E(x)=np

reemplazando pnpn

pE1

)(

2)

n

pqnpq

n

xVnn

xVpV

2

2

1

)(1

de la binomial V(x)= npq

n

pPÓ

n

pq

n

pqpV pp

)1(

3) Cuando n

n

pq

ppZcavla ... :Z N(0.1)

46

Nota 1 Si la m.a. de tamaño”n” se obtiene de una población finita de tamaño N Sin reemplazo

1N

nN

n

pqp

Zpp

Z

NnN

n

pq:

1

N(0.1)

El factor de corrección por continuad en la distribución muestral de proyección es n2

1

Ejemplo Suponiendo que un lote de 50 ordenadores hay 10 defectuosos Cual la probabilidad de que en una m.a. de tamaño n, ordenadores elegidos al azar

1) Con reposición a)n=5 b)n=60 :i)20%; ii) más de 20% ordenadores sean defectuosos

2) SIN REPOSICION SOLUCION

1. con reposición :n=5; 80.0:2050

10qp

a)

i) X b(5;0.20) donde X:”Nº de PC ordenadores entre 5 con reposición

5...2,1,0:)80.0(20.0)( 55

x

xxRxxP

x= el 20% de 5=1

4096.08.020.01)1(20.04

5

xPpP

2627.07373.01)20.0;5;1(111120.0) BXPXppPii

b) i) con n=60 como n>30 podemos aproximar mediante la normal

5.125.111220.0 xPocorrigiendxPpP

Estandarizando mediante 0984.3

12

)80.0)(2.0(60

)20.0(60 xxZ

1272.01)16.0(2

16.0116.016.016.016.016.0

16.016.00984.3

125.12

0984.3

125.1112

F

FFFFzPZP

ZPZPxp

47

Mediante la binomial 1278.08.020.012)12(4812

60

xP

Aplicando la verdadera distribución de la proporción, mediante

n

pq

ppZ donde el factor de corrección es

n2

1

)60(2

120.0

)60(2

120.0)020( pPpP

2083.01917.0 pP ; estandarizado

16.016.020.02083.00201917.0

60

)80.0)(20.0(

60

)80.0)(20.0(ZPZP

1272.01)5636.0(2116.02

16.0116.016.016.016.016.0

F

FFFFzPzP

ii) 20.0pP Binomialmente

)(11211212

0

xPxPxP como es demasiado largo recurrimos mediante

la aproximación a la normal, mediante

5.1215.01215.0

xPxpnpq

npxZ donde np=(60)(0.2)=12

estandarizando 4364.05636.01)16.0(116.010984.3

125.121 FzPzP

mediante la distribución de la proporción

n

pq

ppZ cuyo factor de corrección es

n21

)60(2

120.0120.0120.0 pPpPpP

4364.05636.0116.0116.010516.0

0083.01

20.02083.01tan2083.01

60

)80.0)(20.0(

FZPzP

ZPdarizandoespP