Sesion 2 No Para 2014 I

20
1 Estimación de Parámetros La Inferencia Estadística comprende: Estimación Puntual Estimación por Intervalos. LIC. RITA GUZMAN LOPEZ ESTADISTICA NO PARAMETRICA Pruebas de Hipótesis ESTIMACION DE PARAMETROS Estimación Puntual LIC. RITA GUZMAN LOPEZ ESTADISTICA NO PARAMETRICA

Transcript of Sesion 2 No Para 2014 I

Page 1: Sesion 2 No Para 2014 I

1

Estimación de Parámetros

La Inferencia Estadística comprende:

Estimación Puntual

Estimación por Intervalos.

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

Pruebas de Hipótesis

ESTIMACION DE PARAMETROS

Estimación Puntual

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

Page 2: Sesion 2 No Para 2014 I

2

Es la estimación de un valor único de uná t d l bl ió

Estimación Puntual:

parámetro de la población.

Esto es, la estimación por puntos o puntual esuna selección única para el valor de un parámetrodesconocido.

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

Comparaciones entre Estimadores

Supongamos que un dirigente deportivo debe escoger un tirador de tiro al blanco para lospróximos Juegos Olímpicos.

Para ello el dirigente convoca a 3 participantes y los somete a pruebas de tiro, obteniendo lossiguientes resultados:

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

Claramente el tirador 3 es nuestra mejor carta, ya que en promedio le da al blancoy la dispersión de sus tiros es baja.

Page 3: Sesion 2 No Para 2014 I

3

¿Qué sucede si se enferma este último tirador?. ¿Es claro quién es mejortirador entre el 1 y el 2?

V ti d

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

Veamos por tirador:-El tirador 1 llega menos al blanco (2 de 8 en el blanco), pero sus tiros son menosdispersos.

-El tirador 2 llega en 4 de 8 veces al blanco, es decir, en promedio llega más alblanco, pero sus tiros son más dispersos.

Este problema es análogo al tipo de problemas que vamos a tratar:

ˆ ˆ ˆSean y dos estimadores de θ, tales que es sesgadopero de varianza pequeña, y insesgado pero de varianzagrande.

¿Cuál escojo?

1θ̂ 2θ̂ 1θ̂2θ̂

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

Page 4: Sesion 2 No Para 2014 I

4

ESTIMACION PUNTUAL

La estimación puntual consiste en utilizar datos muestralespara estimar el valor del parámetro desconocidos de unapoblación mediante un solo valor obtenido de un estadísticodeterminado.

Por ejemplo, si se pretende estimar la talla media de undeterminado grupo de individuos, puede extraerse unamuestra y ofrecer como estimación puntual la talla media dela muestra de individuos

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

la muestra de individuos.

Estimador Puntual: Sea X una v.a. con función de densidad deprobabilidad f(x;ɵ), (“ɵ” denota al parámetro desconocido de la población).

Sea X1, X2,…, Xn una m.a. extraída de esta población.

Un estimador puntual del parámetro “ɵ” es una función de lasobservaciones X1, X2,…,Xn y se escribe:

),...,,(ˆ21 nXXXG=θ

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

cuyo valor numérico particular se toma como una aproximación de “ɵ”, este valor se llama estimador puntual de “ɵ”.

),...,,(ˆ21 nxxxG=θ

Page 5: Sesion 2 No Para 2014 I

5

Por ejemplo : Un estimador puntual de la media poblacional “μ”(esto es Θ=µ), es la estadística media muestral (esto es, )cuyo valor numérico es la estimación puntual del parámetro,esto es, .

x X X=Θ̂

x=θ̂

Algunas observaciones a ser consideradas:

Un estimador (en particular el estimador puntual) es una función de “n”v.a. independientes observables (valores muestra). Las estimacionesobtenidas de tal función variarán de una muestra a otra. Por lotanto , cada estimador tiene su propia estimación:

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

( ) ( ) ( )nnXXX xfxfxfxxxfn

...),...,,( 2121,...,, 21=

Puede haber varios posibles estimadores diferentes para unparámetro.

Por ejemplo: si queremos estimar la media de una variablealeatoria se puede considerar La media muestral o laaleatoria, se puede considerar. La media muestral o lamediana muestral, como estimadores puntuales.

Entonces, para estimar “θ” debe escogerse una función de lamuestra que dé el “mejor estimador” de “θ”.

La distribución de un buen estimador debería concentrarse lomás cerca posible del erdadero alor del parámetro de la

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

más cerca posible del verdadero valor del parámetro de lapoblación.

Page 6: Sesion 2 No Para 2014 I

6

Ejemplo: supongamos que “θ” es el valor verdadero de unparámetro poblacional y que y son diferentesestimadores de “θ” con funciones de densidad de probabilidadque muestra en la gráfica:

21 ,θθ))

3θ)

( )3θ̂f

( )2̂θf ( )1̂θf

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

Para decidir, que estimador puntual de un parámetro particular“ɵ” es mejor, se necesita estudiar sus propiedades estadísticas.

θ

PROPIEDADES DE UN BUEN ESTIMADOR

Supongamos que tenemos dos estimadores del mismoparámetro poblacional “θ”.

Nos preguntamos : ¿Cuál de los dos estimadores es mejor?

21ˆˆ θθ y

Surgen dos situaciones :

a) No es posible conocer el verdadero valor del parámetro “θ”, siendo así no podremos afirmar que es más adecuado que

, o viceversa 2̂θ

1̂θ

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

b) Si tuviéramos dos estimadores de “θ” , , trataremos de encontrar algún criterio para decir cuál de ellos es mejor.

21ˆˆ θθ y

Para poder determinar dichos criterios es necesario considerarlas siguientes definiciones:

Page 7: Sesion 2 No Para 2014 I

7

ERROR CUADRATICO MEDIO

El error cuadrático medio tiene la siguiente definición:

Sea X1,…,Xn una m.a. extraída de una población con función1 n p

de densidad f(x,ɵ), y seaun estimador del parámetro ɵ.

Se denomina error cuadrático medio (E.C.M) del estimador“T” al valor dado por:

),...,(ˆnXXtT 1==θ

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

ECM [ T ]= Var[ T ] + (E( T ) - ɵ)2

Dicha expresión se obtiene de :

ECM [T]= E[e2]=E[(T- θ)2] =Luego:

E[[ T-E(T +E(T)-θ ]2]= E[(T-E(T))2 + 2(T-E(T))(E(T)-θ) + (E(T)-θ)2 ]=constante

-E(T) +E(T)( )( ) + (E(T)-θ)2(T-E(T))2 + 2(T-E(T)) (E(T)-θ)

Luego:

=

=E[(T-E(T))2] + 2 (E(T)-θ) E[(T-E(T))] + (E(T)-θ)2=

= E[( T - E(T) )2] + ( E(T) - θ )2 = {E(T2)-E2(T)} + (E(T)-θ)2E(T2-2TE(T)+E2(T) )

constante

=0

Entonces: ECM [T]= Var[T] + (E(T) - θ)2

+ (E(T)-θ)2E[(T - E(T))2] + 2 (E(T)-θ) E[ ( T - E(T))] + ( E(T) - θ )2 E[( T - E(T) )2]

+ (E(T)-θ)2(E(T2)-E2(T))T2 – 2 T E(T) + E2(T) + ( E(T) - θ )2

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

[ ] [ ] ( ( ) )

Donde : Sesgo(T) = E[T] - θ , (sesgo del estimador)

Page 8: Sesion 2 No Para 2014 I

8

Lo que buscamos es mínimizar ECM ( ) y esto se obtiene si:

í V( )

T=θ̂

Tθ̂

ECM [T]= Var[T] + (E(T) - θ)2

mín V( ) y

(E(T)-θ)2 =0

T=θ

Sesgo(T) = E[T] - θ = 0 ,.. insesgado

Entonces estaremos interesados en un estimador con mínima varianza y quesea insesgado

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

sea insesgado.

Distribución Chi-cuadrado (X2) : Sea “X” una v.a. que

tiene una distribución Chi-cuadro con “r” grados de libertad.

MEDIA Y VARIANZA DE LA FUNCION DE DISTRIBUCIÓN X 2

g

La media y varianza de la variable aleatoria chi-cuadrado con

“r” grados de libertad son:

rXEE )()( 2 === χμ

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

rXVarV 2)()( 22 === χσ

Page 9: Sesion 2 No Para 2014 I

9

PROPIEDADES DE UN BUEN ESTIMADOR

Un buen estimador, es aquel que está más cerca del parámetroque se estima.

Para que un estimador puntual sea un buen estimador debecumplir con ciertas propiedades, 3 de las cuales son:

Insesgabilidad,

consistencia,

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

eficiencia

ESTIMADOR INSESGADO

Definición :

Sea X1, X2,…,Xn una m.a.s extraída de una población conf( )función de densidad f(x;ɵ).

Sea un estimador puntual de “ɵ”.

Se dice que el estadístico es un estimador insesgado

del parámetro “ɵ” si:

),...,,(ˆ21 nXXXtT ==θ

T=θ̂

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

[ ] θθθ ∀= ,ˆE

Page 10: Sesion 2 No Para 2014 I

10

Ejemplo:

Sea X1,X2,…,Xn una m.a.s extraída de una población N(μ,σ2)

a) Probar que es un estimador insesgado de μ

b) Probar si es un estimador sesgado de σ2

X

1

)(1

2

2

−=∑=

n

XXS

n

ii

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

c) Probar si es un estimador sesgado de σ2n

XXn

ii∑

=

−= 1

2

2)(

σ̂

a) Sabemos X1,X2,…,Xn una m.a.s extraída de una población N(μ,σ2)

[ ] ∑∑= =⎥

⎤⎢⎡

=⎥⎥⎤

⎢⎢⎡

=n

n

ii

XEX

EXE 1 1[ ]

[ ]∑ ∑

= =

=

===

=⎥⎦

⎢⎣

=

⎥⎥⎥

⎦⎢⎢⎢

=

n

i

n

ii

ii

nn

nXE

n

XEnn

EXE

1 1

1

11 μμμ

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

X es un estimador insesgado de μ

Page 11: Sesion 2 No Para 2014 I

11

Donde el Esperado de una variable que se distribuye como unachi-cuadrado es: n-1

b) Sabemos que :2

)1(2

2)1(−≈

−n

Sn χσ

chi-cuadrado es: n-1

[ ]222

2

22

2

222

)1(

)1(1)1(

))(1(σ

σσσ

⎤⎡

=⎥⎦

⎤⎢⎣

⎡ −−

=⎥⎦

⎤⎢⎣

⎡−

−=

S

Snn

En

SnESE

Entonces:

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

22

2

22

)1()1(

)1()1(

σσσ

σ=−

−=⎥

⎤⎢⎣

⎡ −−

nn

SnEn

Por tanto, S2 es un estimador insesgado de σ2

ESTIMADOR CONSISTENTE

Generalmente, un estimador puntual no es idéntico alparámetro que se estima, esto debido a la presencia del errorde muestreo : θθ −= ˆe

Pero esperamos que un buen estimador tenga su valor muycercano al valor verdadero del parámetro o por lo menos tengauna alta probabilidad de acercarse.

Es decir un buen estimador debe tener la propiedad deconsistencia.

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

Page 12: Sesion 2 No Para 2014 I

12

Consistencia: se dice que

es una sucesión consistente de estimadores de “ɵ” si:),...,,(ˆ

21 nnn XXXtT ==θ

[ ] 0ˆlim =∞→ nnVar θ[ ] θθ =

∞→ nnE ˆlim

nθ̂Si es un estimador insesgado, obviamente la primera condición estará satisfecha.

1) 2)

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

Ejemplo:

Sea X1,X2,…Xn una m.a.s extraída de una población N(μ,σ2).

)( 2∑ XXn

a) Demostrar que es un estimadorconsistente de σ2.

b) Demostrar que es un estimador consistente de σ2.

n

XXn

ii∑

=

−= 1

2

2)(

σ̂

1

)(1

2

2

−=∑=

n

XXS i

i

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

Page 13: Sesion 2 No Para 2014 I

13

a) i) [ ]

222

2

22

2

222

)1(

)1(1)1(

))(1(σ

σσσ

⎤⎡

=⎥⎦

⎤⎢⎣

⎡ −−

=⎥⎦

⎤⎢⎣

⎡−

−=

S

Snn

En

SnESE

Entonces, aplicando el limite:

22

2

22

)1()1(

)1()1(

σσσ

σ=−

−=⎥

⎤⎢⎣

⎡ −−

nn

SnEn

[ ] 222 limlim σσ ==∞→∞→ nn

SE

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

Cumple con la primera condición:

Ahora analizaremos si cumple con la segunda condición:

Sabemos que , entonces )1(2])1([ 2

2

−=− nSnVarσ

2)1(2

2)1(−≈

−n

Sn χσ

ii) ])1([)1(

])1(1

[][ 2

2

2

42

2

22

σσ

σσ SnVar

nSn

nVarSVar −

−=

−−

=

12)]1(2[

)1(][

4

2

42

−=−

−=

nn

nSVar σσ

2 4σ

Luego:

Aplicando limite:

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

01

2lim][lim 2 =−

=∞→∞→ n

SVarnn

σ

Por tanto, S2 es un estimador consistente.

Page 14: Sesion 2 No Para 2014 I

14

Definición:

Sea X1 X2 X una m a s extraída de una población con

ESTIMADOR EFICIENTE

Sea X1,X2,…,Xn una m.a.s. extraída de una población con función de densidad de probabilidad f(x,θ).

Sean dos estimadores insesgados del mismo parámetro .

Se dice que el estimador es más eficiente que

'21ˆˆ

nn TyT == θθ

1̂θ 2̂θ

θ

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

]ˆ[]ˆ[ 21 θθ VarVar <Si y sólo si :

Ejemplo:

Sea X1,X2,…,Xn una m.a.s. extraída de una población N(μ,σ2).

][xMed=μ (media Poblacional = mediana Poblacional, simetría)

de la media poblacional).

Además se sabe que la mediana muestral es aproximadamente

~ 2σπ

XyX ~ˆˆ == μμ (media muestral, mediana muestral dos Estimadores

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

¿Cuál de los dos estimadores es más eficiente para la medianapoblacional?

)2

],[(~n

XMedNX σπ≈

Page 15: Sesion 2 No Para 2014 I

15

Por el enunciado sabemos que:

),(2

nNX σμ≈

μ=)(XELuego:

Son estimadores insesgados

)2

],[(~ 2

nXMedNX σπ

12

2][]~[

2

2

>== πσ

σπ

n

nXVarXVar

μ=)~(XEg

de la mediana poblacional

Usando la razón de varianza:

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

entonces, , luego es un estimador más eficiente que

n

]~[][ XVarXVar < XX~

1.Método de Máxima verosimilitud

Consiste en tomar como valor estimado de “θ” , el valor que hacemáxima la función de verosimilitud L(θ).

METODOS DE ESTIMACION PUNTUAL DE PARAMETROS

( )

Definición: Sea X una variable aleatoria cuya función de probabilidadf(x) depende de un parámetro “θ” (f(x;θ)).

Sea X1,…,Xn una m.a.s de X y sean x1,x2,…,xn los valores observadosde la muestra. La función de verosimilitud de la muestra se define asi:

∏n

f )( θ

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

L(θ)=f(x1,x2,…,xn;ɵ)=f(x1;ɵ) f(x2;ɵ)… f(xn;ɵ)=∏=i

ixf1

);( θ

Observación: si θ hace máxima a L(ɵ), entonces también hace máximaa su logaritmo ln(L(ɵ)).

Page 16: Sesion 2 No Para 2014 I

16

Para convertir el producto de la función de máxima verosimilitud ensuma, se aplica la función L=ln(L(ɵ)) y determinar “θ” por laecuación :

0);(ln∂∂ ∑n

ixfL θ

Si, la distribución de probabilidad tiene varios parámetrosdesconocidos, , entonces en lugar de una ecuación,tendremos k ecuaciones.

kθθθ ,...,, 21

01

=∂

=∂ ∑

=i

i

θθ

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

0,...,0,021

=∂∂

=∂∂

=∂∂

n

LLLθθθ

En resumen:

para hallar el Estimador Máximo verosímil (EMV) se procede delsiguiente modo:

1º) Hallamos la función de verosimilitud L(θ):

∏n

fL )()( θθ

2º)Se observa que si hace máxima la función de verosimilitudL(θ), entonces también hace máxima a su logaritmonatural, entonces se toma ln(L(θ)).

∏=

=i

ixfL1

),()( θθ

θ̂

3º) d i i l fi d l l l l d l

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

3º) derivamos e igualamos a cero, a fin de calcular el valor delestimador :

0)(ln=

∂∂

θθL

Page 17: Sesion 2 No Para 2014 I

17

Ejemplo:

Sea X una v.a. con f.d.p , x > 0 , ɵ>0xexf θθ −=)(

nnθθθθ∏∏1º) ni xxx

i

x

ii eeeexfL θθθθ θθθθθ −−−

=

=

=== ∏∏ ...)()( 21

11

∑= =

−n

iix

neL 1

θ

θθ )(

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

2º) ∑=

−=∑

= =

n

ii

xn xneL

n

ii

1

1 θθθθθ

)ln(]ln[)](ln[

3º) 01

11 =−=∂

∂−

∂∂

=∂

−∂=

∂∂ ∑

∑∑=

==n

ii

n

ii

n

ii

xnx

nxn

Lθθ

θ

θθ

θ

θθ

θθ

)()ln(

)ln()](ln[

por lo tanto:

01

=−∑=

n

iixn

θ =

∑=

n

xn

ii

1

1==

∑=

n

iix

n

1

θ̂x1

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

x1ˆ =θ

Page 18: Sesion 2 No Para 2014 I

18

1º) Sea X una v.a. con función de densidad f(x; θ1,θ2,…,θk) o con distribución deprobabilidad p(x;θ1,θ2,…,θk) caracterizado por “k” parámetros desconocidos.

METODO DE LOS MOMENTOS

Es el método más intuitivo. Consiste en utilizar la relación que tienen los parámetros conlos “momentos” de la población

Donde los primeros k momentos de la variable poblacional alrededor del origen sonrespectivamente :

- Si X es continua :

- Si X es discreta :

xxfxXE kR

rrr

x

∂== ∫ ),...,,;()(' θθθμ 21 , r = 1,2,3,..,k

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

Si X es discreta :

Los momentos μ’r (r = 1,2,3,…,k) de la población son en general función de los k parámetros

desconocidos θ1,θ2,..,θk.

),...,,;()('k

R

rrr xpxXE

X

θθθμ 21∑== , r = 1,2,3,..,k

2º)Sea X1, X2, … ,Xn una m.a.s de tamaño n, los primeros k momentosmuestrales alrededor del origen se define como:

∑=n

i

rir X

nM

1

' 1, r = 1,2,3,..,k

=in 1

El método de los momentos consiste en igualar los momentos muestrales ymomentos poblacionales, obteniendo k ecuaciones simultaneas, con kparámetros desconocidos θ1,θ2,..,θk.

Es decir : μ’r=M’

r , r = 1,2,3,.. ,k

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

Las soluciones de las ecuaciones en μ’r=M’

r denotados por constituyen

los momentos estimados de respectivamente.kθθθ ˆ,...,ˆ,ˆ 21

kθθθ ,...,, 21

Page 19: Sesion 2 No Para 2014 I

19

Ejemplo:

Sea X1, X2, … ,Xn una m.a.s de tamaño n, donde los , conμ y σ2 desconocidos. Encuentre los estimadores para μ y σ2 por elmétodo de los momentos.

E t d l i d b l t t

),(~ 2σμNXi

)(~ 2σμNXEntonces , del enunciado sabemos que , por lo tanto:

corresponde al 1er. momento poblacional, sabemos también que:

, expresión que contiene el 2do. momento:

, 2do. Momento poblacional

),(~ σμNXi

μ=)(XE

)()()( 22 XEXEXV −=

2222 )()()( μσ +=+= XEXVXE

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

Luego de la muestra obtendremos los momentos muestrales:

∑=

=n

iiX

nM

11

1'

∑=

=n

iiX

nM

1

22

1'

Igualando los momentos poblacionales y muestrales obtendremos un sistemas de ecuaciones mediante el cual hallaremos los estimadores de los parámetros:

μ=== ∑=

)(11

'1 XEX

nM

n

ii

222

1

2'2 )(1 μσ +=== ∑

=

XEXn

Mn

ii

Luego la primera ecuación obtenemos:

de la segunda ecuación :

1=i

XXn

n

ii == ∑

=1

1μ̂

222

22

1

2

1

1 Xn

n

n

ii +=

∑=

μσ

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

2

1

22

22

1

2

ˆ1

XXn

XXn

n

ii

ii

−=

+=

=

=

σ

σ

∑=

=−=n

ini SXX

n 1

22)(1

Page 20: Sesion 2 No Para 2014 I

20

∑=

+−=n

ii XnXnX

n 1

222 21][

Observación:

∑∑==

−=−=n

ii

n

ii XnX

nXX

n 1

22

1

222 ][11σ̂

22: XnXnartificio +−

∑n

X

)( 22 21 XXXXn

+∑

)()(2[11

21

1

2 ∑∑=

∑=

=

+−=n

in

iiXn

ii XXnX

n

][ ∑ ∑∑= ==

+−=n

i

n

ii

n

ii XXXX

n 1 1

2

1

2 21

LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

)(1

2 XXXXn i

ii +−= ∑

=

∑=

=−=n

ini SXX

n 1

22)(1