Contraste de hipótesis paramétricas - RUA:...

74
Estadística Contraste de hipótesis paramétricas Departamento de Ciencias del Mar y Biología Aplicada Prof, Dr. Jose Jacobo Zubcoff

Transcript of Contraste de hipótesis paramétricas - RUA:...

Estadística

Contraste de hipótesis paramétricas

Departamento de Ciencias del Mar y Biología Aplicada

Prof, Dr. Jose Jacobo Zubcoff

Etapas

Estadística Proceso de la investigación estadística

PROBLEMA

HIPÓTESIS

DISEÑO

RECOLECCIÓN DE DATOS

ANÁLISIS

La hipótesis no se confirma

La hipótesis se confirma

Sin valor científico

Se elimina como explicación

Se establece una teoría

Aplicación

A partir de Alarcón, 2006

Estadística

Contraste de bondad de ajuste Hipótesis estadística

Objetivo Se trata de decidir si se acepta o rechaza que el valor del

parámetro estimado se sitúa en una determinada región del espacio paramétrico.

Definición

Un test para contrastar la hipótesis nula frente a la hipótesis alternativa consiste en decidir, para cada

posible muestra, si aceptamos o rechazamos ; por lo tanto, un test consistirá en dividir el espacio muestral (conjunto de

todas las posibles muestras) en dos regiones: una región crítica R, o de rechazo de y una región A o de aceptación de

Estadística Contraste de Bondad de Ajuste

11 : Θ∈θH00 : Θ∈θH

0H

0H 0H

Estadística Contraste de Bondad de Ajuste

Met

odol

ogía

con

tras

tes

Hipótesis estadística:

Hipótesis estadística: Afirmación o conjetura sobre la distribución de una o más v.a., o bien sobre alguna característica de la misma

• Hipótesis nula (H0): Hipótesis que se desea contrastar

• Hipótesis alternativa (H1): Hipótesis aceptada cuando la evidencia muestral está en contra

Realización

Estadística Contraste de Bondad de Ajuste

• Suponemos a priori una ley de prob. conocida

• Se extrae una muestra aleatoria de la pob.

• Si la distr. De la muestra es diferente la la distr. de prob. la suposición inicial será errónea

Hipótesis estadística: es una afirmación respecto a alguna característica de una población. Ho: Hipótesis nula H1: Hipótesis alternativa Errores que se pueden cometer Pueden ser unilaterales o bilaterales Conclusiones a partir de una muestra aleatoria y significativa, permite aceptar o rechazar la hipótesis nula

Estadística Contraste de Bondad de Ajuste

Nivel de significación Alfa:

Alfa: Probabilidad de rechazar erróneamente la hipótesis nula 1 - Alfa: Probabilidad de que contenga el verdadero valor del

parámetro. El nivel de confianza suele ser 0,90 (90%), 0,95 (95%) ó 0,99 (99%).

Estadística Contraste de Bondad de Ajuste

Región crítica •  Es conocida antes de realizar

el experimento: resultados experimentales que refutarían H0

Nivel de significación: α •  Número pequeño: 1% , 5% •  Fijado apriori por el investigador •  Probabilidad de rechazar H0

cuando es cierta

Gráficamente: para una normal tipificada, un intervalo de confianza del 95% se puede representar como:

95%

2.5% 2.5%

La probabilidad de que una variable normal tipificada tome valores en el intervalo

[-1.96,1.96] es del 95%.

Contrastes de bondad de ajuste

Estadística

¿Qué necesitamos para un contraste?:

Estadística Contraste de Bondad de Ajuste

05.0=α

Región de aceptación: No rechazo Región crítica: Rechazo

⎩⎨⎧

=

211

210

::

PPHPPH

95.01 =−α

Umbral Estadístico Umbral Estadístico

• No hay evidencia contra H0 • No se rechaza H0 • Experimento no concluyente • Contraste no significativo

P-valor:

Probabilidad de obtener un resultado al menos tan extremo como el que realmente se ha obtenido.

Es la probabilidad que tendría una región crítica que comenzase

exactamente en el valor del estadístico obtenido de la muestra. Valor conocido después de realizar el experimento Contraste no significativo cuando p>alfa

Estadística Contraste de Bondad de Ajuste

•  Sobre α –  Número pequeño,

elegido a priori antes de diseñar el experimento

–  Conocido α sabemos todo sobre la región crítica

•  Sobre p –  Es conocido tras

realizar el experimento –  Conocido p sabemos

todo sobre el resultado del experimento

•  Sobre el criterio de rechazo –  Contraste significativo = p menor que α

Estadística Contraste de Bondad de Ajuste

Estadística Contraste de Bondad de Ajuste

05.0=α

Región de aceptación: No rechazo Región crítica: Rechazo

⎩⎨⎧

=

211

210

::

PPHPPH

95.01 =−α

Umbral Estadístico Umbral Estadístico

p-valor

p! valor

5

4

3

2

1

Metodología Plantear contraste

Establecer Ho, H1, alfa

Plantear Estadístico

Dibujar Gráfico (Curva, Pto. Crítico, R.R.Ho,

etc)

Obtener estadístico y p-valor

Dar la conclusión

H0 :........H1 :........

!"#

error! "!! !error! "!! "

! 2,ks, z,F, t

X exp t > Pto.crítico?p <!?

Tipos de contrastes:

1.   Pruebas paramétricas: Suponen conocida la distribución de la población y la hipótesis es acerca de los parámetros de dicha distribución.

2.   Pruebas no paramétricas: No se sabe cual es la distribución de la población y se desea probar la hipótesis de que cierta distribución en particular será un modelo satisfactorio.

Estadística Contraste de Bondad de Ajuste

Estadística

Contraste de bondad de ajuste Contrastes de bondad de ajuste

no paramétricos para distribuciones discretas

y continuas

Chi-cuadrado ( ):

Test diseñado para variables aleatorias discretas con un número finito de valores (aunque se puede aplicar a v.a.c. por intervalos)

Hipótesis nula simple

Para una muestra aleatoria simple de una v.a. X con valores en las clases C1, C2,…,Ck, y Oi=nº de individuos para la clase Ci,

se analiza la región crítica como:

Estadística Contraste de Bondad de Ajuste

00 : FXH ≡

21,1

2exp: αχχ −−−≥ pkcR

Estadística Contraste de Bondad de Ajuste

H0= Adherencia de la muestra a la distribución hipotética H1= La muestra NO se ajusta a la distribución hipotética

Rechazamos H0 si:

χ2k-m-1,α Punto crítico c

K es el numero de Intervalos

m es el Nº de parámetros estimados

Estadística Contraste de Bondad de Ajuste

( ) cEEOk

i i

iit >

−=∑

=1

22expχ

)( 2exp

2tPvalorp χχ >=−

Estadística Contraste de Bondad de Ajuste

05.0=α

Región de aceptación: No rechazo Región crítica: Rechazo

⎩⎨⎧

=

211

210

::

PPHPPH

95.01 =−α

Estadístico Umbral: Estadístico 2exp tχ 2

,1αχ −−mk

El estadístico experimental se calcula como:

Restricciones:

• Mín . En caso contrario se debe agrupar en clases

• Si se debe aplicar el estadístico de corrección de Yates:

Estadística Contraste de Bondad de Ajuste

5≥iE

4≤k

( )∑=

−−=

k

i i

ii

EEO

1

22 5.0

χ

( )∑=

−=

k

i i

iit E

EO1

22expχ

Variable aleatoria normal y su ajuste

x

Density

!2 !1 0 1 2 3

0.0

0.1

0.2

0.3

0.4

Estadística Contraste de Bondad de Ajuste

Estadística Contraste de Bondad de Ajuste

Estadística Contraste de Bondad de Ajuste

Intervalo i-ésimo

Oi

Ei = n P

Oi= Frecuencia absoluta Observada

x

x

x

x x

x

x

Estadística Contraste de Bondad de Ajuste

( )∑=

−=

k

i i

iit E

EO1

22expχ

Ejemplo (LANCASTER 1965): El resultado de cruces de 5 caracteres entre heterocigóticos y homocigóticos recesivos.

Aa Bb Cc Dd Ee X aa bb cc dd ee Sea X= Nº de caracteres dominantes en la primera generación Numero de ensayos = 5 Independientes por la 2º ley de Mendel: los caracteres se segregan independientemente Muestra de 551 individuos de la primera generación H0= Adherencia de la muestra a la distribución Binomial H1= La muestra NO se ajusta a la distribución Binomial

Estadística Contraste de Bondad de Ajuste

Valores X Oi

0 1 2 3 4 5

17 81 152 180 104 17

E(X)=X= n π = 5 π

p = X/5 = 2.588 / 5 = 0.517

Estadística Contraste de Bondad de Ajuste

Valores X Oi

0 1 2 3 4 5

17 81 152 180 104 17

pi 0.026 0.141 0.301 0.322 0.173 0.037

E(X)=X= n π = 5 π

p = X/5 = 2.588 / 5 = 0.517

Estadística Contraste de Bondad de Ajuste

TABLASO

qpxn

xXP xnx −⎟⎟⎠

⎞⎜⎜⎝

⎛== )(

Valores X Oi

0 1 2 3 4 5

17 81 152 180 104 17

pi 0.026 0.141 0.301 0.322 0.173 0.037

Ei=551 pi 14.33 77.69 165.8 177.4 95.32 20.39

Ei > 5

Estadística Contraste de Bondad de Ajuste

Valores X Oi

0 1 2 3 4 5

17 81 152 180 104 17

pi 0.026 0.141 0.301 0.322 0.173 0.037

Ei=551 pi 14.33 77.69 165.8 177.4 95.32 20.39

χ2 = (17-14.33)2

14.33 + ..+ (104-95.32)2

95.32

χ2expt = 3.187 χ2

k-m-1,α = χ26-1-1,0.05

Buscar en Tabla

Estadística Contraste de Bondad de Ajuste

( )=

−=∑

=

k

i i

iit E

EO1

22expχ

Estadística Contraste de Bondad de Ajuste

05.0=α

Región de aceptación: No rechazo Región crítica: Rechazo

⎩⎨⎧

=

211

210

::

PPHPPH

95.01 =−α

187.32exp =tχ

488.9205.0,116 =−−χ

Valores X Oi

0 1 2 3 4 5

17 81 152 180 104 17

pi 0.026 0.141 0.301 0.322 0.173 0.037

Ei=551 pi 14.33 77.69 165.8 177.4 95.32 20.39

χ2 = 3.187 χ2k-m-1,α = χ2

6-1-1,0.05 Buscar en Tabla

P-valor = P(χ2k-m-1 >3.187)

Estadística Contraste de Bondad de Ajuste

Estadística Contraste de Bondad de Ajuste

05.0=α

Región de aceptación: No rechazo Región crítica: Rechazo

⎩⎨⎧

=

211

210

::

PPHPPH

95.01 =−α

488.9205.0,116 =−−χ187.32

exp =tχ

P

Valores X Oi

0 1 2 3 4 5

17 81 152 180 104 17

pi 0.026 0.141 0.301 0.322 0.173 0.037

Ei=551 pi 14.33 77.69 165.8 177.4 95.32 20.39

P-valor = P(χ2k-m-1 >3.187)

0.1 < P-valor < 0.9 en la Tabla para

gl=4

Estadística Contraste de Bondad de Ajuste

Ejercicios propuesto

Sea una variable aleatoria el nº de peces que son pescadas en intervalos de 30min, queremos saber a qué distribución se podría ajustar

X = { Nº de peces por área}

Tamaño muestral n = 109

Estadística Ejercicios

X 0 1 2 3 4 5 >=6

Oi 52 29 19 7 1 0 1

Estadística Ejercicios

Valores X Oi

0 1 2 3 4 5 >=6

52 29 19 7 1 0 1

Debemos estimar el valor de λ a partir de la E(X)

Luego podemos calcular las pi con la función de probabilidad teórica o con la tabla

Valores X Oi

0 1 2 3 4 5 >=6

52 29 19 7 1 0 1

pi 0.4069 .3659 .1645 .0492 .0111 .002 .0003

Ei= 109 pi 44.3521 39.8831 17.9305 5.3628 1.2099 0.218 .0327

Ei > 5

Estadística Contraste de Bondad de Ajuste

Estadística Contraste de Bondad de Ajuste

Valores X Oi

0 1 2 3 4 5 >=6

52 29 19 7 1 0 1

pi 0.4069 .3659 .1645 .0492 .0111 .002 .0003

Ei= 109 pi 44.3521 39.8831 17.9305 5.3628 1.2099 0.218 .0327

Agrupar

Valores X Oi

0 1 2 >=3

52 29 19 9

pi 0.4 .37 .16 .0626

Ei= 109 pi 44.36 39.89 17.92 6.8234

Estadística Contraste de Bondad de Ajuste

Valores X Oi

0 1 2 >=3

52 29 19 9

pi 0.4 .37 .16 .0623

Ei= 109 pi 44.3521 39.8831 17.9305 6.8234

χ2 = Σ(Oi-Ei)2

Ei χ2 = (52 - 44.3521)2

44.3521 + ..+ (9 - 6.8234)2

6.8234

χ2 = 5.0466 χ2k-m-1,α = χ2

4-1-1,0.05 Buscar en Tabla

Estadística Contraste de Bondad de Ajuste

Valores X Oi

0 1 2 >=3

52 29 19 9

pi 0.4 .37 .16 .0623

Ei= 109 pi 44.36 39.89 17.98 6.791

P-valor = P(χ2k-m-1 >5.0466)

en la Tabla para gl=2 0.05 < P-valor < 0.1

Estadística Contraste de Bondad de Ajuste

Valores de X (74 valores observados en una tabla de datos)

Ajuste a una Dist. Normal

H0= Adherencia de la muestra a la distribución hipotética H1= La muestra NO se ajusta a la distribución hipotética

Estadística Contraste de Bondad de Ajuste

( ) cEEOk

i i

iit >

−=∑

=1

22expχ

Estadística Contraste de Bondad de Ajuste

Ejemplo: Las tallas en cm. de una muestra de tiburones, ordenados de menor a mayor, fueron los siguientes:

Contrastar el ajuste a una normal.

x

x

x x x

x

Estadística Contraste de Bondad de Ajuste

( ) cEEOk

i i

iit >

−=∑

=1

22expχ

x

x

x x x

x

0.2

Estadística Contraste de Bondad de Ajuste

( ) cEEOk

i i

iit >

−=∑

=1

22expχ

x

x

x x x

x

0.2

0.4

Estadística Contraste de Bondad de Ajuste

( ) cEEOk

i i

iit >

−=∑

=1

22expχ

Valores X (74 valores observados en una tabla de datos)

Intervalos

Oi

pi 0.2 0.2 0.2 0.2 0.2

Ei= 74 pi

Estadística Contraste de Bondad de Ajuste

Valores X (74 valores observados en una tabla de datos)

Intervalos

Oi

pi 0.2 0.2 0.2 0.2 0.2

Ei= 74 pi 14.8 14.8 14.8 14.8 14.8

Estadística Contraste de Bondad de Ajuste

x

x

x x x

x

-k1 -k2 k1 k2

P20

0.2

Estadística Contraste de Bondad de Ajuste

K1 = P80 – x s

K2 = P60 – x s

-K1= P20 – x s

-K2= P40 – x s

-k1 -k2 k1 k2

Estadística Contraste de Bondad de Ajuste

Tabla

K1 = P80 – x s

K2 = P60 – x s

-K1= P20 – x s

-K2= P40 – x s

-k1 -k2 k1 k2

Normal estándar

Estadística Contraste de Bondad de Ajuste

Destipificando obtenemos los valores de la variable (Percentiles 20, 40, 60 y 80)

K1 = P80 – x s

K2 = P60 – x s

P80 = x + K1 . s = 79.10

P60 = x + K2 . s = 72.44

-K1= P20 – x s P20 = x - K1 . s = 60.13

-K2= P40 – x s P40 = x - K2 . s = 66.79

Estadística Contraste de Bondad de Ajuste

Intervalos <60.13 [60.13,66.7)

[66.7, 72.44)

[72.44,79.10)

>79.10

Oi

pi 0.2 0.2 0.2 0.2 0.2

Ei= 74 pi 14.8 14.8 14.8 14.8 14.8

Estadística Contraste de Bondad de Ajuste

Intervalos <60.13 [60.13,66.7]

[66.7, 72.44]

[72.44,79.10]

>79.10

Oi 18 18 12 14 12

pi 0.2 0.2 0.2 0.2 0.2

Ei= 74 pi 14.8 14.8 14.8 14.8 14.8

Ei > 5

Estadística Contraste de Bondad de Ajuste

Intervalos <60.13 [60.13,66.7]

[66.7, 72.44]

[72.44,79.10]

>79.10

Oi 18 18 12 14 12

pi 0.2 0.2 0.2 0.2 0.2

Ei= 74 pi 14.8 14.8 14.8 14.8 14.8

χ2 = Σ(Oi-Ei)2

Ei χ2 = (12 - 14.8)2

14.8 + ..+ (12 – 14.8)2

14.8

χ2 = 5.991 χ2k-m-1,α = χ2

5-2-1,0.05 Buscar en Tabla

Estadística Contraste de Bondad de Ajuste

Intervalos <60.13 [60.13,66.7]

[66.7, 72.44]

[72.44,79.10]

>79.10

Oi 18 18 12 14 12

pi 0.2 0.2 0.2 0.2 0.2

Ei= 74 pi 14.8 14.8 14.8 14.8 14.8

P-valor = P(χ2k-m-1 >5.991)

en la Tabla para gl=2 0.1 < P-valor < 0.9

Estadística Contraste de Bondad de Ajuste

Kolmogorov-Smirnov (k-s):

Test diseñado para v.a.c. dadas de forma puntual (aunque se puede aplicar a ordinales) . Normalmente se usa para pruebas con muestras pequeñas

Proceso de la prueba:

1.  Se desarrolla la distribución acumulativa de la distribución teórica y la de los datos empíricos

2.  Se comparan y se selecciona aquel intervalo de clase que tenga mayor desviación absoluta entre las desviaciones teóricas y observadas

3.  Se compara la desviación con los valores críticos de la tabla de Kolmogorov

Estadística Contraste de Bondad de Ajuste

Desarrollo de la prueba:

1.  Ordenar los datos de menor a mayor

2.  Calcular la función de distribución empírica

3.  Calcular la discrepancia

calculando para cada punto:

Estadística Contraste de Bondad de Ajuste

nxx ≤≤ ...1

⎪⎩

⎪⎨

<≤

<

= +

n

iin

xxsi

xxxsini

xxsi

xF

,1

,

,0

)( 1

1

)()(max xFxFD nn −=

{ })()(,)()(max)( 1 hhnhhnhn xFxFxFxFxD −−= −

Estadística Contraste de Bondad de Ajuste

x x

x x

x

Estadística Contraste de Bondad de Ajuste

x x x

x x

Estadística Contraste de Bondad de Ajuste

Vamos a suponer que tenemos una muestra de 9 individuos a los que se les

observa el nivel de Ac. Úrico. 0.676, 0.71, 0.797, 0.833, 0.863, 0.878, 0.92, 0,96, 1.066 Si esta variable es Normal, podemos profundizar en el análisis posterior con

estudios paramétricos Pasos: 4.1. Ordena de menor a mayor 4.2. Calcula la función empírica. ¿Qué? necesitamos?

Estadística Contraste de Bondad de Ajuste

( )114.0

8118.0

1

86.0703.7911

2

==−

−=

=⋅==

nxx

S

xn

x i

X Faci Zi Фi |F- Фi |

0,676

,710

,797

1,066

Estadística Contraste de Bondad de Ajuste

X Faci Zi Фi |F- Фi |

0,676

,710

,797

1,066

Estadística Contraste de Bondad de Ajuste

X Faci Zi Фi |F- Фi |

0,676 0,11

,710 0,22

,797 0,33

… …

1,066 1

Estadística Contraste de Bondad de Ajuste

X Faci Zi Фi |F- Фi |

0,676 0,11 -1,49

,710 0,22 -1,20

,797 0,33 -0,49

… … …

1,066 1 1,73

Estadística Contraste de Bondad de Ajuste

σµ−

=Xzi

X Faci Zi Фi |F- Фi |

0,676 0,11 -1,49 0,068

,710 0,22 -1,20 0,115

,797 0,33 -0,49 0,312

… … … …

1,066 1 1,74 0.959

Estadística Contraste de Bondad de Ajuste

Tabla Z

X Faci Zi Фi |F- Фi |

0,676 0,11 -1,49 0,068 0,043

,710 0,22 -1,20 0,115 0,107

,797 0,33 -0,49 0,312 0,021

… … … … …

1,066 1 1,74 0.959 0.041

Estadística Contraste de Bondad de Ajuste

X Faci Zi Фi |F- Фi |

0,676 0,11 -1,49 0,068 0,043

,710 0,22 -1,20 0,115 0,107

,797 0,33 -0,49 0,3312 0,021

… … … … …

1,066 1 1,73 … …

MAX 0,257

Estadística Contraste de Bondad de Ajuste

X Faci Zi Фi |F- Фi | |Fi-1- Фi |

0,676 0,11 -1,49 0,068 0,043 0,085

,710 0,22 -1,20 0,115 0,107 |0,11-0,115|

,797 0,33 -0,49 0,312 0,021

… … … … …

1,066 1 1,74 … …

MAX 0,107

Estadística Contraste de Bondad de Ajuste

Max(|Fi-Фi|)

H0= Adherencia de la muestra a la distribución hipotética H1= La muestra NO se ajusta a la distribución hipotética

Rechazamos H0 si: > c

Punto crítico c En la tabla de Kolmogorov-Smirnov

Estadística Contraste de Bondad de Ajuste

107.0|)(| =−= iin FMaxD φ

430.0)9,05.0(),( == DnD α),( nDDn α< NO SE RECHAZA

Estadística

Comando a utilizar con R. Chi-cuadrado: chisq.test(x, y = NULL, correct = TRUE,p = rep(1/length(x), length(x)), rescale.p = FALSE,simulate.p.value = FALSE, B = 2000)

Contraste de Bondad de Ajuste

Estadística

Comando a utilizar con R. k-s: t.test(x, y = NULL,alternative = c("two.sided", "less", "greater"),mu = 0, paired = FALSE, var.equal = FALSE,conf.level = 0.95, ...)

Contraste de Bondad de Ajuste