Post on 16-Oct-2018
Estadística
Contraste de hipótesis paramétricas
Departamento de Ciencias del Mar y Biología Aplicada
Prof, Dr. Jose Jacobo Zubcoff
Etapas
Estadística Proceso de la investigación estadística
PROBLEMA
HIPÓTESIS
DISEÑO
RECOLECCIÓN DE DATOS
ANÁLISIS
La hipótesis no se confirma
La hipótesis se confirma
Sin valor científico
Se elimina como explicación
Se establece una teoría
Aplicación
A partir de Alarcón, 2006
Objetivo Se trata de decidir si se acepta o rechaza que el valor del
parámetro estimado se sitúa en una determinada región del espacio paramétrico.
Definición
Un test para contrastar la hipótesis nula frente a la hipótesis alternativa consiste en decidir, para cada
posible muestra, si aceptamos o rechazamos ; por lo tanto, un test consistirá en dividir el espacio muestral (conjunto de
todas las posibles muestras) en dos regiones: una región crítica R, o de rechazo de y una región A o de aceptación de
Estadística Contraste de Bondad de Ajuste
11 : Θ∈θH00 : Θ∈θH
0H
0H 0H
Hipótesis estadística:
Hipótesis estadística: Afirmación o conjetura sobre la distribución de una o más v.a., o bien sobre alguna característica de la misma
• Hipótesis nula (H0): Hipótesis que se desea contrastar
• Hipótesis alternativa (H1): Hipótesis aceptada cuando la evidencia muestral está en contra
Realización
Estadística Contraste de Bondad de Ajuste
• Suponemos a priori una ley de prob. conocida
• Se extrae una muestra aleatoria de la pob.
• Si la distr. De la muestra es diferente la la distr. de prob. la suposición inicial será errónea
Hipótesis estadística: es una afirmación respecto a alguna característica de una población. Ho: Hipótesis nula H1: Hipótesis alternativa Errores que se pueden cometer Pueden ser unilaterales o bilaterales Conclusiones a partir de una muestra aleatoria y significativa, permite aceptar o rechazar la hipótesis nula
Estadística Contraste de Bondad de Ajuste
Nivel de significación Alfa:
Alfa: Probabilidad de rechazar erróneamente la hipótesis nula 1 - Alfa: Probabilidad de que contenga el verdadero valor del
parámetro. El nivel de confianza suele ser 0,90 (90%), 0,95 (95%) ó 0,99 (99%).
Estadística Contraste de Bondad de Ajuste
Región crítica • Es conocida antes de realizar
el experimento: resultados experimentales que refutarían H0
Nivel de significación: α • Número pequeño: 1% , 5% • Fijado apriori por el investigador • Probabilidad de rechazar H0
cuando es cierta
Gráficamente: para una normal tipificada, un intervalo de confianza del 95% se puede representar como:
95%
2.5% 2.5%
La probabilidad de que una variable normal tipificada tome valores en el intervalo
[-1.96,1.96] es del 95%.
Contrastes de bondad de ajuste
Estadística
¿Qué necesitamos para un contraste?:
Estadística Contraste de Bondad de Ajuste
05.0=α
Región de aceptación: No rechazo Región crítica: Rechazo
⎩⎨⎧
≠
=
211
210
::
PPHPPH
95.01 =−α
Umbral Estadístico Umbral Estadístico
• No hay evidencia contra H0 • No se rechaza H0 • Experimento no concluyente • Contraste no significativo
P-valor:
Probabilidad de obtener un resultado al menos tan extremo como el que realmente se ha obtenido.
Es la probabilidad que tendría una región crítica que comenzase
exactamente en el valor del estadístico obtenido de la muestra. Valor conocido después de realizar el experimento Contraste no significativo cuando p>alfa
Estadística Contraste de Bondad de Ajuste
• Sobre α – Número pequeño,
elegido a priori antes de diseñar el experimento
– Conocido α sabemos todo sobre la región crítica
• Sobre p – Es conocido tras
realizar el experimento – Conocido p sabemos
todo sobre el resultado del experimento
• Sobre el criterio de rechazo – Contraste significativo = p menor que α
Estadística Contraste de Bondad de Ajuste
Estadística Contraste de Bondad de Ajuste
05.0=α
Región de aceptación: No rechazo Región crítica: Rechazo
⎩⎨⎧
≠
=
211
210
::
PPHPPH
95.01 =−α
Umbral Estadístico Umbral Estadístico
p-valor
p! valor
5
4
3
2
1
Metodología Plantear contraste
Establecer Ho, H1, alfa
Plantear Estadístico
Dibujar Gráfico (Curva, Pto. Crítico, R.R.Ho,
etc)
Obtener estadístico y p-valor
Dar la conclusión
H0 :........H1 :........
!"#
error! "!! !error! "!! "
! 2,ks, z,F, t
X exp t > Pto.crítico?p <!?
Tipos de contrastes:
1. Pruebas paramétricas: Suponen conocida la distribución de la población y la hipótesis es acerca de los parámetros de dicha distribución.
2. Pruebas no paramétricas: No se sabe cual es la distribución de la población y se desea probar la hipótesis de que cierta distribución en particular será un modelo satisfactorio.
Estadística Contraste de Bondad de Ajuste
Estadística
Contraste de bondad de ajuste Contrastes de bondad de ajuste
no paramétricos para distribuciones discretas
y continuas
Chi-cuadrado ( ):
Test diseñado para variables aleatorias discretas con un número finito de valores (aunque se puede aplicar a v.a.c. por intervalos)
Hipótesis nula simple
Para una muestra aleatoria simple de una v.a. X con valores en las clases C1, C2,…,Ck, y Oi=nº de individuos para la clase Ci,
se analiza la región crítica como:
Estadística Contraste de Bondad de Ajuste
2χ
00 : FXH ≡
21,1
2exp: αχχ −−−≥ pkcR
H0= Adherencia de la muestra a la distribución hipotética H1= La muestra NO se ajusta a la distribución hipotética
Rechazamos H0 si:
χ2k-m-1,α Punto crítico c
K es el numero de Intervalos
m es el Nº de parámetros estimados
Estadística Contraste de Bondad de Ajuste
( ) cEEOk
i i
iit >
−=∑
=1
22expχ
)( 2exp
2tPvalorp χχ >=−
Estadística Contraste de Bondad de Ajuste
05.0=α
Región de aceptación: No rechazo Región crítica: Rechazo
⎩⎨⎧
≠
=
211
210
::
PPHPPH
95.01 =−α
Estadístico Umbral: Estadístico 2exp tχ 2
,1αχ −−mk
El estadístico experimental se calcula como:
Restricciones:
• Mín . En caso contrario se debe agrupar en clases
• Si se debe aplicar el estadístico de corrección de Yates:
Estadística Contraste de Bondad de Ajuste
5≥iE
4≤k
( )∑=
−−=
k
i i
ii
EEO
1
22 5.0
χ
( )∑=
−=
k
i i
iit E
EO1
22expχ
Variable aleatoria normal y su ajuste
x
Density
!2 !1 0 1 2 3
0.0
0.1
0.2
0.3
0.4
Estadística Contraste de Bondad de Ajuste
Intervalo i-ésimo
Oi
Ei = n P
Oi= Frecuencia absoluta Observada
x
x
x
x x
x
x
Estadística Contraste de Bondad de Ajuste
( )∑=
−=
k
i i
iit E
EO1
22expχ
Ejemplo (LANCASTER 1965): El resultado de cruces de 5 caracteres entre heterocigóticos y homocigóticos recesivos.
Aa Bb Cc Dd Ee X aa bb cc dd ee Sea X= Nº de caracteres dominantes en la primera generación Numero de ensayos = 5 Independientes por la 2º ley de Mendel: los caracteres se segregan independientemente Muestra de 551 individuos de la primera generación H0= Adherencia de la muestra a la distribución Binomial H1= La muestra NO se ajusta a la distribución Binomial
Estadística Contraste de Bondad de Ajuste
Valores X Oi
0 1 2 3 4 5
17 81 152 180 104 17
E(X)=X= n π = 5 π
p = X/5 = 2.588 / 5 = 0.517
Estadística Contraste de Bondad de Ajuste
Valores X Oi
0 1 2 3 4 5
17 81 152 180 104 17
pi 0.026 0.141 0.301 0.322 0.173 0.037
E(X)=X= n π = 5 π
p = X/5 = 2.588 / 5 = 0.517
Estadística Contraste de Bondad de Ajuste
TABLASO
qpxn
xXP xnx −⎟⎟⎠
⎞⎜⎜⎝
⎛== )(
Valores X Oi
0 1 2 3 4 5
17 81 152 180 104 17
pi 0.026 0.141 0.301 0.322 0.173 0.037
Ei=551 pi 14.33 77.69 165.8 177.4 95.32 20.39
Ei > 5
Estadística Contraste de Bondad de Ajuste
Valores X Oi
0 1 2 3 4 5
17 81 152 180 104 17
pi 0.026 0.141 0.301 0.322 0.173 0.037
Ei=551 pi 14.33 77.69 165.8 177.4 95.32 20.39
χ2 = (17-14.33)2
14.33 + ..+ (104-95.32)2
95.32
χ2expt = 3.187 χ2
k-m-1,α = χ26-1-1,0.05
Buscar en Tabla
Estadística Contraste de Bondad de Ajuste
( )=
−=∑
=
k
i i
iit E
EO1
22expχ
Estadística Contraste de Bondad de Ajuste
05.0=α
Región de aceptación: No rechazo Región crítica: Rechazo
⎩⎨⎧
≠
=
211
210
::
PPHPPH
95.01 =−α
187.32exp =tχ
488.9205.0,116 =−−χ
Valores X Oi
0 1 2 3 4 5
17 81 152 180 104 17
pi 0.026 0.141 0.301 0.322 0.173 0.037
Ei=551 pi 14.33 77.69 165.8 177.4 95.32 20.39
χ2 = 3.187 χ2k-m-1,α = χ2
6-1-1,0.05 Buscar en Tabla
P-valor = P(χ2k-m-1 >3.187)
Estadística Contraste de Bondad de Ajuste
Estadística Contraste de Bondad de Ajuste
05.0=α
Región de aceptación: No rechazo Región crítica: Rechazo
⎩⎨⎧
≠
=
211
210
::
PPHPPH
95.01 =−α
488.9205.0,116 =−−χ187.32
exp =tχ
P
Valores X Oi
0 1 2 3 4 5
17 81 152 180 104 17
pi 0.026 0.141 0.301 0.322 0.173 0.037
Ei=551 pi 14.33 77.69 165.8 177.4 95.32 20.39
P-valor = P(χ2k-m-1 >3.187)
0.1 < P-valor < 0.9 en la Tabla para
gl=4
Estadística Contraste de Bondad de Ajuste
Ejercicios propuesto
Sea una variable aleatoria el nº de peces que son pescadas en intervalos de 30min, queremos saber a qué distribución se podría ajustar
X = { Nº de peces por área}
Tamaño muestral n = 109
Estadística Ejercicios
X 0 1 2 3 4 5 >=6
Oi 52 29 19 7 1 0 1
Estadística Ejercicios
Valores X Oi
0 1 2 3 4 5 >=6
52 29 19 7 1 0 1
Debemos estimar el valor de λ a partir de la E(X)
Luego podemos calcular las pi con la función de probabilidad teórica o con la tabla
Valores X Oi
0 1 2 3 4 5 >=6
52 29 19 7 1 0 1
pi 0.4069 .3659 .1645 .0492 .0111 .002 .0003
Ei= 109 pi 44.3521 39.8831 17.9305 5.3628 1.2099 0.218 .0327
Ei > 5
Estadística Contraste de Bondad de Ajuste
Estadística Contraste de Bondad de Ajuste
Valores X Oi
0 1 2 3 4 5 >=6
52 29 19 7 1 0 1
pi 0.4069 .3659 .1645 .0492 .0111 .002 .0003
Ei= 109 pi 44.3521 39.8831 17.9305 5.3628 1.2099 0.218 .0327
Agrupar
Valores X Oi
0 1 2 >=3
52 29 19 9
pi 0.4 .37 .16 .0626
Ei= 109 pi 44.36 39.89 17.92 6.8234
Estadística Contraste de Bondad de Ajuste
Valores X Oi
0 1 2 >=3
52 29 19 9
pi 0.4 .37 .16 .0623
Ei= 109 pi 44.3521 39.8831 17.9305 6.8234
χ2 = Σ(Oi-Ei)2
Ei χ2 = (52 - 44.3521)2
44.3521 + ..+ (9 - 6.8234)2
6.8234
χ2 = 5.0466 χ2k-m-1,α = χ2
4-1-1,0.05 Buscar en Tabla
Estadística Contraste de Bondad de Ajuste
Valores X Oi
0 1 2 >=3
52 29 19 9
pi 0.4 .37 .16 .0623
Ei= 109 pi 44.36 39.89 17.98 6.791
P-valor = P(χ2k-m-1 >5.0466)
en la Tabla para gl=2 0.05 < P-valor < 0.1
Estadística Contraste de Bondad de Ajuste
Valores de X (74 valores observados en una tabla de datos)
Ajuste a una Dist. Normal
H0= Adherencia de la muestra a la distribución hipotética H1= La muestra NO se ajusta a la distribución hipotética
Estadística Contraste de Bondad de Ajuste
( ) cEEOk
i i
iit >
−=∑
=1
22expχ
Estadística Contraste de Bondad de Ajuste
Ejemplo: Las tallas en cm. de una muestra de tiburones, ordenados de menor a mayor, fueron los siguientes:
Contrastar el ajuste a una normal.
Valores X (74 valores observados en una tabla de datos)
Intervalos
Oi
pi 0.2 0.2 0.2 0.2 0.2
Ei= 74 pi
Estadística Contraste de Bondad de Ajuste
Valores X (74 valores observados en una tabla de datos)
Intervalos
Oi
pi 0.2 0.2 0.2 0.2 0.2
Ei= 74 pi 14.8 14.8 14.8 14.8 14.8
Estadística Contraste de Bondad de Ajuste
K1 = P80 – x s
K2 = P60 – x s
-K1= P20 – x s
-K2= P40 – x s
-k1 -k2 k1 k2
Estadística Contraste de Bondad de Ajuste
Tabla
K1 = P80 – x s
K2 = P60 – x s
-K1= P20 – x s
-K2= P40 – x s
-k1 -k2 k1 k2
Normal estándar
Estadística Contraste de Bondad de Ajuste
Destipificando obtenemos los valores de la variable (Percentiles 20, 40, 60 y 80)
K1 = P80 – x s
K2 = P60 – x s
P80 = x + K1 . s = 79.10
P60 = x + K2 . s = 72.44
-K1= P20 – x s P20 = x - K1 . s = 60.13
-K2= P40 – x s P40 = x - K2 . s = 66.79
Estadística Contraste de Bondad de Ajuste
Intervalos <60.13 [60.13,66.7)
[66.7, 72.44)
[72.44,79.10)
>79.10
Oi
pi 0.2 0.2 0.2 0.2 0.2
Ei= 74 pi 14.8 14.8 14.8 14.8 14.8
Estadística Contraste de Bondad de Ajuste
Intervalos <60.13 [60.13,66.7]
[66.7, 72.44]
[72.44,79.10]
>79.10
Oi 18 18 12 14 12
pi 0.2 0.2 0.2 0.2 0.2
Ei= 74 pi 14.8 14.8 14.8 14.8 14.8
Ei > 5
Estadística Contraste de Bondad de Ajuste
Intervalos <60.13 [60.13,66.7]
[66.7, 72.44]
[72.44,79.10]
>79.10
Oi 18 18 12 14 12
pi 0.2 0.2 0.2 0.2 0.2
Ei= 74 pi 14.8 14.8 14.8 14.8 14.8
χ2 = Σ(Oi-Ei)2
Ei χ2 = (12 - 14.8)2
14.8 + ..+ (12 – 14.8)2
14.8
χ2 = 5.991 χ2k-m-1,α = χ2
5-2-1,0.05 Buscar en Tabla
Estadística Contraste de Bondad de Ajuste
Intervalos <60.13 [60.13,66.7]
[66.7, 72.44]
[72.44,79.10]
>79.10
Oi 18 18 12 14 12
pi 0.2 0.2 0.2 0.2 0.2
Ei= 74 pi 14.8 14.8 14.8 14.8 14.8
P-valor = P(χ2k-m-1 >5.991)
en la Tabla para gl=2 0.1 < P-valor < 0.9
Estadística Contraste de Bondad de Ajuste
Kolmogorov-Smirnov (k-s):
Test diseñado para v.a.c. dadas de forma puntual (aunque se puede aplicar a ordinales) . Normalmente se usa para pruebas con muestras pequeñas
Proceso de la prueba:
1. Se desarrolla la distribución acumulativa de la distribución teórica y la de los datos empíricos
2. Se comparan y se selecciona aquel intervalo de clase que tenga mayor desviación absoluta entre las desviaciones teóricas y observadas
3. Se compara la desviación con los valores críticos de la tabla de Kolmogorov
Estadística Contraste de Bondad de Ajuste
Desarrollo de la prueba:
1. Ordenar los datos de menor a mayor
2. Calcular la función de distribución empírica
3. Calcular la discrepancia
calculando para cada punto:
Estadística Contraste de Bondad de Ajuste
nxx ≤≤ ...1
⎪⎩
⎪⎨
⎧
≥
<≤
<
= +
n
iin
xxsi
xxxsini
xxsi
xF
,1
,
,0
)( 1
1
)()(max xFxFD nn −=
{ })()(,)()(max)( 1 hhnhhnhn xFxFxFxFxD −−= −
Vamos a suponer que tenemos una muestra de 9 individuos a los que se les
observa el nivel de Ac. Úrico. 0.676, 0.71, 0.797, 0.833, 0.863, 0.878, 0.92, 0,96, 1.066 Si esta variable es Normal, podemos profundizar en el análisis posterior con
estudios paramétricos Pasos: 4.1. Ordena de menor a mayor 4.2. Calcula la función empírica. ¿Qué? necesitamos?
Estadística Contraste de Bondad de Ajuste
( )114.0
8118.0
1
86.0703.7911
2
==−
−=
=⋅==
∑
∑
nxx
S
xn
x i
X Faci Zi Фi |F- Фi |
0,676 0,11
,710 0,22
,797 0,33
… …
1,066 1
Estadística Contraste de Bondad de Ajuste
X Faci Zi Фi |F- Фi |
0,676 0,11 -1,49
,710 0,22 -1,20
,797 0,33 -0,49
… … …
1,066 1 1,73
Estadística Contraste de Bondad de Ajuste
σµ−
=Xzi
X Faci Zi Фi |F- Фi |
0,676 0,11 -1,49 0,068
,710 0,22 -1,20 0,115
,797 0,33 -0,49 0,312
… … … …
1,066 1 1,74 0.959
Estadística Contraste de Bondad de Ajuste
Tabla Z
X Faci Zi Фi |F- Фi |
0,676 0,11 -1,49 0,068 0,043
,710 0,22 -1,20 0,115 0,107
,797 0,33 -0,49 0,312 0,021
… … … … …
1,066 1 1,74 0.959 0.041
Estadística Contraste de Bondad de Ajuste
X Faci Zi Фi |F- Фi |
0,676 0,11 -1,49 0,068 0,043
,710 0,22 -1,20 0,115 0,107
,797 0,33 -0,49 0,3312 0,021
… … … … …
1,066 1 1,73 … …
MAX 0,257
Estadística Contraste de Bondad de Ajuste
X Faci Zi Фi |F- Фi | |Fi-1- Фi |
0,676 0,11 -1,49 0,068 0,043 0,085
,710 0,22 -1,20 0,115 0,107 |0,11-0,115|
,797 0,33 -0,49 0,312 0,021
… … … … …
1,066 1 1,74 … …
MAX 0,107
Estadística Contraste de Bondad de Ajuste
Max(|Fi-Фi|)
H0= Adherencia de la muestra a la distribución hipotética H1= La muestra NO se ajusta a la distribución hipotética
Rechazamos H0 si: > c
Punto crítico c En la tabla de Kolmogorov-Smirnov
Estadística Contraste de Bondad de Ajuste
107.0|)(| =−= iin FMaxD φ
430.0)9,05.0(),( == DnD α),( nDDn α< NO SE RECHAZA
Estadística
Comando a utilizar con R. Chi-cuadrado: chisq.test(x, y = NULL, correct = TRUE,p = rep(1/length(x), length(x)), rescale.p = FALSE,simulate.p.value = FALSE, B = 2000)
Contraste de Bondad de Ajuste