1 MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT El modelo de probabilidad lineal puede hacer...
-
Upload
vidal-pinon -
Category
Documents
-
view
219 -
download
0
Transcript of 1 MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT El modelo de probabilidad lineal puede hacer...
1
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
El modelo de probabilidad lineal puede hacer predicciones sin sentido que indiquen que un evento ocurrirá con una probabilidad mayor a 1 o menor a 0.
XXi
1
0
1 +2Xi
Y, p
1
A
B
1 + 2Xi
1 – 1 – 2Xi
2
0.00
0.25
0.50
0.75
1.00
-8 -6 -4 -2 0 2 4 6 Z
ZeZFp
1
1)(
)(ZF
XZ 21
La manera común de evitar este problema es establecer la hipótesis de que la probabilidad es una función sigmoidea (S-shaped) de Z, F(Z), en la que Z es una función de la variable explicativa.
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
3
0.00
0.25
0.50
0.75
1.00
-8 -6 -4 -2 0 2 4 6
Muchas funciones matemáticas son sigmoideas en carácter. Una es la función logística mostrada aquí. Mientras Z va al infinito, e–Z va hacia a 0 y p va a 1 (pero no lo puede exceder). Mientras que Z va hacia menos infinito, e–Z va hacia el infinito y p hacia 0 (pero no puede ser menor a 0).
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
XZ 21
)(ZFZe
ZFp
11
)(
Z
4
0.00
0.25
0.50
0.75
1.00
-8 -6 -4 -2 0 2 4 6
El modelo implica que, para valores de Z menores a –2, la probabilidad de ocurrencia del evento es baja y poco sensible a las variaciones de Z.
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
XZ 21
)(ZFZe
ZFp
11
)(
Z
5
Para obtener una expresión de la sensibilidad, se deriva F(Z) con respecto a Z. El recuadro gris contiene la regla general para derivar un cociente y lo aplica a F(Z).
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
VU
Y
2VdZdV
UdZdU
V
dZdY
2
2
)1(
)1()(10)1(
Z
Z
Z
ZZ
ee
eee
dZdp
01 dZdU
U
Z
Z
edZdV
eV
)1(
ZeZFp
1
1)(
6
0
0.1
0.2
-8 -6 -4 -2 0 2 4 6
2)1()( Z
Z
ee
dZdp
Zf
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
La sensibilidad, medida por la pendiente, es mayor cuando Z es igual a 0. La función marginal, f(Z), alcanza un máximo en este punto.
ZeZFp
1
1)(
)(Zf
Z
7
0.00
0.25
0.50
0.75
1.00
-8 -6 -4 -2 0 2 4 6
Para un modelo no-lineal de este tipo, la estimación de máxima verosimilitud es muy superior al principio de mínimos cuadrados en la estimación de los parámetros. Mayores detalles sobre esta apliación se encuentran al final de esta presentación.
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
ZeZFp
1
1)(
)(ZF
XZ 21
Z
8
0.00
0.25
0.50
0.75
1.00
-8 -6 -4 -2 0 2 4 6
Se aplicará este modelo al ejemplo de graduados de la preparatoria descrito en la presentación del “Modelo de probabilidad lineal”. Se inicia asumiendo que ASVABC es la única variable explicativa relevante, por lo que Z es una función simple de ésta.
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
ZeZFp
1
1)(
)(ZF
ASVABCZ 21
Z
. logit GRAD ASVABC
Iteration 0: Log Likelihood =-162.29468Iteration 1: Log Likelihood =-132.97646Iteration 2: Log Likelihood =-117.99291Iteration 3: Log Likelihood =-117.36084Iteration 4: Log Likelihood =-117.35136Iteration 5: Log Likelihood =-117.35135
Logit Estimates Number of obs = 570 chi2(1) = 89.89 Prob > chi2 = 0.0000Log Likelihood = -117.35135 Pseudo R2 = 0.2769
------------------------------------------------------------------------------ grad | Coef. Std. Err. z P>|z| [95% Conf. Interval]---------+-------------------------------------------------------------------- asvabc | .1666022 .0211265 7.886 0.000 .1251951 .2080094 _cons | -5.003779 .8649213 -5.785 0.000 -6.698993 -3.308564------------------------------------------------------------------------------
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
9
El comando de Stata es logit, seguido por la variable dependiente y la(s) variable(s) explicativa(s). La estimación de máxima verosimilitud es una proceso iterativo, por lo que la primera parte del resultado será similar al que se muestra.
. logit GRAD ASVABC
Iteration 0: log likelihood = -118.67769Iteration 1: log likelihood = -104.45292Iteration 2: log likelihood = -97.135677Iteration 3: log likelihood = -96.887294Iteration 4: log likelihood = -96.886017
Logit estimates Number of obs = 540 LR chi2(1) = 43.58 Prob > chi2 = 0.0000Log likelihood = -96.886017 Pseudo R2 = 0.1836
------------------------------------------------------------------------------ GRAD | Coef. Std. Err. z P>|z| [95% Conf. Interval]-------------+---------------------------------------------------------------- ASVABC | .1313626 .022428 5.86 0.000 .0874045 .1753206 _cons | -3.240218 .9444844 -3.43 0.001 -5.091373 -1.389063------------------------------------------------------------------------------
10
En este caso los coeficientes de la función Z son los que se muestran.
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
ASVABCZ 131.0240.3ˆ
iASVABCi ep 131.0240.31
1
11
Puesto a que sólo hay una variable explicativa, podemos dibujar las funciones de probabilidad y de efectos marginales como funciones de ASVABC.
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
0.00
0.25
0.50
0.75
1.00
0 10 20 30 40 50 60 70 80 90 100
ASVABC
Cu
mu
lati
ve
eff
ec
t
0
0.01
0.02
0.03
Ma
rgin
al e
ffe
ct
ASVABCZ 131.0240.3ˆ
iASVABCi ep 131.0240.31
1
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
12
Observamos que ASVABC tiene un mayor efecto en la graduación cuando es menor a 40, es decir, en el rango más bajo de habilidad. Cualquier individuo con un puntaje superior al promedio (50) seguramente se graduará.
0.00
0.25
0.50
0.75
1.00
0 10 20 30 40 50 60 70 80 90 100
ASVABC
Cu
mu
lati
ve
eff
ec
t
0
0.01
0.02
0.03
Ma
rgin
al e
ffe
ct
ASVABCZ 131.0240.3ˆ
13
El estadístico t indica que el efecto de la variación de ASVABC sobre la probabilidad de graduarse de la preparatoria es altamente significativo.
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
. logit GRAD ASVABC
Iteration 0: log likelihood = -118.67769Iteration 1: log likelihood = -104.45292Iteration 2: log likelihood = -97.135677Iteration 3: log likelihood = -96.887294Iteration 4: log likelihood = -96.886017
Logit estimates Number of obs = 540 LR chi2(1) = 43.58 Prob > chi2 = 0.0000Log likelihood = -96.886017 Pseudo R2 = 0.1836
------------------------------------------------------------------------------ GRAD | Coef. Std. Err. z P>|z| [95% Conf. Interval]-------------+---------------------------------------------------------------- ASVABC | .1313626 .022428 5.86 0.000 .0874045 .1753206 _cons | -3.240218 .9444844 -3.43 0.001 -5.091373 -1.389063------------------------------------------------------------------------------
ASVABCZ 131.0240.3ˆ
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
14
En realidad, el estadístico t es válido solamente para muestras grandes, por lo que la distribución normal es la distribución de referencia. Por esta razón el estadítico se denota con una z en el resultado de Stata. Esta z no está relacionada con la función Z .
. logit GRAD ASVABC
Iteration 0: log likelihood = -118.67769Iteration 1: log likelihood = -104.45292Iteration 2: log likelihood = -97.135677Iteration 3: log likelihood = -96.887294Iteration 4: log likelihood = -96.886017
Logit estimates Number of obs = 540 LR chi2(1) = 43.58 Prob > chi2 = 0.0000Log likelihood = -96.886017 Pseudo R2 = 0.1836
------------------------------------------------------------------------------ GRAD | Coef. Std. Err. z P>|z| [95% Conf. Interval]-------------+---------------------------------------------------------------- ASVABC | .1313626 .022428 5.86 0.000 .0874045 .1753206 _cons | -3.240218 .9444844 -3.43 0.001 -5.091373 -1.389063------------------------------------------------------------------------------
ASVABCZ 131.0240.3ˆ
iASVABCi ep 131.0240.31
1
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
15
El coeficiente de la función Z no tiene ninguna interpretación intuitiva directa.
ASVABCZ 131.0240.3ˆ
0.00
0.25
0.50
0.75
1.00
0 10 20 30 40 50 60 70 80 90 100
ASVABC
Cu
mu
lati
ve
eff
ec
t
0
0.01
0.02
0.03
Ma
rgin
al e
ffe
ct
16
Sin embargo, podemos utilizarlos para cuantificar el efecto marginal de un cambio en ASVABC sobre la probabilidad de graduarse. Esto se realizará teóricamente para el caso general donde Z es una función de muchas variables explicativas.
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
kk XXZ ...221
ZeZFp
1
1)(
17
Puesto que p es una función de Z, y Z es una función de las variables X, el efecto marginal de Xi sobre p puede expresarse como el producto del efecto marginal de Z sobre p y el efecto marginal de Xi sobre Z.
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
iZ
Z
iii e
eZf
XZ
dZdp
Xp 2)1(
)(
kk XXZ ...221
ZeZFp
1
1)(
18
Ya se derivó una expresión para dp/dZ. El efecto marginal de Xi sobre Z está dado por su coeficiente .
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
iZ
Z
iii e
eZf
XZ
dZdp
Xp 2)1(
)(
2)1()( Z
Z
ee
dZdp
Zf
kk XXZ ...221
ZeZFp
1
1)(
19
Por lo tanto, se obtiene una expresión para el efecto marginal de Xi sobre p.
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
iZ
Z
iii e
eZf
XZ
dZdp
Xp 2)1(
)(
kk XXZ ...221
ZeZFp
1
1)(
2)1()( Z
Z
ee
dZdp
Zf
20
kk XXZ ...221
ZeZFp
1
1)(
iZ
Z
iii e
eZf
XZ
dZdp
Xp 2)1(
)(
2)1()( Z
Z
ee
dZdp
Zf
El efecto marginal no es constante debido a que depende de los valores de Z, que a su vez dependen de los valores de las variables explicativas. Un procedimiento muy común es evaluarlo con base en la media muestral de las variables explicativas.
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
21
La media muestral de ASVABC en esta muestra es 51.36.
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
. sum GRAD ASVABC
Variable | Obs Mean Std. Dev. Min Max-------------+-------------------------------------------------------- GRAD | 540 .9425926 .2328351 0 1 ASVABC | 540 51.36271 9.567646 25.45931 66.07963
Logit estimates Number of obs = 540 LR chi2(1) = 43.58 Prob > chi2 = 0.0000Log likelihood = -96.886017 Pseudo R2 = 0.1836
------------------------------------------------------------------------------ GRAD | Coef. Std. Err. z P>|z| [95% Conf. Interval]-------------+---------------------------------------------------------------- ASVABC | .1313626 .022428 5.86 0.000 .0874045 .1753206 _cons | -3.240218 .9444844 -3.43 0.001 -5.091373 -1.389063------------------------------------------------------------------------------
22
Cuando se evalúa en la media, Z es igual a 3.507.
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
. sum GRAD ASVABC
Variable | Obs Mean Std. Dev. Min Max-------------+-------------------------------------------------------- GRAD | 540 .9425926 .2328351 0 1 ASVABC | 540 51.36271 9.567646 25.45931 66.07963
Logit estimates Number of obs = 540 LR chi2(1) = 43.58 Prob > chi2 = 0.0000Log likelihood = -96.886017 Pseudo R2 = 0.1836
------------------------------------------------------------------------------ GRAD | Coef. Std. Err. z P>|z| [95% Conf. Interval]-------------+---------------------------------------------------------------- ASVABC | .1313626 .022428 5.86 0.000 .0874045 .1753206 _cons | -3.240218 .9444844 -3.43 0.001 -5.091373 -1.389063------------------------------------------------------------------------------
507.336.51131.0240.321 XZ
23
e–Z es 0.030. Por lo tanto, f(Z) es 0.028.
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
. sum GRAD ASVABC
Variable | Obs Mean Std. Dev. Min Max-------------+-------------------------------------------------------- GRAD | 540 .9425926 .2328351 0 1 ASVABC | 540 51.36271 9.567646 25.45931 66.07963
507.336.51131.0240.321 XZ
030.0507.3 ee Z
028.0)030.01(
030.0)1(
)( 22
Z
Z
ee
dZdp
Zf
24
El efecto marginal, evaluado en la media, es entonces 0.004. Esto implica que un punto de incremento en ASVABC incrementaría la probabilidad de graduarse de la preparatoria en 0.4%.
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
028.0)030.01(
030.0)1(
)( 22
Z
Z
ee
dZdp
Zf
004.0131.0028.0)(
iii
ZfXZ
dZdp
Xp
030.0507.3 ee Z
. sum GRAD ASVABC
Variable | Obs Mean Std. Dev. Min Max-------------+-------------------------------------------------------- GRAD | 540 .9425926 .2328351 0 1 ASVABC | 540 51.36271 9.567646 25.45931 66.07963
507.336.51131.0240.321 XZ
25
En este ejemplo, el efecto marginal en la media de ASVABC es bastante bajo. La razón es que cualquier persona con un puntaje promedio tiene certeza de graduarse de cualquier manera. Por lo que un incremento en el puntaje tiene un efecto muy bajo.
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
51.360.00
0.25
0.50
0.75
1.00
0 10 20 30 40 50 60 70 80 90 100
ASVABC
Cu
mu
lati
ve
eff
ec
t
0
0.01
0.02
0.03
Ma
rgin
al e
ffe
ct
26
Para mostrar que el efecto marginal varía, también se calculará para ASVABC igual a 30. Un punto de incremento en ASVABC aumenta la probabilidad en 2.9%.
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
496.0701.0 ee Z
222.0)496.01(
496.0)1(
)( 22
Z
Z
ee
dZdp
Zf
029.0131.0222.0)(
iii
ZfXZ
dZdp
Xp
. sum GRAD ASVABC
Variable | Obs Mean Std. Dev. Min Max-------------+-------------------------------------------------------- GRAD | 540 .9425926 .2328351 0 1 ASVABC | 540 51.36271 9.567646 25.45931 66.07963
701.030131.0240.321 XZ
27
Un individuo con un puntaje de 30 tiene sólo 67% de probabilidad de graduarse, y un incremento en su puntaje tiene un impacto relativo mayor.
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
0.00
0.25
0.50
0.75
1.00
0 10 20 30 40 50 60 70 80 90 100
ASVABC
Cu
mu
lati
ve
eff
ec
t
0
0.01
0.02
0.03
Ma
rgin
al e
ffe
ct
. logit GRAD ASVABC SM SF MALE
Iteration 0: log likelihood = -118.67769Iteration 1: log likelihood = -104.73493Iteration 2: log likelihood = -97.080528Iteration 3: log likelihood = -96.806623Iteration 4: log likelihood = -96.804845Iteration 5: log likelihood = -96.804844
Logit estimates Number of obs = 540 LR chi2(4) = 43.75 Prob > chi2 = 0.0000Log likelihood = -96.804844 Pseudo R2 = 0.1843
------------------------------------------------------------------------------ GRAD | Coef. Std. Err. z P>|z| [95% Conf. Interval]-------------+---------------------------------------------------------------- ASVABC | .1329127 .0245718 5.41 0.000 .0847528 .1810726 SM | -.023178 .0868122 -0.27 0.789 -.1933267 .1469708 SF | .0122663 .0718876 0.17 0.865 -.1286307 .1531634 MALE | .1279654 .3989345 0.32 0.748 -.6539318 .9098627 _cons | -3.252373 1.065524 -3.05 0.002 -5.340761 -1.163985------------------------------------------------------------------------------
28
Este es el resultado de un modelo con una mejor especificación.
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
. sum GRAD ASVABC SM SF MALE
Variable | Obs Mean Std. Dev. Min Max-------------+-------------------------------------------------------- GRAD | 540 .9425926 .2328351 0 1 ASVABC | 540 51.36271 9.567646 25.45931 66.07963 SM | 540 11.57963 2.816456 0 20 SF | 540 11.83704 3.53715 0 20 MALE | 540 .5 .5004636 0 1
29
Se estimarán los efectos marginales al poner todas las variables explicativas en el valor de su media muestral. Como se aprecia, 94% de los casos se graduaron.
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
Logit: Marginal Effects
mean b product f(Z) f(Z)b
ASVABC 51.36 0.133 6.826 0.028 0.004
SM 11.58 –0.023 –0.269 0.028 –0.001
SF 11.84 0.012 0.146 0.028 0.000
MALE 0.50 0.128 0.064 0.028 0.004
Constant 1.00 –3.252 –3.252
Total 3.514
30
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
El primer paso es calcular Z, cuando las variables X con iguales a su media muestral.
514.3
...221
kk XXZ
Logit: Marginal Effects
mean b product f(Z) f(Z)b
ASVABC 51.36 0.133 6.826 0.028 0.004
SM 11.58 –0.023 –0.269 0.028 –0.001
SF 11.84 0.012 0.146 0.028 0.000
MALE 0.50 0.128 0.064 0.028 0.004
Constant 1.00 –3.252 –3.252
Total 3.514
31
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
Ahora, se calcula f(Z).
030.0514.3 ee Z
028.0)1(
)( 2
Z
Z
ee
Zf
32
Los efectos marginales estimados son f(Z) multiplicado por su respectivos coeficientes. Se observa que el efecto ASVABC es similar al anterior. La educación de la madre tiene un efecto insignificante y la educación del padre no tiene un efecto discernible.
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
iii
ZfXZ
dZdp
Xp )(
Logit: Marginal Effects
mean b product f(Z) f(Z)b
ASVABC 51.36 0.133 6.826 0.028 0.004
SM 11.58 –0.023 –0.269 0.028 –0.001
SF 11.84 0.012 0.146 0.028 0.000
MALE 0.50 0.128 0.064 0.028 0.004
Constant 1.00 –3.252 –3.252
Total 3.514
Logit: Marginal Effects
mean b product f(Z) f(Z)b
ASVABC 51.36 0.133 6.826 0.028 0.004
SM 11.58 –0.023 –0.269 0.028 –0.001
SF 11.84 0.012 0.146 0.028 0.000
MALE 0.50 0.128 0.064 0.028 0.004
Constant 1.00 –3.252 –3.252
Total 3.514
33
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
iii
ZfXZ
dZdp
Xp )(
Los hombre tienen 0.4% mayor de probabilidad de graduarse respecto a las mujeres. Estos efectos habrían sido mayores si se hubieran evaluado respecto a los menores puntajes de ASVABC. En stata, los efectos marginales se calculan con los comandos mfx o prvalue, entre otros.
Las personas que se graduaron: probabilidad del resultado
34
Esta presentación concluirá con una explicación puntual de cómo se estima el modelo utilizando la estimación de máxima verosimilitud.
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
iASVABCe 211
1
ASVABCZ 21
ASVABC
Z
e
eZFp
211
11
1)(
35
En el caso de un individuo que se graduó, la probabilidad de ese resultado es F(Z). Daremos los subíndices 1,…, s a los individuos que graduaron.
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
iASVABCe 211
1
ASVABCZ 21
ASVABC
Z
e
eZFp
211
11
1)(
Las personas que se graduaron: probabilidad del resultado
36
En el caso de un individuo que no se graduó, la probabilidad es este resultado es 1 – F(Z). Daremos los subíndices s+1, ..., n a estos individuos.
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
iASVABCe 211
1
iASVABCe 211
11
Maximize F(Z1) x ... x F(Zs) x [1 – F(Zs+1)] x ... x [1 – F(Zn)]
Las personas que se graduaron: probabilidad del resultado
Las personas que no se graduaron: probabilidad del resultado
Maximize F(Z1) x ... x F(Zs) x [1 – F(Zs+1)] x ... x [1 – F(Zn)]
Se graduaron No se graduaron
37
Seleccionamos b1 y b2 para maximizar la probabilidad conjunta de estos resultados, esto es, F(Z1) x ... x F(Zs) x [1 – F(Zs+1)] x ... x [1 – F(Zn)]. No existe una fórmula matemática para b1 y b2. Tienen que ser determinadas iterativamente en un proceso de prueba y error.
MODELOS DE ELECCIÓN BINARIA: ANÁLISIS LOGIT
iASVABCe 211
1 iASVABCe 211
11
ns
s
ASVABCbbASVABCbb
ASVABCbbASVABCbb
ee
ee
21121
21121
1
11...
1
11
1
1...
1
1
Copyright Christopher Dougherty 2000–2010. This slideshow may be freely copied for personal use.
02.02.10