Taller 1 (1)

4
1 Econometría II - ECON 3301 – Período 2015-10 Profesor: Jorge Perdomo; [email protected] Profesor Taller: Daniel Ángel; [email protected] Profesor Taller: Jorge Rueda; [email protected] Monitor: Andrés Camacho; [email protected] Monitor: Natalia Rodríguez; [email protected] Taller I Fecha de entrega: Lunes 16 de febrero. Se debe entregar en el casillero 30-A del séptimo piso de la Facultad de Economía antes de las 10 am. Los grupos son de máximo dos personas. Al final del taller se debe incluir el Do-File de los ejercicios de la parte práctica. El incumplimiento de alguna de las condiciones genera disminuciones en la nota final. PARTE TEÓRICA 1. (0.7 Puntos) Considere el siguiente modelo de regresión lineal: = 0 + 1 1 + Sin embargo dentro de este estudio se introdujo una segunda variable explicativa, por tanto, se estimó el siguiente modelo: = 0 + 1 1 + 2 2 + a. Encuentre por mínimos cuadrados ordinarios (MCO) los estimadores de 0 , 1 y 2 1 . b. A partir de lo anterior, demuestre que: ( 1 | 1 , 2 )= 2 ( 1 − ̅ 1 ) 2 =1 (1 − 1 , 2 2 ) Donde 1 , 2 2 es el coeficiente de correlación lineal entre 1 y 2 al cuadrado 2 . Ahora, asuma que 2 es una variable redundante, por consiguiente: c. Demuestre formalmente si el estimador 1 es insesgado. d. Demuestre formalmente si el estimador 1 es consistente. e. Demuestre formalmente si el estimador 1 es ineficiente (para ello halle la varianza de 1 y compárela con la encontrada en el literal b). ¿Qué condición se necesita para que la varianza de 1 sea igual a la varianza de 1 ? 1 Para este punto tenga en cuenta que el modelo NO está definido de manera matricial. Recuerden que la solución debe depender únicamente de las variables explicativas, la variable explicada y sus respectivas medias. 2 Para este punto asuma que la correlación es diferente de cero.

Transcript of Taller 1 (1)

Page 1: Taller 1 (1)

1

Econometría II - ECON 3301 – Período 2015-10 Profesor: Jorge Perdomo; [email protected] Profesor Taller: Daniel Ángel; [email protected] Profesor Taller: Jorge Rueda; [email protected] Monitor: Andrés Camacho; [email protected] Monitor: Natalia Rodríguez; [email protected]

Taller I

Fecha de entrega: Lunes 16 de febrero. Se debe entregar en el casillero 30-A del séptimo piso de la Facultad de Economía antes de las 10 am. Los grupos son de máximo dos personas. Al final del taller se debe incluir el Do-File de los ejercicios de la parte práctica. El incumplimiento de alguna de las condiciones genera disminuciones en la nota final.

PARTE TEÓRICA

1. (0.7 Puntos) Considere el siguiente modelo de regresión lineal:

𝑦𝑖 = 𝛽0 + 𝛽1𝑥1𝑖 + 𝑢𝑖

Sin embargo dentro de este estudio se introdujo una segunda variable explicativa, por tanto,

se estimó el siguiente modelo:

𝑦𝑖 = 𝛼0 + 𝛼1𝑥1𝑖 + 𝛼2𝑥2𝑖 + 𝜀𝑖

a. Encuentre por mínimos cuadrados ordinarios (MCO) los estimadores de 𝛼0, 𝛼1 y 𝛼21.

b. A partir de lo anterior, demuestre que:

𝑉𝑎𝑟(�̂�1|𝑥1𝑖, 𝑥2𝑖) =𝜎𝜀

2

∑ (𝑥1𝑖 − �̅�1)2𝑛𝑖=1 (1 − 𝜌𝑥1,𝑥2

2 )

Donde 𝜌𝑥1,𝑥22 es el coeficiente de correlación lineal entre 𝑥1 y 𝑥2 al cuadrado2.

Ahora, asuma que 𝑥2 es una variable redundante, por consiguiente:

c. Demuestre formalmente si el estimador �̂�1 es insesgado.

d. Demuestre formalmente si el estimador �̂�1 es consistente.

e. Demuestre formalmente si el estimador �̂�1 es ineficiente (para ello halle la varianza de �̂�1

y compárela con la encontrada en el literal b). ¿Qué condición se necesita para que la

varianza de �̂�1 sea igual a la varianza de �̂�1?

1 Para este punto tenga en cuenta que el modelo NO está definido de manera matricial. Recuerden que la solución debe

depender únicamente de las variables explicativas, la variable explicada y sus respectivas medias. 2 Para este punto asuma que la correlación es diferente de cero.

Page 2: Taller 1 (1)

2

2. (0.5 Puntos) Considere el siguiente modelo de regresión lineal:

𝑦𝑖∗ = 𝛽0 + 𝛽1𝑥𝑖

∗ + 𝑢𝑖

En donde: 𝑦𝑖∗ = 𝑦𝑖 ± 𝑣𝑖

𝑥𝑖∗ = 𝑥𝑖 ± 𝑤𝑖

a. A qué problema se puede deber la especificación anterior. De un ejemplo explícito en

donde se puede tener este tipo de problema tanto en la variable dependiente como en la

variable independiente.

b. Demuestre si el estimador �̂�1 es insesgado.

c. Demuestre si el estimador �̂�1 es consistente.

d. Demuestre si el estimador �̂�1 es eficiente.

3. (0.3 Puntos) 𝑦𝑖 = 𝛼 + 𝛽𝑥𝑖 + 𝑢𝑖 es un modelo teórico con 𝑖 = 1, … , 𝑛 y 𝑛 representa el

número de la observación de la muestra. A partir de esto, demuestre que:

𝐶𝑜𝑣(�̂�, �̂�) = −𝜎𝑢

2�̅�

∑ (𝑥𝑖 − �̅�)2𝑛𝑖=1

4. (0.5 Puntos) Considere el modelo 𝑌 = 𝑋𝛽 + 𝜉, donde 𝑌 es el vector de variables

independientes de tamaño 𝑛 × 1, 𝑋 es la matriz de regresores de tamaño 𝑛 × (𝑘 + 𝑝 + 1),

con 𝑘 + 1 regresores exógenos incluyendo intercepto y 𝑝 regresores endógenos, 𝛽 un vector

de parámetros poblacionales de tamaño (𝑘 + 𝑝 + 1) × 1 y 𝜉 el vector de errores de tamaño

𝑛 × 1. Para solucionar el problema de endogenidad se implementa una matriz 𝑍 de tamaño

𝑛 × 𝑚, donde 𝑚 es el número de instrumentos (asuma que 𝑝 = 𝑚). A partir de lo anterior:

a. Obtenga los estimadores de 𝛽 mediante MC2E (Mínimos cuadrados en dos etapas). Sea

explícito en el procedimiento y tamaño de las matrices que usa en cada etapa.

b. Demuestre que los errores estimados (𝜉𝑀𝐶2𝐸) del modelo de dos etapas se pueden

expresar como:

𝜉𝑀𝐶2𝐸 = [𝐼 − 𝑋(𝑍′𝑋)−1𝑍′]𝜉, donde 𝐼 es la matriz identidad, 𝑍 es la matriz de corrección

del problema de endogenidad y 𝜉 (el error de MCO).

c. Demuestre que la matriz varianza-covarianza de los estimadores de MC2E es:

𝑉𝑎𝑟 (�̂�𝑀𝐶2𝐸|𝑋, 𝑍) = �̂�𝜉2(𝑋′𝑃𝑧𝑋)−1, donde 𝑃𝑍 es la matriz de proyección al espacio de la

variación exógena.

5. (0.5 Puntos) Considere el siguiente modelo:

𝑦𝑖 = 𝛽𝑜 + 𝛽1𝑥𝑖 + 𝑢𝑖

Asumiendo que 𝐸(𝑢𝑖|𝑥𝑖) ≠ 0 resuelva lo siguiente:

Page 3: Taller 1 (1)

3

a. Dado el problema de endogenidad presente en el modelo, éste se estima utilizando la

variable instrumental 𝑧𝑖 tal que 𝑥𝑖∗ = 𝛼0 + 𝛼1𝑧𝑖 + 𝑣𝑖. Con esta especificación, obtenga

algebraicamente (no matricialmente) los estimadores por mínimos cuadrados en dos (2)

etapas.

b. Demuestre algebraicamente que los estimadores de MC2E del inciso anterior (a) cumplen

la condición de ser insesgados y consistentes.

c. Asuma que el instrumento utilizado es una variable dicótoma, que toma el valor de 1

cuando se cumple cierta condición, y 0 si no se cumple. De este modo, demuestre que el

estimador de la segunda etapa puede ser escrito como:

�̂�1 =�̅�1 − �̅�0

�̅�1∗ − �̅�0

Donde �̅�1 y �̅�0 corresponde al promedio de la variable dependiente cuando el instrumento

toma el valor de 1 y 0, respectivamente. De igual forma para �̅�1 y �̅�0.

Parte práctica

1. El archivo “punto1.dta” contiene información sobre 6.000 trabajadores en Canadá, con

respecto a los salarios (salario), la edad (edad), los años de educación (educ), la

experiencia (exper) y el puntaje de una prueba usado para capturar la habilidad de un

individuo (puntaje). Se desea conocer cuál es la mejor especificación (forma funcional)

para explicar el comportamiento de los salarios de los trabajadores, para lo cual se

plantean los modelos lin-lin, log-log y log-lin. El modelo asume que la variable dependiente

es el salario y las explicativas son la edad, la educación, la experiencia y el puntaje en la

prueba.

a. Estime el modelo de regresión lineal (lin-lin), logarítmico (log-log) y semi-

logarítmico (log-lin).

b. Interprete los resultados (signos e intuición económica, significancia parcial y

global, bondad de ajuste y magnitud de los coeficientes).

c. Usualmente, se ha considerado que la especificación semi-logarítmica es la mejor

(dado que se cumple el supuesto de normalidad del error) para estimar el efecto

sobre el salario de los trabajadores. Utilice la prueba RESET de Ramsey para

verificar la validez de esta afirmación.

d. Realice la prueba de Davidson y McKinnon para comparar el modelo log-lin y log-

log. Interprete los resultados

e. Realice le prueba del Multiplicador de Lagrange para comparar los modelos log-lin

y log-log. Interprete los resultados.

2. La base de datos “punto2.dta” contiene información sobre 1.085 madres y sus hijos. Usted

como investigador está interesado en entender si la prácticas de disciplina en el hogar

afectan el desarrollo cognitivo de los hijos. Para lo cual se plantea la siguiente regresión

Page 4: Taller 1 (1)

4

log(𝑆𝑎𝑏𝑒𝑟)

= 𝛽0 + 𝛽1𝑐𝑎𝑠𝑡𝑖𝑔𝑜𝑠 + 𝛽2𝑒𝑑𝑢𝑐𝑚𝑎𝑑𝑟𝑒 + 𝛽3𝑟𝑎𝑧𝑎 + 𝛽4𝑠𝑒𝑥𝑜

+ 𝛽5𝑒𝑑𝑎𝑑𝑚𝑎𝑑𝑟𝑒 + 𝜀

Donde log (𝑆𝑎𝑏𝑒𝑟) es el logaritmo de la prueba estandarizada SABER, 𝑐𝑎𝑠𝑡𝑖𝑔𝑜𝑠 es el

número de veces qye la madre reprende o castiga al niño en el mes, 𝑒𝑑𝑢𝑐𝑚𝑎𝑑𝑟𝑒 es el

número de años de educación de la madre, 𝑟𝑎𝑧𝑎 es una avriable dicótoma que toma el

valor de 1 si pertenece a minoría étnica y 0 de lo contrario, 𝑠𝑒𝑥𝑜 toma el valor de 1 si es

niña y 0 de lo contrario y 𝑒𝑑𝑎𝑑𝑚𝑎𝑑𝑟𝑒 es la edad de la madre.

a. ¿Cuáles son los signos esperados?

b. Estime el modelo por Mínimos Cuadrados Ordinarios

c. Interprete los resultados (signos, significancia parcial y global, bondad de ajuste y

magnitud). ¿Los resultados son los esperados? De no ser así explique a qué podría

deberse la diferencia.

d. Ahora, suponga que castigos es endógena. Explique la intuición de la anterior

afirmación.

e. Explique por qué la condición laboral de una madre (si trabaja o no) podría estar

correlacionada con la variable castigos. De lo anterior ¿se podría considerar que el

instrumento es válido?

f. La base de datos contiene información sobre: i) el número de centros del ICBF en

la región (ICBF); ii) el número de Secretarías de Integración Social en la región de

la madre (SIS), que tiene el objetivo de orientar y liderar la formación y el

desarrollo de políticas de promoción, prevención, protección, restablecimiento y

garantía de los derechos de los distintos grupos poblacionales; y iii) el número de

iglesias (iglesias). Discuta la validez de las anteriores variables como instrumentos

para castigos.

g. Utilizando las tres variables como instrumentos, estime el modelo inicial por

Mínimos Cuadrados en dos Etapas (MC2E) de forma matricial y usando el

comando directo de STATA.

h. Interprete los resultados signos, significancia parcial y global, bondad de ajuste y

magnitud).

i. Realice la prueba de Hausman para identificar problemas de endogenidad en el

modelo.

j. Realice las pruebas estadísticas (Sargan) para comprobar la validez y la

significancia de los instrumentos usados.