Taller 1 (1)
-
Upload
juan-camilo-chaves -
Category
Documents
-
view
3 -
download
0
Transcript of Taller 1 (1)
1
Econometría II - ECON 3301 – Período 2015-10 Profesor: Jorge Perdomo; [email protected] Profesor Taller: Daniel Ángel; [email protected] Profesor Taller: Jorge Rueda; [email protected] Monitor: Andrés Camacho; [email protected] Monitor: Natalia Rodríguez; [email protected]
Taller I
Fecha de entrega: Lunes 16 de febrero. Se debe entregar en el casillero 30-A del séptimo piso de la Facultad de Economía antes de las 10 am. Los grupos son de máximo dos personas. Al final del taller se debe incluir el Do-File de los ejercicios de la parte práctica. El incumplimiento de alguna de las condiciones genera disminuciones en la nota final.
PARTE TEÓRICA
1. (0.7 Puntos) Considere el siguiente modelo de regresión lineal:
𝑦𝑖 = 𝛽0 + 𝛽1𝑥1𝑖 + 𝑢𝑖
Sin embargo dentro de este estudio se introdujo una segunda variable explicativa, por tanto,
se estimó el siguiente modelo:
𝑦𝑖 = 𝛼0 + 𝛼1𝑥1𝑖 + 𝛼2𝑥2𝑖 + 𝜀𝑖
a. Encuentre por mínimos cuadrados ordinarios (MCO) los estimadores de 𝛼0, 𝛼1 y 𝛼21.
b. A partir de lo anterior, demuestre que:
𝑉𝑎𝑟(�̂�1|𝑥1𝑖, 𝑥2𝑖) =𝜎𝜀
2
∑ (𝑥1𝑖 − �̅�1)2𝑛𝑖=1 (1 − 𝜌𝑥1,𝑥2
2 )
Donde 𝜌𝑥1,𝑥22 es el coeficiente de correlación lineal entre 𝑥1 y 𝑥2 al cuadrado2.
Ahora, asuma que 𝑥2 es una variable redundante, por consiguiente:
c. Demuestre formalmente si el estimador �̂�1 es insesgado.
d. Demuestre formalmente si el estimador �̂�1 es consistente.
e. Demuestre formalmente si el estimador �̂�1 es ineficiente (para ello halle la varianza de �̂�1
y compárela con la encontrada en el literal b). ¿Qué condición se necesita para que la
varianza de �̂�1 sea igual a la varianza de �̂�1?
1 Para este punto tenga en cuenta que el modelo NO está definido de manera matricial. Recuerden que la solución debe
depender únicamente de las variables explicativas, la variable explicada y sus respectivas medias. 2 Para este punto asuma que la correlación es diferente de cero.
2
2. (0.5 Puntos) Considere el siguiente modelo de regresión lineal:
𝑦𝑖∗ = 𝛽0 + 𝛽1𝑥𝑖
∗ + 𝑢𝑖
En donde: 𝑦𝑖∗ = 𝑦𝑖 ± 𝑣𝑖
𝑥𝑖∗ = 𝑥𝑖 ± 𝑤𝑖
a. A qué problema se puede deber la especificación anterior. De un ejemplo explícito en
donde se puede tener este tipo de problema tanto en la variable dependiente como en la
variable independiente.
b. Demuestre si el estimador �̂�1 es insesgado.
c. Demuestre si el estimador �̂�1 es consistente.
d. Demuestre si el estimador �̂�1 es eficiente.
3. (0.3 Puntos) 𝑦𝑖 = 𝛼 + 𝛽𝑥𝑖 + 𝑢𝑖 es un modelo teórico con 𝑖 = 1, … , 𝑛 y 𝑛 representa el
número de la observación de la muestra. A partir de esto, demuestre que:
𝐶𝑜𝑣(�̂�, �̂�) = −𝜎𝑢
2�̅�
∑ (𝑥𝑖 − �̅�)2𝑛𝑖=1
4. (0.5 Puntos) Considere el modelo 𝑌 = 𝑋𝛽 + 𝜉, donde 𝑌 es el vector de variables
independientes de tamaño 𝑛 × 1, 𝑋 es la matriz de regresores de tamaño 𝑛 × (𝑘 + 𝑝 + 1),
con 𝑘 + 1 regresores exógenos incluyendo intercepto y 𝑝 regresores endógenos, 𝛽 un vector
de parámetros poblacionales de tamaño (𝑘 + 𝑝 + 1) × 1 y 𝜉 el vector de errores de tamaño
𝑛 × 1. Para solucionar el problema de endogenidad se implementa una matriz 𝑍 de tamaño
𝑛 × 𝑚, donde 𝑚 es el número de instrumentos (asuma que 𝑝 = 𝑚). A partir de lo anterior:
a. Obtenga los estimadores de 𝛽 mediante MC2E (Mínimos cuadrados en dos etapas). Sea
explícito en el procedimiento y tamaño de las matrices que usa en cada etapa.
b. Demuestre que los errores estimados (𝜉𝑀𝐶2𝐸) del modelo de dos etapas se pueden
expresar como:
𝜉𝑀𝐶2𝐸 = [𝐼 − 𝑋(𝑍′𝑋)−1𝑍′]𝜉, donde 𝐼 es la matriz identidad, 𝑍 es la matriz de corrección
del problema de endogenidad y 𝜉 (el error de MCO).
c. Demuestre que la matriz varianza-covarianza de los estimadores de MC2E es:
𝑉𝑎𝑟 (�̂�𝑀𝐶2𝐸|𝑋, 𝑍) = �̂�𝜉2(𝑋′𝑃𝑧𝑋)−1, donde 𝑃𝑍 es la matriz de proyección al espacio de la
variación exógena.
5. (0.5 Puntos) Considere el siguiente modelo:
𝑦𝑖 = 𝛽𝑜 + 𝛽1𝑥𝑖 + 𝑢𝑖
Asumiendo que 𝐸(𝑢𝑖|𝑥𝑖) ≠ 0 resuelva lo siguiente:
3
a. Dado el problema de endogenidad presente en el modelo, éste se estima utilizando la
variable instrumental 𝑧𝑖 tal que 𝑥𝑖∗ = 𝛼0 + 𝛼1𝑧𝑖 + 𝑣𝑖. Con esta especificación, obtenga
algebraicamente (no matricialmente) los estimadores por mínimos cuadrados en dos (2)
etapas.
b. Demuestre algebraicamente que los estimadores de MC2E del inciso anterior (a) cumplen
la condición de ser insesgados y consistentes.
c. Asuma que el instrumento utilizado es una variable dicótoma, que toma el valor de 1
cuando se cumple cierta condición, y 0 si no se cumple. De este modo, demuestre que el
estimador de la segunda etapa puede ser escrito como:
�̂�1 =�̅�1 − �̅�0
�̅�1∗ − �̅�0
∗
Donde �̅�1 y �̅�0 corresponde al promedio de la variable dependiente cuando el instrumento
toma el valor de 1 y 0, respectivamente. De igual forma para �̅�1 y �̅�0.
Parte práctica
1. El archivo “punto1.dta” contiene información sobre 6.000 trabajadores en Canadá, con
respecto a los salarios (salario), la edad (edad), los años de educación (educ), la
experiencia (exper) y el puntaje de una prueba usado para capturar la habilidad de un
individuo (puntaje). Se desea conocer cuál es la mejor especificación (forma funcional)
para explicar el comportamiento de los salarios de los trabajadores, para lo cual se
plantean los modelos lin-lin, log-log y log-lin. El modelo asume que la variable dependiente
es el salario y las explicativas son la edad, la educación, la experiencia y el puntaje en la
prueba.
a. Estime el modelo de regresión lineal (lin-lin), logarítmico (log-log) y semi-
logarítmico (log-lin).
b. Interprete los resultados (signos e intuición económica, significancia parcial y
global, bondad de ajuste y magnitud de los coeficientes).
c. Usualmente, se ha considerado que la especificación semi-logarítmica es la mejor
(dado que se cumple el supuesto de normalidad del error) para estimar el efecto
sobre el salario de los trabajadores. Utilice la prueba RESET de Ramsey para
verificar la validez de esta afirmación.
d. Realice la prueba de Davidson y McKinnon para comparar el modelo log-lin y log-
log. Interprete los resultados
e. Realice le prueba del Multiplicador de Lagrange para comparar los modelos log-lin
y log-log. Interprete los resultados.
2. La base de datos “punto2.dta” contiene información sobre 1.085 madres y sus hijos. Usted
como investigador está interesado en entender si la prácticas de disciplina en el hogar
afectan el desarrollo cognitivo de los hijos. Para lo cual se plantea la siguiente regresión
4
log(𝑆𝑎𝑏𝑒𝑟)
= 𝛽0 + 𝛽1𝑐𝑎𝑠𝑡𝑖𝑔𝑜𝑠 + 𝛽2𝑒𝑑𝑢𝑐𝑚𝑎𝑑𝑟𝑒 + 𝛽3𝑟𝑎𝑧𝑎 + 𝛽4𝑠𝑒𝑥𝑜
+ 𝛽5𝑒𝑑𝑎𝑑𝑚𝑎𝑑𝑟𝑒 + 𝜀
Donde log (𝑆𝑎𝑏𝑒𝑟) es el logaritmo de la prueba estandarizada SABER, 𝑐𝑎𝑠𝑡𝑖𝑔𝑜𝑠 es el
número de veces qye la madre reprende o castiga al niño en el mes, 𝑒𝑑𝑢𝑐𝑚𝑎𝑑𝑟𝑒 es el
número de años de educación de la madre, 𝑟𝑎𝑧𝑎 es una avriable dicótoma que toma el
valor de 1 si pertenece a minoría étnica y 0 de lo contrario, 𝑠𝑒𝑥𝑜 toma el valor de 1 si es
niña y 0 de lo contrario y 𝑒𝑑𝑎𝑑𝑚𝑎𝑑𝑟𝑒 es la edad de la madre.
a. ¿Cuáles son los signos esperados?
b. Estime el modelo por Mínimos Cuadrados Ordinarios
c. Interprete los resultados (signos, significancia parcial y global, bondad de ajuste y
magnitud). ¿Los resultados son los esperados? De no ser así explique a qué podría
deberse la diferencia.
d. Ahora, suponga que castigos es endógena. Explique la intuición de la anterior
afirmación.
e. Explique por qué la condición laboral de una madre (si trabaja o no) podría estar
correlacionada con la variable castigos. De lo anterior ¿se podría considerar que el
instrumento es válido?
f. La base de datos contiene información sobre: i) el número de centros del ICBF en
la región (ICBF); ii) el número de Secretarías de Integración Social en la región de
la madre (SIS), que tiene el objetivo de orientar y liderar la formación y el
desarrollo de políticas de promoción, prevención, protección, restablecimiento y
garantía de los derechos de los distintos grupos poblacionales; y iii) el número de
iglesias (iglesias). Discuta la validez de las anteriores variables como instrumentos
para castigos.
g. Utilizando las tres variables como instrumentos, estime el modelo inicial por
Mínimos Cuadrados en dos Etapas (MC2E) de forma matricial y usando el
comando directo de STATA.
h. Interprete los resultados signos, significancia parcial y global, bondad de ajuste y
magnitud).
i. Realice la prueba de Hausman para identificar problemas de endogenidad en el
modelo.
j. Realice las pruebas estadísticas (Sargan) para comprobar la validez y la
significancia de los instrumentos usados.