PONTIFICIA UNIVERSIDAD CATOLICA DE CHILE ESCUELA DE INGENIERA DEPARTAMENTO DE INGENIERA DE TRANSPORTE Y LOGSTICA ICT-2950 Tpicos de Econometra Profesor: Louis de Grange C.
APUNTES DE CLASES
ICT-2950 TPICOS DE ECONOMETRA (VERSIN 1er SEMESTRE 2013)
(CT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
ii
NDICE
Pg.
1 REPASO DE MATRICES Y ANLISIS DE DATOS ..................... 1-1
1.1 Operaciones con Matrices ....................................................1-1
1.1.1 Matrices Especiales ......................................................................... 1-1
1.1.2 Suma ................................................................................................. 1-2
1.1.3 Multiplicacin .................................................................................. 1-2
1.1.4 Operador de Kronecker ................................................................. 1-2
1.1.5 Matrices Particionadas .................................................................... 1-3
1.1.6 Matriz Inversa .................................................................................. 1-3
1.1.7 Matriz Traspuesta ............................................................................ 1-3
1.1.8 Traza de una Matriz........................................................................ 1-4
1.1.9 Matrices Ortogonales ..................................................................... 1-5
1.1.10 Vectores Caractersticos y Valores Propios ................................... 1-5
1.1.11 Rango de una Matriz ...................................................................... 1-7
1.1.12 Formas Cuadrticas de una Matriz ............................................... 1-7
1.1.13 Diferenciacin de Matrices ............................................................. 1-8
1.1.14 Series de Taylor ............................................................................... 1-9
1.2 Anlisis de Datos ....................................................................1-9
1.2.1 Tipos de Variables ........................................................................ 1-10
1.2.2 Media, Varianza, Covarianza y Correlacin ............................ 1-10
1.2.3 Medidas de Dependencia Lineal de los Datos .......................... 1-12
1.2.4 Datos Atpicos (Outliers) .............................................................. 1-12
2 REGRESIN LINEAL MLTIPLE ......................................... 2-15
2.1 Supuestos del Modelo ........................................................ 2-17
2.1.1 Supuestos Sobre la Perturbacin ................................................ 2-17
2.1.2 Supuestos sobre las Variables Explicativas ................................ 2-18
2.1.3 Supuestos sobre los Parmetros del Modelo ............................. 2-18
2.2 Estimacin por Mnimos Cuadrados Ordinarios (MCO) . 2-18
2.2.1 Vector de Parmetros ................................................................... 2-21
2.2.2 Aspectos Algebraicos y Propiedades de los Estimadores (Muestras
Finitas y Muestras Grandes) ........................................................ 2-23
2.2.3 Teorema Central del Lmite .......................................................... 2-28
ICT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
iii
2.2.4 Indicadores de Bondad de Ajuste ............................................... 2-30
2.2.5 MCO vs Mxima Verosimilitud ................................................... 2-33
2.2.6 Interpretacin Econmica ............................................................ 2-35
2.2.7 Diagrama de Venn ....................................................................... 2-36
2.2.8 Interpretacin Geomtrica de los MCO .................................... 2-38
3 INFERENCIA Y PRECICCIN ............................................. 3-43
3.1 Contraste de Restricciones .................................................. 3-43
3.1.1 Contraste de una Restriccin Lineal ............................................ 3-43
3.1.2 Contraste de Restricciones Lineales Conjuntas .......................... 3-44
3.1.3 Contraste Basado en una Regin de Confianza ....................... 3-45
3.1.4 Mnimos Cuadrados Restringidos................................................ 3-48
3.1.5 Contraste de Restricciones No Lineales ...................................... 3-49
3.2 Prediccin ............................................................................. 3-50
3.3 Estimacin por Mnimos Cuadrados Generales (MCG) .. 3-53
4 ESPECIFICACIN ........................................................... 4-56
4.1 Variables Ficticias ................................................................ 4-56
4.1.1 Cambio Estructural en el Intercepto ............................................ 4-58
4.1.2 Cambio Estructural en la Pendiente ............................................ 4-59
4.1.3 Cambio Estructural en el Intercepto y la Pendiente ................... 4-59
4.2 Variables No Lineales ......................................................... 4-60
4.2.1 Transformaciones Generales ....................................................... 4-60
4.2.2 Transformacin Box - Tidwell ....................................................... 4-61
4.2.3 Transformacin Box - Cox ............................................................ 4-62
4.3 Modelos No Lineales .......................................................... 4-65
4.3.1 Modelo de Regresin Linealizado en Parmetros ..................... 4-66
4.3.2 Modelo de Regresin Linealizado en Variables ........................ 4-67
4.4 Especificacin de Variables ................................................ 4-68
4.4.1 Seleccin de Variables................................................................. 4-68
4.4.2 Variables Omitidas ....................................................................... 4-69
4.4.3 Variables Superfluas ..................................................................... 4-71
(CT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
iv
4.5 Contraste de Subespecificacin de Modelos (Test J) ....... 4-72
5 TEMAS ESPECFICOS ...................................................... 5-74
5.1 Ortogonalidad ..................................................................... 5-74
5.2 Multicolinealidad ................................................................. 5-76
5.2.1 Definicin de Multicolinealidad .................................................. 5-76
5.2.2 Causas de la Multicolinealidad................................................... 5-77
5.2.3 Efectos de la Multicolinealidad ................................................... 5-77
5.2.4 Deteccin de la Multicolinealidad y su Magnitud ..................... 5-84
5.2.5 Correccin de la Multicolinealidad ............................................ 5-87
5.2.6 Mtodo de Componentes Principales ......................................... 5-88
5.2.7 Regresin Crestra (Ridge Regression)......................................... 5-94
5.3 Heterocedasticidad ............................................................. 5-97
5.3.1 Definicin de Heterocedasticidad ............................................... 5-97
5.3.2 Causas de la Heterocedasticidad ............................................... 5-99
5.3.3 Efectos de la Heterocedasticidad .............................................. 5-101
5.3.4 Deteccin de la Heterocedasticidad......................................... 5-104
5.3.5 Correccin de la Heterocedasticidad ....................................... 5-111
5.4 Autocorrelacin ................................................................. 5-114
5.4.1 Definicin de Autocorrelacin ................................................... 5-114
5.4.2 Causas de la Autocorrelacin ................................................... 5-115
5.4.3 Efectos de la Autocorrelacin .................................................... 5-116
5.4.4 Deteccin de la Autocorrelacin ............................................... 5-118
5.4.5 Estimacin bajo Autocorrelacin ............................................... 5-122
5.5 Asimetra, Curtosis y Normalidad .................................... 5-124
5.5.1 Asimetra ...................................................................................... 5-124
5.5.2 Curtosis ........................................................................................ 5-125
5.5.3 Estadstico Jarque-Bera de Normalidad ................................... 5-125
5.6 Contrastes de Datos Atpicos ............................................ 5-126
6 INTRODUCCIN A LAS SERIES DE TIEMPO ............... 6-128
6.1 Extrapolacin de Series de Tiempo ................................. 6-128
6.1.1 Modelos de Extrapolacin Simple ............................................ 6-128
6.1.2 Modelos de Promedio Mvil ..................................................... 6-129
ICT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
v
6.2 Suavizamiento de Series de Tiempo ................................ 6-130
6.3 Estimacin y Pronstico de Modelos de Tendencia ....... 6-131
6.4 Procesos Estocsticos ........................................................ 6-131
6.5 Estacionariedad ................................................................. 6-132
6.5.1 Estacionariedad Estricta ............................................................. 6-132
6.5.2 Estacionariedad Dbil ................................................................ 6-133
6.5.3 Funcin de Autocorrelacin Simple (FAS) ................................ 6-134
6.5.4 Funcin de Autocorrelacin Parcial (FAP) ................................ 6-136
6.5.5 Proceso Ruido Blanco ................................................................ 6-137
6.6 Ergodicidad ........................................................................ 6-139
6.7 Teorema de Wold ............................................................. 6-140
6.8 Retardos y Diferencias....................................................... 6-141
6.8.1 Operador de Retardos ............................................................... 6-141
6.8.2 Operador de Diferencias ........................................................... 6-142
6.9 Ecuaciones de Diferencias ................................................ 6-142
6.9.1 Definicin .................................................................................... 6-142
6.9.2 Solucin Recursiva ...................................................................... 6-143
6.9.3 Solucin Analtica ....................................................................... 6-143
6.10 Crculo Unitario .................................................................. 6-150
7 PROCESOS MEDIA MVIL ............................................ 7-153
7.1 Procesos MA(1) ................................................................. 7-153
7.2 Procesos MA(2) ................................................................. 7-156
7.3 Procesos MA(q) ................................................................. 7-157
7.4 Invertibilidad de los Procesos MA(q) ............................... 7-158
7.5 Estimacin de Procesos MA(q) ......................................... 7-159
7.6 Pronsticos con Procesos MA(q) ...................................... 7-162
8 PROCESOS AUTORREGRESIVOS ..................................... 8-166
8.1 Procesos AR(1) .................................................................. 8-166
8.1.1 Media .......................................................................................... 8-166
8.1.2 Varianza ...................................................................................... 8-167
8.1.3 Autocovarianza .......................................................................... 8-167
8.1.4 Autocorrelacin .......................................................................... 8-168
(CT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
vi
8.2 Procesos AR(2) .................................................................. 8-171
8.2.1 Media .......................................................................................... 8-171
8.2.2 Varianza ...................................................................................... 8-171
8.2.3 Autocovarianza .......................................................................... 8-172
8.2.4 Autocorrelacin .......................................................................... 8-172
8.3 Procesos AR(p) ................................................................... 8-174
8.4 Estimacin de Procesos AR(p) .......................................... 8-177
8.5 Pronsticos con Procesos AR(p) ....................................... 8-177
8.6 Regla de la Cadena Para Pronosticar AR(p) ................... 8-179
8.7 Dualidad entre Procesos AR y MA ................................... 8-180
8.8 Procesos ARMA(p,q) ......................................................... 8-181
8.9 Pronsticos de Modelos ARMA(p,q) ............................... 8-183
8.10 Procesos ARIMA(p,i,q) ...................................................... 8-185 8.11 Procesos Estacionales ........................................................ 8-186
8.11.1 Estacionalidad Mediante Variables Dicotmicas .................... 8-187
8.11.2 Procesos Autorregresivos Estacionales ..................................... 8-188
8.11.3 Estacionariedad del AR(p) Estacional ....................................... 8-188
8.11.4 Procesos Medias Mviles Estacionales .................................... 8-189
8.11.5 Identificacin de s....................................................................... 8-190
9 PROCESOS ESTOCSTICOS NO ESTACIONARIOS ............... 9-191
9.1 Paseo Aleatorio ................................................................. 9-191
9.2 Procesos ARIMA ................................................................ 9-195
9.2.1 Identificacin de Procesos ARIMA ............................................ 9-196
9.2.2 Estimacin de Procesos ARIMA ................................................. 9-200
9.2.3 Inicializacin de la Serie ............................................................ 9-201
9.2.4 Validacin de Procesos ARIMA ................................................ 9-203
9.2.5 Prediccin con Procesos ARIMA ............................................... 9-209
9.3 Orden de Integracin de una Serie: Mtodos No Paramtricos ....................................................................... 9-213
9.3.1 Anlisis de la Funcin de Autocorrelacin ............................... 9-213
9.3.2 Sobrediferenciacin ................................................................... 9-215
9.3.3 Anlisis de la Varianza .............................................................. 9-216
ICT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
vii
10 RACES UNITARIAS Y COINTEGRACIN ................. 10-217
10.1 Tendencias Determinsticas y Estocsticas .................... 10-218
10.1.1 Tendencia Determinstica ........................................................ 10-218
10.1.2 Tendencia Estocstica ............................................................. 10-219
10.2 Regresin Espuria ........................................................... 10-222
10.3 Deteccin de Races Unitarias ....................................... 10-224
10.3.1 Anlisis Grfico de la Serie .................................................... 10-224
10.3.2 Anlisis del Correlograma Simple de la Serie ...................... 10-225
10.3.3 Utilizacin del Estadstico de Durbin - Watson ..................... 10-227
10.4 Contraste de Estacionariedad y de Raz Unitaria ........ 10-228
10.4.1 Contraste de Dickey Fuller (DF) .......................................... 10-228
10.4.2 Contraste de Dickey Fuller Aumentado (DFA) ................... 10-234
10.4.3 Contraste de Phillips Perron (PP) ......................................... 10-235
10.5 Cointegracin ................................................................. 10-236
10.6 Deteccin de Cointegracin .......................................... 10-238
10.6.1 Engle y Granger ...................................................................... 10-238
10.6.2 Durbin y Watson ...................................................................... 10-239
10.6.3 Modelo de Correccin de Errores (MCE) ............................. 10-239
10.7 Causalidad ...................................................................... 10-241
11 ANLISIS FACTORIAL ................................................ 11-242
11.1 Comparacin Entre FA y MCP ...................................... 11-246
11.2 El Modelo de Anlisis Factorial ..................................... 11-246
11.2.1 Hiptesis del FA ....................................................................... 11-246
11.2.2 Forma Matricial del FA ........................................................... 11-247
11.3 Ecuaciones del FA .......................................................... 11-248
11.3.1 No Unicidad de los Factores .................................................. 11-249
11.3.2 Normalizacin del Modelo Factorial .................................... 11-249
11.4 Resolucin de las Ecuaciones del FA ............................ 11-250
11.4.1 Nmero de Factores ................................................................ 11-250
11.4.2 Mtodo del Factor Principal ................................................... 11-251
11.5 Determinacin de la Cantidad Apropiada de Factores ......11-256
11.5.1 Criterios Subjetivos .................................................................. 11-257
(CT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
viii
11.5.2 Criterios Objetivos ................................................................... 11-257
11.6 Rotacin de Factores ...................................................... 11-258
11.6.1 Rotacin VARIMAX ................................................................. 11-260
11.6.2 Rotacin Oblicua ..................................................................... 11-261
11.7 Cuantificacin de Factores ............................................ 11-262
11.7.1 Mtodo de Barlett ................................................................... 11-263
11.7.2 Mtodo de Thompson ............................................................. 11-263
11.7.3 Otros Mtodos ......................................................................... 11-264
12 ANLISIS DE CONGLOMERADOS (CLUSTER) ................. 12-265
12.1 Medidas de Semejanza y Desemejanza ...................... 12-265
12.1.1 Distancia Mtrica ..................................................................... 12-265
12.1.2 Distancia de Mahalanobis ...................................................... 12-265
12.2 Anlisis Grficos ............................................................. 12-266
12.2.1 Grficos de Dispersin (Bidimensionales) ............................. 12-266
12.2.2 Grficos de Dispersin (Tridimensionales) ............................ 12-267
12.2.3 Grficos de Andrews .............................................................. 12-268
12.2.4 Grficos de Estrellas ................................................................ 12-270
12.2.5 Grficos de Caras de Chernoff .............................................. 12-273
12.3 Mtodos de Agrupacin ................................................ 12-274
12.3.1 Mtodo del Vecino Ms Cercano ......................................... 12-274
12.3.2 Diagrama de rbol ................................................................. 12-277
12.3.3 Estadstico F de Beale ............................................................. 12-280
12.4 Reduccin de la Escala Multidimensional .................... 12-281
ICT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
1-1
1 REPASO DE MATRICES Y ANLISIS DE DATOS
1.1 Operaciones con Matrices
Sea la matriz
11 12 1
21 22 2
1 2
....
.... ....
....
n
n
m m mn
a a a
a a aA
a a a
=
donde
11 21 1
12 22 2
1 2
....
.... ....
....
m
mT
n n mn
a a a
a a aA
a a a
=
.
1.1.1 Matrices Especiales
D = diag(A) es la diagonal de la matriz A de dimensin n x n:
11
22
0 .... 00 0.... ....
0 0 ....
T
nn
a
aD D
a
= =
(1.1)
T se denomina triangular superior de la matriz A:
11 12 1
22 2
....
0.... ....
0 0 ....
n
n
mn
a a a
a aT
a
=
(1.2)
In se denomina matriz identidad de dimensin n x n:
1 0 .... 00 1 0.... ....
0 0 .... 1
I
=
(1.3)
(CT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
1-2
1.1.2 Suma
C A B= es definido como ij ij ijc a b= dado que A y B tienen el mismo nmero de filas y de columnas. Es fcil demostrar que: ( ) ( )A B C A B C = y tambin que A B B A+ = + .
1.1.3 Multiplicacin
C A B= es definido como ( )1
n
ij ik kjk
c a b=
= dado que A y B son matrices
conformables, es decir, A es de r x n y B e de n x p. Debe notarse que:
A B y B A no son necesariamente iguales.
Se cumple que ( )A B C A B A C =
En general, A B B A
Dos vectores a A y b B son ortogonales ( )a b si ( )1
0n
Ti i
ia b a b
=
= =
( )1 2 21
nT
ii
a a a a=
= =
Si A A A = se dice que A es idempotente, y en general ( ) , 1pA A p= > .
1.1.4 Operador de Kronecker
Si A es de m x n y B e de s x t, el operador de Kronecker de A y B, denotado por A B , es una matriz de ms x nt dada por:
11 12 1
21 22 2
1 2
....
.... ....
....
n
n
n n mn
a B a B a Ba B a B a B
A B
a B a B a B
=
(1.4)
Se cumplen las siguientes propiedades:
ICT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
1-3
( ) ( ) ( )A B C D AC BD = ( ) ( ) ( ) ( ) ( ) ( )A B C D A C A D B C B D+ + = + + + ( ) ( )A B C A B C =
1.1.5 Matrices Particionadas
La matriz A de m x n puede ser particionada en 4 sub-matrices de la forma:
11 12
21 22
A AA
A A
=
(1.5)
Luego, si B es tambin particionada se puede obtener la siguiente expresin:
11 12 11 12 11 11 12 21 11 12 12 22
21 22 21 22 21 11 22 21 21 12 22 22
A A B B A B A B A B A BA B
A A B B A B A B A B A B+ +
= = + + (1.6)
1.1.6 Matriz Inversa
Dada la matriz A de n x n, si existe una matriz B que satisface AB = BA = In, esta matriz B se denomina inversa de A, y se denota 1B A= . Se cumplen las siguientes propiedades:
( ) 1 1 1AB B A =
( ) ( ) 11 1 1 1 1A B A A B B + = +
1.1.7 Matriz Traspuesta
Se cumplen las siguientes propiedades:
( )TTA A= ( )T T TA B A B =
(CT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
1-4
( )T T TA B B A =
( ) ( ) 11 T TA A = Si TA A= se dice que A es simtrica
TA A y TA A son simtricas
( ) ( )T T TA B A B =
1.1.8 Traza de una Matriz
La traza de una matriz cuadrada conformable A de n x n se define como la
suma de los elementos de su diagonal: ( )1
n
iii
tr A a=
= . Debe notarse que:
( ) ( )Ttr A tr A= ( ) ( ) ( )tr A B tr A tr B = ( ) ( )tr A B tr B A = ( ) ( )tr k A k tr A = ( ) ( ) ( )tr A B tr A tr B =
Debe notarse que para un producto de matrices cuyo resultado
es un escalar, dicho valor tambin corresponde a la traza del producto
original de las matrices. Es decir, el valor de un escalar es igual a su traza.
ICT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
1-5
1.1.9 Matrices Ortogonales
Las matrices ortogonales son matrices cuadradas que pueden representar un
giro en el espacio respecto a un plano (o hiperplano). Para caracterizar estas matrices,
supongamos que, dado un vector X, lo ponderamos por una matriz no singular C, y obtenemos un nuevo vector Y:
Y C X= (1.7)
Si la operacin realizada es slo un giro, entonces el mdulo o norma de Y debe ser idntica a la de X, y por lo tanto se cumple:
T T T TY Y X C CX X X= = (1.8)
Por lo tanto, debe cumplirse que:
TC C I= (1.9)
La condicin de ortogonalidad es la que se obtiene de (1.9), de donde se
deduce que la matriza traspuesta debe ser igual a su inversa:
1TC C= (1.10)
Luego, una matriz ortogonal debe tener filas (o columnas) que
son ortogonales entre s, y de longitud igual a la unidad.
1.1.10 Vectores Caractersticos y Valores Propios
Dada una matriz cuadrada, existen determinadas propiedades de dicha
matriz que son invariantes ante transformaciones lineales de dicha matriz de tal forma que
se mantiene la informacin existente en la matriz. Algunos ejemplos pueden ser trasponer la
matriz o girarla.
Los valores propios son las medidas bsicas de tamao de una matriz. Dichas
medidas bsicas, como la traza o el determinante, son funcin de los valores propios, y
sern por lo tanto invariantes ante transformaciones lineales que preserven los valores
propios.
(CT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
1-6
Llamaremos vectores propios de una matriz cuadrada de orden n a aquellos
vectores cuya direccin no se modifica al aplicar una transformacin lineal a la matriz. Sea
A una matriz de n x n. Existe entonces un vector propio c que satisface:
A c c = (1.11)
para determinados valores constantes de , que es un escalar, y que se denomina valor propio.
Si c es un vector propio de A, y si multiplicamos (1.11) por cualquier 0 ,
entonces c tambin ser un vector propio de A. Para evitar esta indeterminacin,
supondremos que 1c = .
Luego, existe una solucin no nula (para 0c ) que verifica:
det 0A I = (1.12)
La expresin (1.12) es un sistema de ecuaciones lineal homogneo que tiene una solucin no nula slo si la matriz ( )A I es no singular. El polinomio que se obtiene de (1.12) en funcin de se denomina ecuacin caracterstica.
Las soluciones de (1.11) son los vectores caractersticos, y los distintos valores
de en (1.12) son las races caractersticas, que son nmero reales si la matriz es simtrica. En general, una matriz tiene h n valores propios. A cada valor propio de la matriz podemos asignarle un nico vector propio que satisface (1.11).
Debe destacarse que:
Si es un valor propio de A, entonces r es un valor propio de rA
Los valores propios de una matriz y su traspuesta son los mismos
( )1
n
ii
tr A =
=
( )1
nr r
ii
tr A =
=
( )1 11
n
ii
tr A =
=
ICT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
1-7
1
n
ii
A =
= Los vectores caractersticos de una matriz simtrica son ortogonales
Las matrices A y (A + I) tienen los mismos vectores propios, y si es un valor propio de A, + 1 es un valor propio de (A + I)
Las matrices ABC, ACB y CAB tienen los mismos valores propios no nulos
Si A es triangular, los valores propios son los elementos de la diagonal
En una matriz simtrica, los valores propios son nmeros reales y los vectores son
ortogonales
1.1.11 Rango de una Matriz
Supongamos una matriz A de m x n con m filas ( )1 2, ,...., ma a a . El rango de la matriz A corresponde al nmero de filas linealmente independientes. Si el rango es m, se dice que la matriz es de rango completo.
( ) ( ) ( )T Trango A rango A rango A A= = ( ) ( ) ( ){ }min ;rango A B rango A rango B El rango tambin corresponde al nmero de races caractersticas distintas de cero
en ( )TA A . Si la matriz es simtrica, corresponde al nmero de races caractersticas distintas de cero en A.
1.1.12 Formas Cuadrticas de una Matriz
Sea una matriz A de n x n simtrica, y ( )1 2, ,...., nx x x x= un vector. Entonces la expresin ( )
1 1
n nT
i j iji j
q x Ax x x a= =
= = se denomina forma cuadrtica, que es un
polinomio de segundo grado en x.
Si 0Tx Ax > entonces A es definida positiva.
Si 0Tx Ax < entonces A es definida negativa.
(CT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
1-8
Si 0Tx Ax entonces A es semi-definida positiva.
Si 0Tx Ax entonces A es semi-definida negativa.
1.1.13 Diferenciacin de Matrices
Sea una matriz X de n x m con elementos ijx , y ( )f f X= una funcin que depende de los elementos de X. Entonces:
ij
df dfdX dx
=
(1.13)
Como ejemplo, supongamos que 1 2 35 2 3f X X X= + + . Luego:
523
dfdX
=
(1.14)
Adems, es fcil obtener los siguientes resultados:
( )Td X
Xd
= , ( )Td XdX =
Si X simtrica entonces ( )
2Td X
Xd
=
Si ( ) Tf X a Xb= entonces Tdf b adX
=
Si ( ) ( )f X A X B= entonces T Tdf A BdX
=
Si X es de n x n y ( ) ( )f X X= entonces ndf IdX =
Si X es de n x n y ( ) ( )Tf X X AX= entonces ( )Tdf A A XdX = + Definiendo ( ) ( ) ( )( )1 2; ;.......;T nY f X f X f X= , entonces:
ICT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
1-9
1 2
1 1 1
1 21 2
2 2 2
1 2
.....
.....
; ;......;
.....
n
n
n
n
n n n
dfdf dfdx dx dx
dfdf dfdfdf dfdY dx dx dx
dX dX dX dX
dfdf dfdx dx dx
= =
Si Y AX= entonces TdY AdX
=
1.1.14 Series de Taylor
Para una funcin vectorial ( )f f x= la expansin en series de Taylor es la siguiente:
( ) ( ) ( ) ( ) ( ) ( ) ( )2
0 0 00 0 0 ....2
Tf x x x x xf x f x f x x x + + +
(1.15)
( ) 0 1 2 ......Tf x x x x + + + (1.16)
1.2 Anlisis de Datos
En general, consideraremos un total de n datos u observaciones o unidades
experimentales, y un total de p variables. Es decir, cada una de las n observaciones considera p variables. Esta informacin puede ser representada como una matriz de p x n.
11 12 1
21 22 2
1 2
....
.... ....
....
p
p
n n np
x x x
x x xX
x x x
=
(1.17)
(CT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
1-10
1.2.1 Tipos de Variables
Las variables pueden ser bsicamente de dos tipos: cuantitativas o
cualitativas. Las cuantitativas se caracterizan porque su valor puede ser expresado
numricamente, como por ejemplo la edad de una persona, su peso, la poblacin de un
pas, el ingreso monetario de un individuo, etc. Las variables cualitativas se caracterizan
porque su valor corresponde a un atributo o categora, como por ejemplo el sexo, su pas
de nacimiento, temporada del ao, etc.
Las variables cuantitativas pueden a su vez en continuas o discretas. Las
variables cualitativas por su parte pueden clasificarse en binarias (slo 2 valores) o
mltiples (muchos valores).
1.2.2 Media, Varianza, Covarianza y Correlacin
Estas variables representan un resumen de la informacin existente en los
datos. En trminos probabilsticos, estas variables estn asociadas a los momentos de la
funcin de densidad.
Para una determinada variable k en particular, su media se representa como:
1
1 nk ik
ix x
n=
= (1.18)
La varianza de esta variable k est relacionada conceptualmente con la distorsin promedio de cada observacin de la variable respecto a la media de dicha
variable, y se expresa de la siguiente forma:
( ) ( )21
11
n
k ik ki
V x x xn
=
=
(1.19)
Por otra parte, el grado de relacin lineal entre dos variables se mide por la covarianza. La covarianza entre las variables kx y jx se calcula como:
( ) ( ) ( )1
1cov ,
1
n
k j ik k ij ji
x x x x x xn
=
=
(1.20)
ICT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
1-11
Notar que la covarianza puede ser positiva o negativa. El signo de la covarianza indica el signo de la variancin conjunta de las variables kx y jx . Su magnitud,
sin embargo, depende de la escala en que fueron medidas las variables.
A partir de las expresiones obtenidas de (1.20), se puede generar la matriz de
varianzas y covarianzas del conjunto de datos X. En la diagonal irn los trminos asociados a la varianza de cada una de las p variables, y fuera de la diagonal irn los trminos asociados a la covarianza entre las distintas variables. Luego, la matriz de
varianzas y covarianzas es de (p x p).
Una caracterstica importante de la matriz de varianzas y covarianzas es que
es siempre simtrica y positiva-definida (excepto que existan filas columnas
dependientes).
La simetra se debe a que ( ) ( )cov , cov ,k j j kx x x x= ; lo de positiva definida es una extensin del hecho que la varianza es siempre positiva por definicin, ya que es una
suma de elementos al cuadrado.
Adicionalmente, la traza, el determinante y los valores propios
de la matriz de varianzas y covarianzas son siempre no negativos.
Como se mencion anteriormente, la magnitud de las varianzas y covarianzas depende de la escala en que se han medido las variables kx y jx . Ello implica que valores
altos de la covarianza no implica necesariamente altos grados de relacin lineal entre las
variables. Anlogamente, valores bajos no implica ausencia de relacin entre ellas.
Una alternativa que mitiga este problema es la matriz de correlaciones, que se
obtiene de la siguiente expresin:
( )( ) ( )cov ,k j
kjk j
x xr
V x V x=
(1.21)
Las propiedades de la metriz de correlaciones son las mismas que las de la
matriz de varianzas y covarianzas: simtrica, semidefinida positiva, y con traza,
determinante y valores propios no nulos. Sin embargo, los valores de la matriz de
correlaciones van entre 1 y 1, y los elementos de la diagonal son siempre 1.
(CT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
1-12
1.2.3 Medidas de Dependencia Lineal de los Datos
Interesa analizar la estructura de dependencia entre las variables. Estas
dependencias pueden estudiarse como:
Dependencia entre pares de variables (correlacin)
Dependencia entre pares de variables pero eliminando el efecto del resto
(correlacin parcial)
Dependencia entre una variable y un conjunto de variables (regresin
lineal mltiple)
1.2.4 Datos Atpicos (Outliers)
a) Definicin
Datos atpicos o Outliers son aquellas observaciones que al parecer han sido
generados de manera distinta al resto de los datos. Pueden ser causados por ejemplo por
errores de medicin o digitacin de los datos, cambios en los instrumentos de medicin o
simplemente representan una heterogeneidad intrnseca de los elementos observados.
La caracterizacin de un nico dato atpico es simple, ya que por definicin
debe estar alejado del resto. Luego, la distancia entre dicha observacin y el resto debe ser
alta. Alternativamente, podemos definir como dato atpico aquella observacin que se
encuentra alejada del centro o de la media de los datos.
Una observacin puede considerarse atpica si la distancia mtrica entre dicha
observacin y la media de los datos es grande:
( ) ( ) ( ) 1 2, Ti i id x x x x x x = (1.22)
Para identificar las observaciones atpicas, podramos construir un histograma
de estas distancias y determinar si existen puntos muy alejados respecto a los dems.
ICT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
1-13
Sin embargo, esta medida de distancia no es correcta cuando existe
dependencia entre observaciones (relacin lineal). Ello se debe a que la distancia
euclidiana no considera la estructura de correlaciones entre los datos; una alternativa es
estandarizar previamente los datos en forma multivariante. La estandarizacin tpicamente
utilizada es la siguiente:
( )ki k
kik
x xz
V x
= (1.23)
Luego, se puede construir la distancia euclidiana pero con las variables
estandarizadas:
( ) ( ) ( ) 1 2, Ti i id z z z z z z = (1.24)
b) Efectos de los Datos Atpicos
Las consecuencias incluso de una nica observacin atpica pueden ser
graves: distorsionar las medias y desviaciones tpicas de las variables y destruir eventuales
relaciones existentes entre ellas.
Consideremos que tenemos una muestra de tamao n con observaciones de
un vector p-dimensional x. Supongamos ahora que introducimos una observacin atpica a, que corresponde tambin a un vector de p variables. Sea x el vector de medias de las p variables y V la matriz de varianzas y covarianzas sin el dato atpico; sea ax el vector de
medias de las p variables y Va la matriz de varianzas y covarianzas con el dato atpico. Se comprueba fcilmente que:
1aa x
x xn
= + +
(1.25)
( )( )1 1 1
T
a
a x a xn nV Vn n n
= + + + + (1.26)
Las expresiones anteriores indican que un solo dato atpico puede afectar de
manera importante el vector de medias y la matriz de varianzas y covarianzas.
(CT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
1-14
El efecto del dato atpico depende, adems de su magnitud, de su ubicacin,
particularmente la matriz de varianzas y covarianzas.
c) Identificacin de Datos Atpicos
Una regla simple y automtica para detectar datos atpicos es la siguiente:
( )( ) 4,5 1,2,....,
ki k
k
x mediana x k p
MEDA x
> = (1.27)
MEDA (xk) es la mediana de las desviaciones absolutas ( )ki kx mediana x , que es una medida robusta de las dispersin.
Por otra parte, si el nmero de datos no es muy grande, los diagramas de
dispersin pueden ayudar a detectar datos atpicos.
Otra alternativa corresponde a escoger el intervalo que albergue a un
88,88% de las observaciones. El intervalo ser el siguiente:
( ) ( )( ); 1,2,....,k k k kx V x x V x k p + = (1.28) Se suele considerar = 3. Esta expresin proviene de la desigualdad de
Chebychev, ya que en el intervalo definido se encuentra una proporcin 211 de las
observaciones. Si = 4, se albergan el 93,5% de las observaciones.
ICT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
2-15
2 REGRESIN LINEAL MLTIPLE
La econometra es la aplicacin de mtodos estadsticos y matemticos al
anlisis de datos, generalmente econmicos, biolgicos y sociolgicos, a fin de otorgar un
contenido emprico sobre diferentes teoras, y as verificarlas o refutarlas.
El modelo de regresin lineal es el nico escenario en econometra en el que
es factible contrastar fehacientemente la capacidad de prediccin de los modelos
ajustados, mediante la aplicacin de diversos test especficos. Otros modelos
economtricos, como por ejemplo modelos de eleccin discreta (Logit, Probit) o de variable
dependiente limitada (Tobit, Seleccin Muestral), si bien pueden estimarse mediante
tcnicas economtricas, no existe un indicador de bondad de ajuste tan preciso como en el
caso de la regresin lineal.
Mediante un modelo de regresin lineal mltiple (RLM) tratamos de explicar el
comportamiento de una determinada variable, que denominaremos variable a explicar,
variable endgena o variable dependiente, (y representaremos con la letra Y) en funcin de un conjunto de k variables explicativas 1 2, ,...., kx x x mediante una relacin de
dependencia.
( );Y f X = + (2.1)
En el caso del modelo de RLM, la forma funcional es la siguiente:
Y X = + (2.2)
1
2
....
n
yy
Y
y
=
,
0
1
....
k
=
,
11 12 1
21 22 2
1 2
1 ....1 ........
1 ....
k
k
n n nk
x x x
x x xX
x x x
=
,
1
2
....
n
=
Y es el vector de variables dependientes (n x 1)
es el vector de parmetros o coeficientes de calibracin (k + 1 x 1). Normalmente, se considera que hay k variables explicativas ms un tmino constante o intercepto (representado por la columna de unos en la matriz X).
(CT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
2-16
X es la matriz de variables independientes o explicativas; observaciones conocidas que incluye una columna con unos (n x k +1). Tambin se les denomina regresores.
es el vector de errores o residuos no observados (n x 1); tambin se le denomina
perturbacin, trmino aleatorio o estocstico (para el caso de series de tiempo).
Los parmetros miden la intensidad media de los efectos de las variables explicativas sobre la variable a explicar y se obtienen al tomar las derivadas parciales de
la variable a explicar respecto a cada una de as variables explicativas: jj
Yx
=
.
El error , por su parte, aparece por varias razones. Las tres principales
razones son las siguientes:
i. Muchas veces no es posible captar la totalidad de variables que explican un
determinado fenmeno. Es decir, se omiten algunas variables que pueden ser
ms o menos relevantes en la especificacin del modelo. Esto implica que la
naturaleza de la relacin econmica no est correctamente especificada.
Evidentemente se espera que en un modelo se especifiquen todas las
variables relevantes. Sin embargo, muchas de las variables omitidas pueden
incluso tener una influencia suave o irregular, por lo que la perturbacin
busca representar la influencia neta de la suma de un gran nmero de
variables de tamaos y efectos independientes.
ii. Mediciones con Error de las variables explicativas o en la variable explicada.
Muchas veces no es posible obtener un valor preciso para las variables que
se desea estudiar o incorporar en los modelos. Por ejemplo, cuando se miden
tiempos de viaje en transporte pblico o consumo de combustible de los
automviles. Sin embargo, y como veremos ms adelante, si las variables
explicativas son medidas con error, se obtienen estimaciones sesgadas en la
regresin lineal, y si la variable explicada es medida con error, se produce
ineficiencia en la estimacin (aumento de la varianza).
iii. Indeterminacin humana, es decir, las personas o individuos se comportan de
manera diferente frente a los mismos estmulos. Elerror busca por lo tanto
representar esta aleatoriedad inherente al comportamiento humano.
ICT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
2-17
2.1 Supuestos del Modelo
Trataremos de estimar el modelo de manera que, los valores ajustados de la
variable endgena o explicada, resulten tan prximos a los valores realmente observados
como sea posible. Debe notarse que el modelo corresponde a una esperanza
condicionada:
( )/E Y X X = (2.3)
A fin de poder determinar las propiedades de los estimadores obtenidos al
aplicar distintos mtodos de estimacin y realizar diferentes contrastes, hemos de
especificar un conjunto de supuestos sobre la RLM que hemos formulado. Existen tres
grupos de supuestos: los supuestos sobre el trmino de perturbacin, los supuestos
sobre las variables explicativas, y los supuestos sobre los parmetros del modelo.
2.1.1 Supuestos Sobre la Perturbacin
Valor esperado de la perturbacin es cero: ( ) 0jE , j = . Homocedasticidad: todos los trminos de perturbacin tienen la misma varianza
(varianza constante): ( ) ( ) 2i jV V = , i j = . Por tanto, todos los trminos de la diagonal principal de la matriz de varianzas y covarianzas sern iguales.
No Autocorrelacin: los errores son independientes unos de otros, por lo que la
matriz de varianzas y covarianzas es una matriz diagonal (fuera de la diagonal
principal todo son ceros): ( ), 0i jE , i j = . Luego, considerando las hiptesis de homocedasticidad y ausencia de autocorrelacin, la matriz de varianzas y
covarianzas tiene la siguiente estructura:
( )2
22
2
00 0 ....00 0 ............
0 0 0 ....
V I
= =
(2.4)
La perturbacin o error presenta una distribucin normal: ( )0; 2N I .
(CT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
2-18
En sntesis, en un modelo bueno el error es impronosticable.
2.1.2 Supuestos sobre las Variables Explicativas
Las variables explicativas son fijas o determinsticas.
Las variables explicativas no estn correlacionadas con el trmino de error o perturbacin: ( ), 0i iE x , i = .
Las variables explicativas no presentan relacin lineal exacta entre si (no existe
multicolinelidad perfecta).
Las variables explicativas son medidas sin error.
En el modelo no se excluyen las variables relevantes y tampoco se incluyen las
variables irrelevantes, a la hora de explicar el comportamiento de la variable
endgena.
2.1.3 Supuestos sobre los Parmetros del Modelo
La nica hiptesis que haremos acerca de los parmetros del modelo es la hiptesis de permanencia estructural, lo que significa que los parmetros poblacionales j j se mantienen constantes a lo largo de toda la muestra.
2.2 Estimacin por Mnimos Cuadrados Ordinarios (MCO)
Esl mtodo de estimacin de modelos de regresin lineal ms famoso en el
mundo entero para efectuar investigacin emprica es el de mnimos cuadrados ordinarios
(MCO). Este mtodo intenta obtener estimadores de los parmetros de tal forma que la
variable predicha Y se parezca lo ms posible a la variable observada (Y), es decir, se musca minimizar la diferencia ( )Y Y . Sin embargo, no basta slo con minimizar esta diferencia, como se observa en la siguiente Figura:
ICT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
2-19
Figura 2.1
Ajuste Segn Minimizacin del Error
En la Figura 2.1 se observa claramente que si el criterio de ajuste fuera
simplemente minimizar los la diferencia entre los valores observados de las Y (puntos) y los
valores modelados (lnea recta azul), los dos conjuntos de datos representados por los
puntos negros y rojos tendran el mismo ajuste. Evidentemente, es mejor el ajuste de los
puntos rojos. Por lo tanto, minimizar las diferencias entre valores observados y modelados
no es un buen criterio.
Una segunda alternativa podra se minimizar el valor absoluto de las
diferencias entre los valores observados y modelados, mitigando el problema expuesto en
el prrafo anterior. Sin embargo, este segundo criterio tambin tiene sus detractores, como
se observa en la siguiente Figura:
(CT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
2-20
Figura 2.2
Ajuste Segn Minimizacin del Valor Absoluto del Error
En la Figura 2.2 se observa los puntos negros presentan tres casos en que el
ajuste es exacto y otros tres casos en que el ajuste es malo. En el caso de los puntos rojos,
se observa que el ajuste en todos los casos es relativamente bueno. Para muchos
modeladores, el ajuste de los puntos rojos es preferible al de los puntos negros. Sin
embargo, la opinin en este segundo caso es dividida, ya que en determinadas situaciones
puede ser preferible predecir exactamente un nmero pequeo de casos a cambio de fallar
groseramente en otros, en lugar de estar cerca en todos, pero sin apuntar exactamente a
ninguno. Suponga por ejemplo que usted tiene un modelo que predice los nmeros del
Loto; qu preferira usted si jugara 6 veces, apuntarle al total de los nmeros 3 veces y a
ningn nmero las otras tres veces, o fallar por poco las 6 veces. Evidentemente, en este
ejemplo es preferible el primer modelo.
Una tercera alternativa de criterio es minimizar el cuadrado de las diferencias
entre los valores observados y los modeloados. Esto permite, por una parte, penalizar los
errores y, por otra parte, castigar a aquellos puntos que se alejen mucho del valor
observado. Por lo tanto, este criterio penaliza ms fuertemente a aquellos errores grandes
en magnitud que aquellos errores pequeos. A este criterio se le denomina Mnimos
Cuadrados Ordinarios o simplemente MCO (los mnimos cuadrados generales, que es un
criterio adicional que otorga un peso relativo a cada observacn, se presenta en los
prximos Captulos).
ICT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
2-21
Sin embargo, la principal razn del xito de la estimacin por MCO no se
debe a la minimizacin de la suma de errores al cuadrado, ya que ello poco nos dice
respecto de la real capacidad explicativa de las variables. La razn de su xito se debe a
que sus resultados superan al de otros criterios (como los dos anteriores), y adems a su
gran simplicidad en trminos computacionales.
2.2.1 Vector de Parmetros
La estimacin de MCO se realiza con el criterio de minimizar los cuadrados
de los errores inducidos por el modelo poblacional. Luego, debe resolverse el siguiente
problema de optimizacin:
{ } ( ) ( )minT
T Q= Y X Y X
(2.5)
{ }min 0T T T T T T
Q Y Y X Y Y X X X = + = (2.6)
y dado que ( )T T TX X = se obtiene:
{ }min 2T T T T T
Q Y Y X Y X X = + (2.7)
2 2 0T T T TQ X Y X X X Y X X
= + = =
(2.8)
Si X tiene rango (k + 1) de la ecuacin normal (2.8) se obtiene entonces la siguiente solucin nica:
( ) 1 T TX X X Y = (2.9) Debe notarse que la expresin (2.9) corresponde a la razn entre la
covarianza de X e Y y la varianza de X. Si X tiene rango menor que (k + 1), es decir, existe dependencia lineal en las observaciones, de la ecuacin normal (2.8) deja de
obtenerse una nica solucin. Por otra parte, si X tiene rango mayor que (k + 1), el problema queda indeterminado (ms parmetros que ecuaciones).
(CT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
2-22
Por otra parte, la estimacin de la varianza de se obtiene de la siguiente manera:
( ) ( ) ( ) TV E = (2.10)
( )( ) ( ) ( ) ( ) ( )1 1 TT T T T TE E X X X X X X = (2.11) ( ) ( ) ( )( )1 1 T T T TV E X X X X X X = (2.12) ( ) ( ) ( )1 1 T T T TV X X E X X X X = (2.13) ( ) ( ) ( )1 1 T T T TV X X X E X X X = (2.14) ( ) ( ) ( ) ( )1 12 T T TV X X X I X X X = (2.15) ( ) ( ) 12 TV X X = (2.16) Sin embargo, es necesario un estimador de 2 . Es directo demostrar a partir
de (2.9) y (2.2) que:
( ) MY M X MX M M = = + = + = (2.17)
donde ( )( )1T TM I X X X X= es una matriz de n x n simtrica ( )TM M= e idempotente ( )TM M M= . Luego, de (2.17) se obtiene:
T T M = (2.18)
( ) ( ) / /T TE X E M X = (2.19) ( ) ( ) / /T TE tr X E tr M X = (2.20)
( ) ( )2 2/Ttr ME X tr M I tr M = = (2.21)
ICT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
2-23
( ) ( )( ) ( ) ( )( )1 12 2 2T T T Tntr M tr I X X X X tr I tr X X X X = = (2.22) ( ) ( ) ( )2 2n ktr I tr I n k = (2.23)
Por lo tanto se obtiene:
( ) ( )2 /TE X n k = (2.24)
( )2
T
n k
=
(2.25)
Finalmente, de (2.16) y de (2.25) resulta:
( ) ( ) ( )1
TTV X X
n k =
(2.26)
2.2.2 Aspectos Algebraicos y Propiedades de los Estimadores (Muestras Finitas y
Muestras Grandes)
i. El estimador MCO es insesgado y eficiente:
( ) ( )( )1 T TX X X X = + (2.27) ( ) ( ) ( ) ( )1 1 T T T TX X X X X X X = + (2.28)
( ) ( ) ( ) ( ) ( )1 1 T T T TX X X X X X = + = (2.29) ( ) ( ) ( )1 T TE E X X X = + (2.30) ( ) ( ) ( ) ( ) ( )1 1 T T T TE E X X X X X E X = + = + (2.31) ( ) ( ) ( ) ( )1 T TE X X E X E = + (2.32) ( )E = (2.33)
(CT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
2-24
Figura 2.3
Ilustracin del Sesgo en la Estimacin MCO de
SESGO
( )E = ( )E
Densidad
Estimador de
Para demostrar que presenta la mnima varianza:
( )( )1 T Tb X X X C Y CY= + = + (2.34) ( ) ( )( ) ( )1T TE b X X X C X I CX = + = + = (2.35) ( ) ( )( ) ( )( )1 1 TT T T T TV b E X X X C X X X C = + +
(2.36)
( ) ( )( ) ( ) ( )( )1 1 TT T T T TV b X X X C E X X X C = + + (2.37) ( ) ( )( ) ( )( )1 12 TT T T TV b X X X C I X X X C = + + (2.38) ( ) ( )( ) ( ) ( ) ( )12 2 T T TV b X X CC V CC V = + = + > (2.39)
( ) 12 ; TN X X (2.40)
ICT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
2-25
Figura 2.4
Ilustracin de la Eficiencia en la Estimacin MCO de
( )E =
Densidad
Estimador de
N = 300
N = 100
N = 30
N = 800
A partir de las dos Figuras anteriores surge la siguiente pregunta: qu es
preferible, un estimador insesgado o uno eficiente? Surge entonces el concepto de Error
Cuadrtico Medio (ECM):
( ) ( ) ( )2 ECM sesgo V = + (2.41) Tambin es posible dar un peso relativo al cuadrado del sesgo y a la
varianza, dependiendo lo que el modelador valore ms:
( ) ( ) ( ) ( )2 1ECMP sesgo V = + (2.42) La varianza mide la dispersin en torno a la media del parmetro estimado,
mientras que el ECM mide la dispersin en torno al verdadero parmetro poblacional. Si el
estimador es insesgado, ambos coiniciden. El concepto del ECM se aprecia en la siguiente
Figura:
(CT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
2-26
Figura 2.5
Ilustracin del Error Cuadrtico Medio (ECM) de
SESGO
( )E = ( )E
Densidad
Estimador de
ii. El estimador MCO es consistente: n
plim
= (sin sesgo ni varianza)
Figura 2.6
Ilustracin de la Consistencia en la Estimacin MCO de
( )E =
Densidad
Estimador de
ICT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
2-27
iii. Otras Propiedades:
El valor medio de los residuos es nulo, lo cual implica que la suma de los
residuos es igual a cero. Esta caracterstica es bastante trivial pues se deduce de la
misma metodologa de los mnimos cuadrados, la cual impone a travs de su primera
ecuacin normal que esta suma sea cero (columna de unos en matriz X).
Si el modelo de regresin posee una constante entonces la primera derivada parcial
del lagrangeano (ver (2.8)), o primera expresin de ecuacin normal, indicar que
la suma de los residuos muestrales es cero.
Sin embargo, si el modelo no posee una constante en su formulacin, esta condicin
no necesariamente se cumplir pues nunca surge como condicin necesaria de
primer orden al no tener nunca que derivar con respecto a este parmetro.
Puede sin embargo darse el caso que la representacin de los datos haga que este
parmetro sea efectivamente cero, por ejemplo si las series Y, X se entregan en forma de desviacin de sus propias medias, lo cual implicara que la suma de estos residuos
tambin lo ser (por construccin el intercepto es cero). De (2.8) se obtiene:
( )2 2 0 0T T T TX Y X X X Y X X + = = = (2.43) Los datos muestrales y modelados de Y tienen igual media. Esta
caracterstica se deduce de la nocin que el valor actual de la variable dependiente
se puede descomponer en lo que estima el modelo y el residuo. Una implicancia de
esta condicin es que la metodologa de los mnimos cuadrados hace que la recta de
regresin que pasa a travs de la nube de puntos pase justo por el punto que
representa a la media de X y la media de Y. Es decir, el hiperplano de la regresin pasa por el punto de las medias de los datos, puesto que la primera ecuacin normal implica Y X = .
La media de los valores estimados por la regresin es igual a la media de los valores actuales; ello se deduce de (2.8) ya que Y X = .
(CT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
2-28
Figura 2.7
Hiperplano de la Regresin y Medias de las Variables
Y
X
Y X =
Y
X
Los residuos no se correlacionan con la variable independiente (ver (2.43)).
Los residuos no se correlacionan con la variable dependiente estimada.
Todos los resultados anteriores requieren que la regresin tenga un trmino
constante.
2.2.3 Teorema Central del Lmite
Caso univariante: una sola muestra de tamao n con media y varianza 2 .
( ) 20;dnn x N (2.44)
Caso univariante con desigualdad de varianzas: varias muestra con medias i. y varianzas 2i .
ICT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
2-29
( ) 20;dn nn x N (2.45)
donde: ( )2 2 2 21 21 .... nn
= + + + y ( )1 21 ....n nn
= + + +
Caso multivariante: un vector de muestras de tamao n con media y matriz de varianzas y covarianzas Q.
( ) [ ]0;dnn X N Q (2.46) Caso multivariante con desigualdad de varianzas: varias muestra con
media i y matriz de varianzas y covarianzas iQ .
( ) [ ]0;dn nn X N Q (2.47) donde: ( )1 21lim .... n
nQ Q Q Q
n= + + + y ( )1 21 ....n n
n = + + +
.
Distribucin de una funcin ( )ng x :
( ) ( )( ) ( )2
20;d
n
gn g x g N
x
(2.48)
Lo anterior se obtiene de estimar la media y la varianza de las extensiones en Series de Taylor de la funcin ( )ng x :
( ) ( ) ( ) ( )n ngg x g xx
+
(2.49)
Para un conjunto de funciones, el resultados es:
( ) ( )( ) 0;d Tnn g x g N g Q g (2.50)
(CT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
2-30
2.2.4 Indicadores de Bondad de Ajuste
Lo qu se intenta es determinar objetivamente cun bueno es el modelo que se
ha ajustado:
porcion no explicadaporcion explicada
Y X = + (2.51)
( ) ( ) TTY Y X X = + + (2.52)
T T T TY Y X X = + (2.53)
1 1T T T T T T
T T T T
X X X XY Y Y Y Y Y Y Y
= + = (2.54)
2 1T
TR Y Y
= (2.55)
Una expresin anloga para R2 pero ms general es la siguiente:
( )( )
2
22
1i
i
ii
RY Y
=
(2.56)
Las expresiones (2.55) y (2.56) son idnticas entre s slo si la variable Y tiene media cero. La expresin (2.56) es la correlacin al cuadrado entre los valores observados
de Y y las predicciones calculadas por la ecuacin de regresin estimada Y . El valor de R2 indica el porcentaje de la varianza de Y que es explicada por las variables X. Dicho de otra forma, R2 mide el xito de la ecuacin de regresin, dentro de la muestra, para predecir Y.
Notar que el valor de R2 no guarda relacin con la calidad del estimador de , ya que uno puede tener una buen estimador de y un bajo R2 producto simplemente de una alta varianza del error. Por ora parte, es interesante notar que, en presencia del
intercepto (trmino constante de la regresin), el valor del R2 se ubica siempre entre 0 y 1.
ICT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
2-31
El uso del R2 debe ser cuidadoso, ya que depender de la escala de las variables explicativas y de la variable explicada; por ejemplo usar valores en niveles, en
logaritmos o en porcentajes para el mismo fenmeno entrega normalmente diferentes
valores de R2. tampoco es razonable comparar R2 entre distintas muestras.
Sin embargo, la utilizacin de (2.56) como indicador general de bondad de
ajuste, si bien es tericamente robusta, presenta algunos problemas, razn por la cual
muchos econometristas no le dan una gran importancia. El principal de ellos hace
referencia al nmero de grados de libertad utilizados en la estimacin de los parmetros.
De hecho, R2 nunca decrecer si se aaden nuevas variables a la ecuacin de regresin. Es relativamente trivial demostrar que al agregar una variable adicional (y su
respectivo parmetro) al modelo de regresin, se obtiene un nuevo R2 mayor o al menos igual que el original, incluso si la variable adicional es superflua (no aporta informacin).
No obstante, adicionar variables tiene un costo en trminos de grados de
libertad, lo que se traduce en una reduccin en la significancia de los parmetros de las
variables originales. Es por ello que se considera un valor ajustado como el siguiente:
( ) ( )( )( ) ( )
( ) ( )( )( )
2
2 2
2
11
1 1 1 11
1
ii
ii
n n k V R R
n k V YY Yn
= = =
(2.57)
La expresin (2.57) tiene la ventaja de que podra reducirse si se aade una
variable poco importante dentro del conjunto de variables explicativas. Incluso, este valor
ajustado podra ser negativo en algunos casos extremos, particularmente cuando el ajuste
es deficiente. En el lmite, si Y y X tienen un ajuste cercano a cero ( )2 0R , se tendra un valor de 2
1kRn k +
. Por otra parte, si hay ms de una variable explicativa, 2 2R R< .
Finalmente, un contraste de significancia de la regresin como un todo,
corresponde a analizar si la totalidad de los coeficientes, a excepcin del intercepto, son
distintos de cero. Si todas las pendientes son cero, el coeficiente de correlacin mltiple 2R tambin lo ser; luego, es posible basarse en el valor de 2R para contrastar esta hiptesis. El contraste es el siguiente:
(CT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
2-32
( ) ( )( )( )
2
1; 2 11k n kn kR
FkR
=
(2.58)
Valores grandes para la expresin (2.58) dan evidencia en contra de la
hiptesis nula (parmetros iguales a cero).
Debe considerarse que cualquier muestra que presente la misma
media y misma varianza, presentar por lo tanto los mismos valores
estimados para los parmetros (ver el cuarteto de Anscombe).
Figura 2.8
Cuarteto de Anscombe
0,00
2,00
4,00
6,00
8,00
10,00
12,00
0,0 2,0 4,0 6,0 8,0 10,0 12,0 14,0 16,0
Variable X
Varia
ble
Y
0,00
1,00
2,00
3,00
4,00
5,00
6,00
7,00
8,00
9,00
10,00
0,0 2,0 4,0 6,0 8,0 10,0 12,0 14,0 16,0
Variable X
Varia
ble
Y
0
2
4
6
8
10
12
14
0,0 2,0 4,0 6,0 8,0 10,0 12,0 14,0 16,0
Variable X
Varia
ble
Y
0,00
2,00
4,00
6,00
8,00
10,00
12,00
14,00
0,0 2,0 4,0 6,0 8,0 10,0 12,0 14,0 16,0 18,0 20,0
Variable X
Varia
ble
Y
ICT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
2-33
Figura 2.9
Estimacin del Cuarteto de Anscombe
1 0 0,50 3,00
se() 0,12 1,12R2-se(y) 0,67 1,24
F(k; n-k+1); (n-k) 17,99 9,00Var Mod; Var Error 27,51 13,76
t-student 4,24 2,67
2.2.5 MCO vs Mxima Verosimilitud
El mtodo de estimacin por MCO consiste en asignar valores numricos a los
parmetros desconocidos de manera que la suma cuadrtica de errores sea mnima y slo
requiere que la matriz TX X sea invertible. A continuacin veremos un mtodo de estimacin alternativo, el mtodo de mxima verosimilitud.
El mtodo de mxima verosimilitud (MV), un mtodo de estimacin alternativo,
propone en cambio como un estimador el valor que maximiza la probabilidad de obtener
la muestra ya disponible. El mtodo MV se basa, principalmente, en la distribucin que
sigue el trmino de error. A tales efectos, se suele suponer que las perturbaciones aleatorias
se distribuyen con una distribucin Normal que, adems de cumplir las propiedades de una
muestra grande, es una aproximacin cmoda y fcil de tratar.
Suponiendo que el trmino de error sigue una distribucin normal, y dado que
la media del error cero, se tiene que:
( )2
21
exp22
iif
pi
=
, 1,...., i n = (2.59)
Maximizar la probabilidad de obtener la muestra ya disponible equivale
maximizar la funcin de densidad conjunta del vector aleatorio . Para ello, hemos de
suponer homoscedasticidad y ausencia de autocorrelacin. Luego, la expresin de la
funcin de densidad conjunta es la siguiente:
(CT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
2-34
( )( )2
21
1exp
22
n ini
ii
f
pi=
=
(2.60)
Dado que sigue una distribucin Normal Multivariante de orden k, la variable Y, al ser una combinacin lineal de las perturbaciones aleatorias, tambin se distribuir con una distribucin Normal Multivariante. As, para que la funcin de densidad
conjunta sea una funcin de verosimilitud, el vector aleatorio ha de expresarse en funcin
del vector Y, es decir:
( ) ( ) ( )2 21; , exp 22Tn Y X Y X
L Y
pi
= (2.61)
Maximizar la funcin de verosimilitud (2.61) equivale a maximizar la
probabilidad que los datos (X) provengan de la distribucin considerada. Luego, el estimador de mxima verosimilitud maximiza por lo tanto dicha probabilidad.
Dado que (2.61) es una funcin estricta creciente y montona, maximizarla
equivale a maximizar una transformacin montona, como por ejemplo logaritmo natural:
( ) ( ) ( ) ( )2 21ln ln 2 ln 22 2 2Tn nL Y X Y Xpi
= (2.62)
Derivando (2.62) respecto a y a 2 , se obtienen los siguientes resultados:
( ) 1 T TMV MCOX X X Y = = (2.63) ( ) ( )2 2
T T
MV MCOn n k
= < =
(2.64)
Observamos que el estimador de MV de coincide con el MCO, con lo que tendr las mismas propiedades: ser lineal, insesgado, ptimo y consistente. Es fcil ver que
el estimador de MV de 2 , en cambio, resulta diferente del MCO y es sesgado a la baja
aunque asintticamente insesgado (cuando n ).
ICT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
2-35
El estimador de MV es consistente, asintticamente normal, asintticamente
eficiente e invariante. La matriz de varianzas y covarianzas asinttica del estimador de MV corresponde al negativo de la inversa de la matriz informacional ( )I :
( )2 ln
T
LI E
=
(2.65)
( )12
1 lnT
LI E
= (2.66)
Notar que en el caso de la distribucin normal, ( )2, = . 2.2.6 Interpretacin Econmica
La interpretacin econmica nos permite comprobar si las estimaciones
obtenidas son coherentes con la teora econmica. Segn la especificacin del modelo, la
interpretacin y significacin de los parmetros puede variar. Si el modelo est
especificado en niveles, el parmetro refleja el efecto medio que tiene una variacin
unitaria de la variable explicativa sobre la variable endgena:
jj
Yx
=
(2.67)
En cambio, si el modelo est especificado en logaritmos, los parmetros
pueden interpretarse como una elasticidad, como es el caso de la funcin de produccin
de Cobb-Douglas:
lnlnj j
Yx
=
(2.68)
Recordar que la elasticidad precio-demanda es lnln
Q P QP Q P
= =
.
(CT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
2-36
2.2.7 Diagrama de Venn
Considere una variable Y que la deseamos regresionar con una variable X, obteniendo un trmino de error . La variabilidad de la variable dependiente Y est
representada por el crculo amarillo de la Figura 2.10. La variabilidad de la variable
independiente X est representada por el crculo blanco. La superposicin de ambos
crculos, representada por el rea azul, representa la variacin que tienen en comn ambas
variables. Mientras mayor sea el rea azul, mayor ser la correlacin entre ambas
variables, por lo que la informacin utilizada para estimar el parmetro x es mayor. La parte del crculo amarillo que no se superpone al crculo blanco corresponde a la variacin
en Y que no es explicada por X, y por lo tanto se traspasa al error . El R2 puede en este caso interpretarse como la razn entre el area azul y el crculo amarillo.
Figura 2.10
Diagrama de Venn Para Una Variable Explicativa
X
Y
Consideremos ahora la Figura 2.11 siguiente, que representa un diagrama de
Venn para 2 variables explicativas:
ICT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
2-37
Figura 2.11
Diagrama de Venn Para Dos Variables Explicativas
X
Y
Z
El rea naranja ms el rea roja representa la correlacin conjunta (grado de
colinealidad) que tienen las variables X y Z.
Si regresionamos Y slo sobre X, se utilizara el rea azl ms la roja. SI regresionamos Y slo sobre Z, usaramos el rea verde ms la roja. Luego, el rea roja representa aquela variacin en Y que es explicada tanto por X como por Z, debido a que estas dos variables explicativas estn correlacionadas.
Por lo tanto, se observa claramente que regresionar Y sobre X y Z simultneamente, genera resultados diferentes que regresionar Y sobre X o Y sobre Z separadamente. Pero, qu pasara si X y Z estn incorrelacionadas?
(CT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
2-38
Figura 2.12
Diagrama de Venn Para Dos Variables Explicativas Incorrelacionadas
X
Y
Z
Si X y Z estn incorrelacionadas, estimar separademente Y sobre cada regresor X y Z entregar los mismos resultados que regresionar Y sobre los dos regresores. Sin embargo, se observa claramente que incluir ambas variables aumenta la proporcin
explicada de la variacin de Y (excepto que el rea azul o el rea verde fueran cero, es decir, que no haya interceccin entre Y y X o entre Y y Z). El R2 en este caso puede interpretarse como la razn entre la suma de las reas azul ms la verde y el crculo
amarillo.
2.2.8 Interpretacin Geomtrica de los MCO
Considere el modelo Y = 1X1 y 2X2 + . Considerando las variables como vectores, se puede generar la siguiente Figura:
ICT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
2-39
A
X2
X1
Y
O
C
B
La regresin de Y sobre X1 y X2 corresponde a la proyeccin de dicho vector sobre el hiperplano generado por las variables independientes, en este caso el plano
formado por X1 y X2:
X2
X1
Y
A C
B
F1
F2 Y
O D
Luego, el valor de los parmetros estimados es necesario descomponer el
vector proyectado Y sobre las distintas variables X, obteniendo en este caso los trazos definidos por OF1 y OF2, por lo que se obtiene las siguientes estimaciones MCO:
(CT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
2-40
11
OFOB
= , 22 OFOC = (2.69)
Es interesante notar que los estimadores de los parmetros
pueden ser mayor o menor que uno, y tambin positivos o negativos,
dependiendo de la estructura de los vectores considerados.
Notar tambin que Y Y AD = = .
X2
X1
Y
A C
B
Y
O D
2
1
Por otra parte, teniendo en cuenta que las variables estn medidas en
desviaciones respecto a sus medias (estandarizadas), el coeficiente de determinacin
puede escribirse como:
T
T
Y YRY Y
= (2.70)
Dado que ( ) T T T T TY Y Y Y Y Y Y Y Y = = = se obtiene:
2
T T T T T
T T T T T T
Y Y Y Y Y Y Y Y Y YR RY Y Y Y Y Y Y Y Y Y Y Y
= = =
(2.71)
La expresin anterior es el coeficiente de correlacin simple entre Y e Y.
ICT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
2-41
Por otra parte, se tiene que:
cos
T T
T T T
OD Y Y Y YOA Y Y Y Y Y Y
= = =
(2.72)
X2
Y F2
X1
Y
A C
B
F1 O
D
Por lo tanto, el coeficiente de correlacin mltiple o R2 es igual al coseno del ngulo que forma el vector Y con el plan formado por X1 y X2.
El coeficiente de correlacin parcial entre Y y X2, dado X1, corresponde al coeficiente de correlacin simple entre los residuos de la regresin de Y y X2 ambas sobre X2 por separado. Luego, este coeficiente ser igual al coseno del ngulo (1 ) que forman ambos vectores de residuos:
11
2
cosAGCG
= (2.73)
(CT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
2-42
Y
F2
F1
1
G2 G1
X2
X1
Y
A C
B
O
El contraste F en este caso se forma a partir de un cuociente. En el numerador es la diferencia de la suma de los cuadrados de los residuos con y sin restricciones; en el
denominador la suma de los cuadrados de los residuos sin restricciones.
( )( ) [ ];
T TR R
p n kT
p F
n k
(2.74)
Luego, si se desea contrastar la hiptesis 2 0 = (por lo que no existira correlacin entre Y y la variable X2), el vector de residuos con restricciones ( )R ser la diferencia entre el vector Y y el vector que resulta de proyectar Y sobre X1, al que denominaremos 1Y , y se tendr que 1 1Y OG= . En consecuencia: 1 1R Y Y AG = = .
Anlogamente, el vector de errores sin restriccin es Y Y AD = =
Finalmente, se tendr la siguiente expresin:
( ) ( )( )( ) ( ) [ ]
2 21
1; 22
1
2 nAG AD
FAD n
(2.75)
ICT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
3-43
3 INFERENCIA Y PRECICCIN
3.1 Contraste de Restricciones
3.1.1 Contraste de una Restriccin Lineal
Dado que la distribucin de los coeficientes de regresin pueden ser
caracterizados a partir de ( ) 12 ; TN X X , y dado que se ha supuesto independencia estadstica entre los parmetros y el vector de residuos, entonces el
estadstico:
( )( ) ( )
i i
n ki
tse
(3.1)
sigue una distribucin t con (n - k) grados de libertad. Notar que al ser un anlisis asinttico (n grande), la distribucin t converge a una distribucin normal. Notar adems que el
trmino ( ) 2 iiise S = , donde Sii es el i-simo elemento de la diagonal de ( ) 1TX X . Para llevar a cabo hiptesis sobre el valor de un coeficiente puede emplearse
un estadstico de la t tradicional. Si el valor del parmetro calibrado difiere significativamente del verdadero valor de , deducimos entonces que los datos muestrales no son consistentes con la hiptesis nula.
Un contraste comn consiste en si un parmetro es significativamente distinto de cero. En tal caso, el estadstico es:
( )
i
i
tse
= (3.2)
En general, si ( ) / 2 i i ise t > , donde /2 define el grado de confiabilidad exigido de la distribucin t con (n - k) grados de libertad, entonces la hiptesis se rechaza y se dice que el coeficiente es estadsticamente significativo; es decir,
la variable asociada a dicho componente ayuda a describir el fenmeno estudiado.
(CT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
3-44
En otras palabras, t es una medida de la diferencia entre la funcin hipottica
de los verdaderos coeficientes y la misma funcin de las estimaciones de dichos
coeficientes. Si la hiptesis es verdadera, las estimaciones deberan reflejarlo al menos
dentro de los rangos de variabilidad muestral. El valor t = 1,96 (correspondiente a un
grado de significatividad del 95% en muestras grandes) normalmente es el utilizado como
valor de referencia.
Un intervalo de confianza para i estara dado por:
( ) ( )( )2 2 1i i i i it se t se < < + =
(3.3)
3.1.2 Contraste de Restricciones Lineales Conjuntas
Consideremos las siguientes restricciones lineales del modelo de RLM:
11 1 12 2 1 1
21 1 22 2 2 2
1 1 2 2
....
....
....
....
k k
k k
p p pk k p
R R R qR R R q
R q
R R R q
+ + + = + + + =
=+ + + =
(3.4)
La matriz R tiene k columnas y p filas (restricciones); con las restricciones hay por lo tanto slo k - p parmetros libres.
La hiptesis nula corresponde en este caso a R = q. A partir del valor numrico que tome el estadstico de contraste es posible determinar si la diferencia entre
R y q es estadsticamente significativa o no lo es. La regla de decisin es la siguiente:
( ) ( ) ( )( ) [ ]
11
;
TT T
p n kT
R q R X X R R q p F
n k
(3.5)
donde ( )2 2 T
Tn k
n k
= =
.
Si [ ];p n kF F el estadstico de contraste se encuentra fuera de la regin de
aceptacin, lo cual nos lleva a rechazar la hiptesis nula. Por tanto, las restricciones
lineales no son ciertas en el mbito de la poblacin.
ICT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
3-45
Si [ ];p n kF F < el estadstico de contraste cae dentro de la regin de aceptacin,
con lo cual no podemos rechazar la hiptesis nula. En consecuencia, podemos
afirmar que las restricciones son ciertas en el mbito de la poblacin.
En el caso particular que se desee testear que todos los k parmetros de la regresin, excepto la constante o intercepto, son significativamente distintos de cero, se
tendr que R = Ik-1 y q = (0, 0, , 0). Luego, de (3.5) se obtiene:
( ) ( )( ) [ ]1;
1
T T
k n kT
X X k F
n k
(3.6)
y dado que ( ) 1 T TX X X Y = se obtiene finalmente:
( )( )( ) [ ]
2
1;2 11 k n kn kR
FkR
(3.7)
Esta ltima expresin (3.7) nos indica que aquellas regresiones que tienen
bajo coeficiente de ajuste, es decir un bajo R2, tienen a su vez un test F tambin muy bajo, lo cual permitira decir que la probabilidad de rechazar la hiptesis es muy baja.
3.1.3 Contraste Basado en una Regin de Confianza
En el modelo de RLM, una regin de confianza para un conjunto de
coeficientes sera el conjunto de valores para los cuales la hiptesis de que el conjunto de
coeficientes verdaderos iguala a estos valores no sera rechazada. El contraste en este caso
es:
( ) ( ) ( ) [ ]1
1
;
1
2
TTT T
p n k- R X X R - Fn k
(3.8)
En el caso de 2 parmetros ( )1 2 , , cuyos estimadores presenten distintas varianzas, la regin de confianza est dada por una elipse en el plano ( )1 2 , . Para entender este contraste, consideremos la siguiente Figura:
(CT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
3-46
Figura 3.1
Regin de Confianza Para Variables Incorrelacionadas
1
2
1
2
A
B
Considerando una significancia del 95% para cada parmetro en forma
independiente, el rea del rectngulo de la Figura 3.1 sera 0,95x0,95 = 0,9025. Por lo
tanto, el rectngulo no es lo suficientemente grande, y un contraste de cada parmetro por
separado podra no se adecuado. La elipse representa un corte de la campana de Gauss a
una altura que representa el 95%. Luego, si se exigierea un 99%, el rea de la elipse
crecera, y si se exigiera un 90%, el rea sera menor.
ICT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
3-47
Por qu se produce esta diferencia entre el rectngulo y la elipse?. La
respuesta es simple: las reas en las cuatro puntas del rectngulo, que estn fuera de la
elipse, son muy poco probables, es decir, es muy difcil que en una distribucin conjunta los
2 parmetros estimados tengan valores que caigan en dichas reas. Por otra parte, las
reas de la elipse que caen fuera del rectangulo pasan a ser ms probables, ya que
representan probabilidades condicionales. Es decir, dado que existe una distribucin
divariada en el ejemplo de la Figura 3.1, es ms probable obtener dos estimadores de 1 y 2 representados en el punto A que en el punto B.
Considerando que existe correlacin (colinealidad) entre las variables
explicativas, el anlisis es similar. Sin embargo, y como se aprecia en la Figura 3.2, los
errores que se pueden cometer son mucho mayores.
Figura 3.2
Regin de Confianza Para Variables Correlacionadas
1
2
1
2
A
B
(CT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
3-48
3.1.4 Mnimos Cuadrados Restringidos
De manera anloga al estimador de MCO, en el caso restringido se resuelve
el siguiente problema de optimizacin:
{ } ( ) ( )minT
T Q= Y X Y X
(3.9)
s.a.: R =q (2) (3.10)
Sin prdida de generalidad, el lagrangeano del problema anterior es:
( ) ( ) ( ) ( ), 2TL = Y X Y X R q + (3.11)
( )2 2 0T TRL X Y X R = + = (3.12)
( )2 0T RL R q = = (3.13) Dividiendo por 2 y desarrollando se obtiene la siguiente matriz particionada:
0
T T TRX X R X Y
R q
=
(3.14)
Si TX X es no singular, se obtiene entonces:
( ) ( ) ( )11 1 T T T TR X X R R X X R R q = + (3.15) ( ) ( )11 T TR X X R R q = (3.16)
De la expresin (2.9) se observa que, si la restriccin es correcta, es decir,
efectivamente ( )R q , el estimador restringido corresponde al estimador de MCO ( ) R = . Del mismo modo, el parmetro valdra cero.
ICT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
3-49
Adicionalmente, se tiene que:
( ) ( ) ( ) ( ) ( )1 1 1 12 2 T T T T T TRMatriz Positiva Definida
V X X X X R R X X R R X X = (3.17)
Luego, el estimador restringido presenta menor varianza que el estimador
MCO. Ello se explica por el valor de la informacin contenida en las restricciones, lo que
reduce la incertidumbre en la estimacin (ms grados de libertad).
3.1.5 Contraste de Restricciones No Lineales
El problema general consiste en el contraste de la hiptesis que implica una
funcin no lineal de los coeficiente de la regresin:
( )g q = (3.18)
Analizando el caso de una nica restriccin resulta:
( )( )( ) ( )
n k
g qt
se g
(3.19)
La aproximacin lineal en series de Taylor para ( )ig implica lo siguiente:
( ) ( ) ( ) ( ) T
gg g
+ (3.20)
( ) ( ) ( ) ( ) T
g gV g V
(3.21)
( ) ( ) ( ) ( )1 T T
Tg gV g X Xn k
(3.22)
De la expresin (3.21) se obtiene el valor requerido:
( ) ( )( )1 2 se g V g = (3.23)
(CT-2950 Tpicos de Econometra
Pontificia Universidad Catlica de Chile
3-50
3.2 Prediccin
Junto con la estimacin de parmetros y la inferencia, el uso ms habitual de
la regresin es la prediccin.
La prediccin del conjunto de regresores X0 es la siguiente:
0 0 0Y X = + (3.24)
Sin embargo, usando el modelo estimado tendramos:
0 0 Y X = (3.25)
que corresponde al estimador de E(Y0). Luego, e