Presentación Econometría I

111
ECONOMETRÍA I EL MODELO LINEAL GENERAL

Transcript of Presentación Econometría I

Page 1: Presentación Econometría I

ECONOMETRÍA I

EL MODELO LINEAL GENERAL

Page 2: Presentación Econometría I

ÍNDICE

Tema 1. Introducción4

1.1. Objetivo de la Econometría5

1.2. Ejemplos de modelos econométricos6

1.3. Tipos de datos12

1.4. Transformaciones en los datos de series temporales16

1.5. Necesidad de la Inferencia estadística20

Tema 2. Formulación del Modelo Lineal General21

2.1. Supuestos del Modelo Lineal General22

2.2. Formulación del Modelo Lineal General23

2.3. Interpretación de los coeficientes del Modelo Lineal General26

2.4. Supuestos del Modelo Lineal General y su explicación30

2.5. Ejemplo de incumplimiento de Ruido Blanco34

2.6. Importancia de los supuestos del Modelo Lineal General37

Tema 3. Estimación del Modelo Lineal General38

3.1. Estimación del Modelo Lineal General por MCO39

3.2. Propiedades algebraicas del estimador MCO43

3.3. Coeficiente de determinación45

Page 3: Presentación Econometría I

ÍNDICE

3.4. Distribución de los coeficientes estimados y sus propiedades48

Tema 4. Inferencia en el Modelo Lineal General57

4.1. Derivación del test de Wald58

4.2. Uso del test de Wald60

4.3. El estadístico F63

4.4. Construcción de intervalos de confianza para β68

4.5. Supuestos del Modelo Lineal General y uso de estadísticos69

Tema 5. Previsión con el Modelo Lineal General75

5.1. Cálculo de previsiones puntuales76

5.2. Error de previsión77

5.3. Previsión por intervalos83

Tema 6. Extensiones85

6.1. Restricciones sobre los parámetros86

6.2. Mínimos Cuadrados Restringidos (MCR)89

6.3. Reflexión sobre los parámetros del Modelo Lineal General98

6.4. Estimación Máximo-Verosímil del Modelo Lineal General110

Page 4: Presentación Econometría I

TEMA 1INTRODUCCIÓN

1.1. Objetivo de la Econometría

1.2. Ejemplos de modelos econométricos

1.3. Tipos de datos

1.4. Transformaciones en los datos de series temporales

1.5. Necesidad de la Inferencia estadística

Page 5: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 5

1. INTRODUCCIÓN1.1. Objetivo de la Econometría

La Econometría tiene, fundamentalmente, tres objetivos:

1. El estudio de relaciones causales entre variables económicas.

2. La previsión de la evolución futura de variables económicas.

3. La validación empírica (utilizando datos) de teorías económicas.

Para este triple objetivo, el instrumento fundamental del que se nutre la Econometría es el modelo econométrico. Existen muchos tipos de modelos econométricos. Así, nos podemos encontrar:

4. Modelos econométricos uniecuacionales o multiecuacionales.

5. Modelos econométricos estáticos o dinámicos.

6. Modelos econométricos lineales o no lineales.

7. Modelos econométricos para datos de series temporales.

8. Modelos econométricos para datos de sección cruzada.

9. Modelos econométricos para datos de panel.

10. Modelos econométricos para variables dependientes continuas o discretas.

TEMA 1

Page 6: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 6

1. INTRODUCCIÓN1.2. Ejemplos de modelos econométricos

Ejemplos de modelos econométricos uniecuacionales

La variable yt (o los agentes que la determinan) responde instantáneamente a variaciones en xt,2 pero, sin embargo, la variable xt,2 no responde a variaciones en yt. La respuesta de yt se dice que es lineal, porque el modelo que relaciona yt con xt,2 es de carácter lineal (en los parámetros). Asimismo, se dice que es simétrica, dado que un aumento de una unidad en xt,2 produce un aumento de la variable yt de β2 unidades (suponiendo que β2 > 0) y, al mismo tiempo, un descenso de una unidad en xt,2 produce un descenso en la variable yt de β2 unidades (de nuevo, suponiendo que β2 > 0). Es decir, tanto aumentos como descensos unitarios en la variable xt,2 provocan aumentos (descensos) en la variable yt de la misma cuantía. Además, cuando se manejan datos de Series Temporales, se dice que se trata de un modelo estático, porque un cambio en xt,2 provoca un cambio en yt en un número finito de periodos, en este caso cero periodos, puesto que la respuesta de yt es instantánea. Por último, éste es un modelo en el que el valor esperado de la variable yt cuando xt,2 = 0, es distinto de cero, ya que: tExyE ttt 0)( que puesto ,)0 ( 12,

Primer ejemplo: yt = β1 + β2xt,2 + εt, εt ~ N(0; σ²) para todo t, y E(εt εs) = 0, para t ≠ s

TEMA 1

Page 7: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 7

1. INTRODUCCIÓN1.2. Ejemplos de modelos econométricos

Ejemplos de modelos econométricos uniecuacionales (datos de Series Temporales)

Éste es un modelo similar al anterior en todos los aspectos salvo que, ahora, la variable yt va a responder a variaciones en xt,2 con un retardo de un periodo. Además, yt no responde de manera instantánea a los cambios que se producen en la variable xt,2, es decir, la respuesta de yt ante cambios en xt,2 tiene un tiempo muerto de un periodo.

t

2,tx

1

Tt

ty

T

2

1T

Segundo ejemplo: yt = β1 + β2xt–1,2 + εt, para todo t, y εt es Ruido Blanco

TEMA 1

Page 8: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 8

1. INTRODUCCIÓN1.2. Ejemplos de modelos econométricos

Ejemplos de modelos econométricos uniecuacionales (datos de Series Temporales)

En este modelo, la variable yt responde a variaciones en xt,2 tanto de manera instantánea como al cabo de un periodo. Es decir, la respuesta no es sólo instantánea, sino también retardada. Sin embargo, la respuesta de la variable yt ante cambios en xt,2 se agota pasado un periodo.

t

2,tx

1

T

t

ty

3

1TT

2

Tercer ejemplo: yt = β1 + β2xt,2 + β3xt–1,2 + εt, para todo t, y εt es Ruido Blanco

TEMA 1

Page 9: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 9

1. INTRODUCCIÓN1.2. Ejemplos de modelos econométricos

Ejemplos de modelos econométricos uniecuacionales (datos de Series Temporales)

En este caso, la respuesta de la variable yt a cambios en xt,2 es una respuesta dinámica, es decir, se prolonga por infinitos periodos, como consecuencia de que, en el modelo, figura un retardo de yt como variable explicativa.

Si xt,2 recibe un impulso unitario en t = T, entonces la respuesta de la variable yt vendrá dada por el siguiente gráfico:

t

2,tx

1

T

t

ty

T

1

2T

221 21

1T 3T

321

Cuarto ejemplo: yt = β1xt,2 + β2yt–1,2 + εt, para todo t, εt es Ruido Blanco, y 0 < β2 < 1

TEMA 1

Page 10: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 10

1. INTRODUCCIÓN1.2. Ejemplos de modelos econométricos

Ejemplos de modelos econométricos multiecuacionales:

Éste es un modelo en el que la cantidad demandada de un producto, así como su cantidad ofrecida (en el caso de que tratemos con datos de Series Temporales), dependen del precio del mismo, o, alternativamente, es un modelo en el que la cantidad demandada y ofertada de distintos bienes en un momento determinado del tiempo (en el caso de que tratemos con datos de Sección Cruzada) dependen de sus respectivos precios. Además, existe equilibrio en todos los periodos o para todos los bienes, tal y como se indica en la tercera ecuación del sistema.

El precio y la cantidad de equilibrio se determinan de forma simultánea y resultan de resolver el siguiente sistema matricial:

Éste es un modelo estático multiecuacional. Operando en el sistema matricial anterior llegamos a que su solución viene dada por la siguiente expresión:

2 1

2 1

1

1

dt t

t tot t

q

pAx = c

Primer ejemplo: qtd = β1 + β2pt + εt

d, qto= α1 + α2pt + εt

o, qtd = qt

o, para todo t.

t t1x A c

TEMA 1

Page 11: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 11

1. INTRODUCCIÓN1.2. Ejemplos de modelos econométricos

Ejemplos de modelos econométricos multiecuacionales (datos de Series Temporales)

Se trata de un modelo dinámico multiecuacional. Tanto en la ecuación de comportamiento de la variable yt como en la de xt aparecen las variables dependientes retardadas (en este caso un periodo).

Así, un incremento unitario en xt en t = T ocasiona, como se puede ver en la primera de las ecuaciones, un incremento de β2 unidades en la variable yt en t = T + 1. Pero, al mismo tiempo, el incremento de yt en t = T + 1 produce, como se puede ver en la segunda de las ecuaciones, un incremento de α2 unidades en la variable xt en el periodo t = T + 2, y así sucesivamente, es decir, se tiene el proceso:

Este modelo recoge, por lo tanto, el fenómeno de la retroalimentación.

321 TTTT yxyx

Segundo ejemplo: yt = β1yt–1 + β2xt–1 + εt

y, xt = α1xt–1 + α2yt–1 + εtx

TEMA 1

Page 12: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 12

1. INTRODUCCIÓN1.3. Tipos de datos

Datos de Series Temporales

Los datos de series temporales analizan la evolución de una variable a lo largo del tiempo. Dependiendo de la periodicidad con la que se observe la variable, nos podemos encontrar con Series Temporales de periodicidad diaria, semanal, mensual, trimestral o anual.

La tabla y el gráfico siguiente, que recogen la cotización máxima semanal del valor de las acciones del Banco Santander durante el año 2011, son un ejemplo de datos de series temporales.

Fecha Cotización

3/Ene/2011 8,09 €

10/Ene/2011 8,72 €

19/Dic/2012 5,94 €

27/12/2012 5,87 €

1/3/2011

1/24/2011

2/14/2011

3/7/2011

3/28/2011

4/18/2011

5/9/2011

5/30/2011

6/20/2011

7/11/2011

8/1/2011

8/22/2011

9/12/2011

10/3/2011

10/24/2011

11/14/2011

12/5/2011

12/26/2011

1/16/2012

2/6/2012

2/27/2012

3/19/2012

55.56

6.57

7.58

8.59

9.510

TEMA 1

Page 13: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 13

1. INTRODUCCIÓN1.3. Tipos de datos

Datos de Sección Cruzada

Los datos de sección cruzada, también conocidos como datos de Corte Transversal, estudian el comportamiento de diversas variables sobre n individuos (ya sean consumidores, hogares, empresas, países, etc.). Es decir, los datos de Sección Cruzada son datos de encuestas o de individuos referidos a un periodo de tiempo fijo.

La siguiente tabla presenta un ejemplo de datos de Sección Cruzada o de Corte Transversal. Recoge una parte de una encuesta realizada en 1978 a un total de 500 individuos.

Individuo Años educación Experiencia Salario/hora

1 10 4 30

2 20 8 40

3 2 0 10

4 10 1 9

TEMA 1

Page 14: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 14

1. INTRODUCCIÓN1.3. Tipos de datos

Datos de panel

Los datos de Panel combinan las características tanto de los datos de series temporales como de los datos de sección cruzada. Estudia el comportamiento de n individuos sobre diversas variables de interés a lo largo de un muestra en k instantes temporales diferentes.

La tabla siguiente muestra un ejemplo de datos de Panel (ficticio). Recoge los años de educación y el salario por hora (en euros) de tres individuos durante cuatro años consecutivos.

Año/IndividuoNúmero 1 Número 2 Número 3

Educ. Salario Educ. Salario Educ. Salario

2004 10 20 5 10 30 40

2005 11 25 6 10 30 45

2006 11 30 7 11 30 50

2007 11 35 8 11 30 55

TEMA 1

Page 15: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 15

1. INTRODUCCIÓN1.3. Tipos de datos

Los datos de Series Temporales pueden presentar una o varias de las siguientes características que se enumeran a continuación:

1. Tendencia.

2. Ciclos.

3. Estacionalidad.

4. Valores extremos.

5. Heterocedasticidad.

6. Autocorrelación.

La tendencia, el ciclo y el componente estacional pueden ser estocásticos, en cuyo caso se convierten en formas particulares de autocorrelación.

Los datos de Sección Cruzada suelen presentar heterocedasticidad y valores extremos.

Por su parte, las características típicas de los datos de Panel están formadas por la unión de las características de los datos de Series Temporales y de los datos de Sección Cruzada.

TEMA 1

Page 16: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 16

1. INTRODUCCIÓN1.4. Transformaciones en los datos de series temporales

Transformación logarítmica

Es habitual que una serie temporal yt se transforme en otra serie temporal zt mediante la siguiente fórmula:

El objetivo de esta transformación es doble: por un lado, persigue inducir normalidad en la serie temporal; por otro lado, tomar logaritmos neperianos induce homocedasticidad.

El gráfico de la izquierda que se va a presentar a continuación muestra la serie temporal de consumo mensual de gasolina en España entre 1945 y 1999, la cual presenta mayor variabilidad conforme aumenta el nivel de la misma. El gráfico de la derecha muestra la serie temporal que resulta de tomar logaritmos neperianos sobre la serie anterior. Se puede apreciar que esa mayor variabilidad –al aumentar el nivel de la serie– ha desaparecido, es decir, la serie original, heterocedástica, se convierte en homocedástica mediante la aplicación de logaritmos neperianos.

ttt yyfz ln)(

0

200

400

600

800

1,000

45 50 55 60 65 70 75 80 85 90 952

3

4

5

6

7

45 50 55 60 65 70 75 80 85 90 95

TEMA 1

Page 17: Presentación Econometría I

Definición:

Definimos el operador de retardo de orden p, Bp, como un operador que, aplicado sobre una serie temporal yt, nos devuelve, como resultado, esa misma serie temporal retardada p periodos, es decir:

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 17

1. INTRODUCCIÓN1.4. Transformaciones en los datos de series temporales

Operador diferencia regular

El operador diferencia regular de orden p, definido como:

aplicado sobre una serie temporal yt, se utiliza para eliminar la tendencia de la misma.

El gráfico de la izquierda que se va a presentar reproduce la serie del consumo de gasolina presentada antes (en logaritmos neperianos). Es claramente observable que esta serie muestra una tendencia creciente. Sin embargo, podemos observar en el gráfico de la derecha, que se ha obtenido al aplicar una diferencia regular a la serie anterior, que la tendencia ha desaparecido.

pttp yyB

veces

1111

p

pp BBBB

2

3

4

5

6

7

45 50 55 60 65 70 75 80 85 90 95-.6

-.4

-.2

.0

.2

.4

45 50 55 60 65 70 75 80 85 90 95

TEMA 1

Page 18: Presentación Econometría I

Definición:

Definimos el operador de retardo de orden p, Bp, como un operador que, aplicado sobre una serie temporal yt, nos devuelve, como resultado, esa misma serie temporal retardada p periodos, es decir:

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 18

1. INTRODUCCIÓN1.4. Transformaciones en los datos de series temporales

Operador diferencia estacional

El operador diferencia estacional de orden p y periodo s, definido como:

aplicado sobre una serie temporal yt, se utiliza para eliminar el componente estacional no estacionario de la misma.

El gráfico de la izquierda que se va a presentar reproduce la serie del consumo de gasolina presentada antes (en logaritmos). Es claramente observable que esta serie muestra, además de una tendencia creciente, un componente estacional. Sin embargo, podemos observar, en el gráfico de la derecha, que se ha obtenido al aplicar una diferencia estacional, que la estacionalidad ha desaparecido.

pttp yyB

veces

1111

p

ssspsps BBBB

2

3

4

5

6

7

45 50 55 60 65 70 75 80 85 90 95-400

-200

0

200

400

45 50 55 60 65 70 75 80 85 90 95

TEMA 1

Page 19: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 19

1. INTRODUCCIÓN1.4. Transformaciones en los datos de series temporales

Transformaciones más habituales

Dependiendo de la periodicidad de la serie temporal con la que estemos trabajando, serán más habituales unas transformaciones u otras a la serie original, con el objetivo de conseguir estacionariedad. Así, se tiene que:

1. En general, la primera transformación que se realiza es aplicar logaritmos neperianos a la serie temporal original porque, como vimos anteriormente, induce homocedasticidad.

2. Si tenemos una serie temporal con periodicidad anual (normalmente en logaritmos), lo más habitual es aplicar una o dos diferencias regulares.

3. Si tenemos una serie temporal con periodicidad trimestral (normalmente en logaritmos), las transformaciones más habituales son las siguientes:

4. Si tenemos una serie temporal con periodicidad mensual (normalmente en logaritmos), las transformaciones más habituales son las siguientes:

5. Con datos diarios o semanales, suele ser suficiente una diferencia regular.

ttt yyy ln o ,ln ,ln 24

tttt yyyy ln o ,ln ,ln ,ln 21212

212

TEMA 1

Page 20: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 20

1. INTRODUCCIÓN1.5. Necesidad de la Inferencia estadística

En Econometría trabajaremos con variables aleatorias y vamos a estar interesados en determinados parámetros que forman parte de las funciones de densidad de dichas variables.

Sin embargo, no podremos calcularlas y, debido a ello, vamos a utilizar la Inferencia estadística, con el objetivo de poder construir intervalos de confianza que nos den información de los parámetros de cuya información estamos interesados.

En este curso nos vamos a centrar en los modelos econométricos que habitualmente se emplean cuando se disponen de datos de Sección Cruzada, como puede ser el caso de datos conseguidos a través de una encuesta, como puede ser la Encuesta de Población Activa (EPA), la Encuesta de Condiciones de Vida (ECV), o cualquier otra o, alternativamente, cuando se dispongan de datos de diferentes variables referidos a distintos agentes (individuos, empresas, regiones, etc.) en un momento determinado del tiempo, como los que se pueden conseguir a través de bases de datos como SABI o AMADEUS (que proporciona información contable de empresas), o la base de datos de la Penn World Table (que contiene, para diferentes años y países, información de índole macroeconómica), o las bases de datos proporcionada por el IVIE (para el caso de España), entre otras muchas bases de datos que existen en la actualidad.

TEMA 1

Page 21: Presentación Econometría I

TEMA 2FORMULACIÓN DEL MODELO LINEAL GENERAL

2.1. Supuestos del Modelo Lineal General

2.2. Formulación del Modelo Lineal General

2.3. Interpretación de los coeficientes del Modelo Lineal General

2.4. Supuestos del Modelo Lineal General y su explicación

2.5. Ejemplo de incumplimiento de Ruido Blanco

2.6. Importancia de los supuestos del Modelo Lineal General

Page 22: Presentación Econometría I

Estamos interesados en el comportamiento de una variable y. Sabemos que:

1. Su comportamiento puede explicarse adecuadamente por el comportamiento de k variables que llamaremos explicativas:

2. La relación causal es unidireccional, es decir, las variables x = (x1, x2, …, xk) pueden causar la y, pero la y no causa ninguna de las variables x = (x1, x2, …, xk).

3. La y es una variable aleatoria continua, mientras que las variables x = (x1, x2, …, xk) son variables deterministas (continuas o discretas).

4. Las variables x = (x1, x2, …, xk) tienen, cada una de ellas, información independiente sobre la y. Es decir, ninguna xj puede expresarse como combinación lineal del resto:

5. Las variables explicativas x = (x1, x2, …, xk) no explican el 100% de la variabilidad de la variable y, es decir, existen otras variables (desconocidas) que también influyen en el comportamiento de la variable y. A esas variables desconocidas las llamaremos ε y, a diferencia de las variables x = (x1, x2, …, xk), éstas serán aleatorias (o, al menos, así las vamos a considerar).

). , , ,( 21 kxxx x

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 22

2. FORMULACIÓN DEL MODELO LINEAL GENERAL2.1. Supuestos del Modelo Lineal General

kkkjjjjj aaaxaxaxaxaxax , , , , 2111112211

TEMA 2

Page 23: Presentación Econometría I

La representación algebraica del Modelo Lineal General viene dada por:

El subíndice t tiene una lectura distinta dependiendo del tipo de datos con el que nos encontremos:

1. Si estamos tratando datos de series temporales, t es un subíndice temporal.

2. Si estamos tratando datos de sección cruzada, entonces t es un subíndice individuo (ya sean consumidores, hogares, empresas, países, etc.).

En el Modelo Lineal General:

3. La variable yt es la variable cuyo comportamiento queremos explicar. Es una variable estocástica y continua. Se lee: “valor de la variable y para el individuo t, o valor de la variable y en el periodo t (dependiendo del tipo de datos con el que estemos trabajando)”.

4. La variable xt,1 (que no aparece explícitamente en la representación algebraica del Modelo Lineal General) es una variable que toma siempre el valor 1, y está asociada al parámetro β1.

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 23

2. FORMULACIÓN DEL MODELO LINEAL GENERAL2.2. Formulación del Modelo Lineal General

, N, , txxxy tktkttt 21,,3,32,21

TEMA 2

Page 24: Presentación Econometría I

3. Las variables xt,j, j = 2, 3, …, k, son las variables explicativas del Modelo Lineal General asociadas, respectivamente, a los parámetros βj, j = 2, 3, …, k. Se supone que, conjuntamente, todas las variables independientes explican gran parte del comportamiento (o variabilidad) de la variable y. Y, además, las variables explicativas pueden ser continuas o discretas.

4. El parámetro β1 es un parámetro desconocido, que medirá el valor esperado de la variable yt cuando todas las variables explicativas xt,j, j = 2, 3, …, k, valgan 0, es decir:

5. Los parámetros βj, j = 2, 3, …, k, son parámetros desconocidos, y están asociados, respectivamente, a las variables explicativas xt,j, j = 2, 3, …, k. Miden el efecto parcial de las variables explicativas xt,j, j = 2, 3, …, k, sobre la yt.

Existen dos interpretaciones diferentes de los parámetros βj en función de si la variable explicativa es continua o es discreta, tal y como se verá después.

6. La variable εt es una variable aleatoria Ruido Blanco, es decir:

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 24

2. FORMULACIÓN DEL MODELO LINEAL GENERAL2.2. Formulación del Modelo Lineal General

1,3,2, )0 ( ktttt xxxyE

2~ (0; ), , y ( ) 0, t t sN t E t s

TEMA 2

Page 25: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 25

2. FORMULACIÓN DEL MODELO LINEAL GENERAL2.2. Formulación del Modelo Lineal General

Particularizando la expresión del Modelo Lineal General para cada una de las observaciones de la población, se tiene que:

Utilizando lenguaje matricial, el modelo se puede escribir de forma compacta como:

donde, tal y como se puede observar, y es un vector columna de dimensión N × 1, X es una matriz de dimensiones N × k, β es un vector columna de dimensión k × 1 y, por último, ε es un vector columna de dimensión N × 1.

NN,kkN,N,N

,kk,,

,kk,,

εxβxβxββ yNt

εxβxβxββ yt

εxβxβxββ yt

33221

2232322212

1131321211

: Para

:2 Para

:1 Para

εβXy

NkkNNN

k

k

N xxx

xxx

xxx

y

y

y

2

1

2

1

,3,2,

,23,22,2

,13,12,1

2

1

1

1

1

TEMA 2

Page 26: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 26

2. FORMULACIÓN DEL MODELO LINEAL GENERAL2.3. Interpretación de los coeficientes del Modelo Lineal General

Vamos a estudiar cómo se interpretan los coeficientes del Modelo Lineal General en función de cómo sean las variables independientes y de cómo sea la variable dependiente:

1. Las variables independientes, xt,j, j = 2, 3, …, k, están expresadas en niveles y son variables continuas, mientras que la variable dependiente está en niveles:

Puesto que uno de los supuestos del Modelo Lineal General es que la variable dependiente, yt, es una variable continua, entonces, se cumple que:

es decir, el coeficiente βj, asociado a la variable explicativa xt,j, j = 2, 3, …, k, es el efecto marginal que la variable explicativa xt,j produce sobre la variable que queremos explicar, yt.

Dicho de otra manera, caeteris paribus, si la variable xt,j se incrementa en una unidad, entonces la variable dependiente, yt, varía en βj unidades (incrementa, si el signo de βj es positivo, y disminuye, si el signo de βj es negativo).

, N, , txxxxxxfy tktkttktttt 21 ,) , , ,( ,3,32,21,3,2,

, k, , jx

xxxf

xy

jjt

kttt

jt

t

32 ,) , , ,(

,

,3,2,

,

TEMA 2

Page 27: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 27

2. FORMULACIÓN DEL MODELO LINEAL GENERAL2.3. Interpretación de los coeficientes del Modelo Lineal General

2. Alguna de las variables explicativas, xt,j, j = 2, 3, …, k, están expresadas en logaritmos neperianos y son variables continuas, mientras que la variable dependiente está, también, en logaritmos neperianos:

Por ejemplo, sea el modelo:

En este caso, se tiene que:

es decir, el coeficiente βj, asociado a la variable explicativa xt,j, j = 2, 3, …, k, es una elasticidad constante de la variable explicativa xt,j sobre la variable a explicar, yt.

Dicho de otra manera, caeteris paribus, si la variable xt,j se incrementa en un 1%, entonces la variable dependiente, yt, varía en un βj % (incrementa, si el signo de βj es positivo, y disminuye, si el signo de βj es negativo).

, N, , txxxxxfy tktktktttt 21 ,lnln) , , ,(ln ,2,21,3,2,

, k, , jx

xxxf

xy

jjt

kttt

jt

t

32 ,ln

) , , ,(

lnln

,

,3,2,

,

TEMA 2

Page 28: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 28

2. FORMULACIÓN DEL MODELO LINEAL GENERAL2.3. Interpretación de los coeficientes del Modelo Lineal General

3. Las variables independientes, xt,j, j = 2, 3, …, k, están expresadas en niveles y son variables continuas, mientras que la variable dependiente está en logaritmos neperianos:

Por ejemplo, sea el modelo:

En este caso, se tiene, por un lado, que:

es decir, el coeficiente βj, asociado a la variable explicativa xt,j, j = 2, 3, …, k, es una semielasticidad constante de la variable explicativa xt,j sobre la variable a explicar, yt.

Dicho de otra manera, caeteris paribus, si la variable xt,j se incrementa en una unidad, entonces la variable dependiente, yt, varía en (100 × βj )% unidades (incrementa, si el signo de βj es positivo, y disminuye, si el signo de βj es negativo).

, N, , txxxxxfy tktktktttt 21 ,) , , ,(ln ,2,21,3,2,

, k, , jx

xxxf

xy

jjt

kttt

jt

t

32 ,) , , ,(ln

,

,3,2,

,

TEMA 2

Page 29: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 29

2. FORMULACIÓN DEL MODELO LINEAL GENERAL2.3. Interpretación de los coeficientes del Modelo Lineal General

4. Las variables independientes, xt,j, j = 2, 3, …, k, están expresadas en niveles y son variables dicotómicas, mientras que la variable dependiente está, también, en niveles:

Por ejemplo, sea el modelo:

donde si la variable xt,j = 1, j = 2, 3, …, k, indica que dicha variable presenta una característica determinada, mientras que si xt,j = 0, j = 2, 3, …, k, indica la ausencia de dicha característica.

Si nos centramos en el efecto de una sola variable explicativa sobre la variable dependiente, por ejemplo, la variable xt,2, entonces si xt,2 = 1 se tiene que:

mientras que si xt,2 = 0, entonces se tiene que:

Si restamos las dos expresiones vemos que el coeficiente es, en este caso, la diferencia de comportamiento entre dos grupos diferentes: aquellos que tienen la característica y los que no la tienen:

, N, , txxxxxfy tktktktttt 21 ,) , , ,( ,2,21,3,2,

, N, , txxyE tktktt 21 ,)1 ( ,212,

, N, , txxyE tktktt 21 ,)0 ( ,12,

, N, , txyExyE tttt 21 ,)0 ()1 ( 22,2,

TEMA 2

Page 30: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 30

2. FORMULACIÓN DEL MODELO LINEAL GENERAL2.4. Supuestos del Modelo Lineal General y su explicación

Sobre la variable dependiente, y

La variable dependiente, y, tiene que ser una variable continua. Si es una variable discreta, entonces el Modelo Lineal General no es adecuado porque, entre otras cosas, sería incompatible con el supuesto de que el término de error, ε, sea ruido blanco, es decir, con el supuesto de que la perturbación del modelo se distribuye con una distribución normal, con esperanza nula, varianza constante y ausencia de autocorrelación.

Si, como también se supone, las variables independientes son no estocásticas, entonces todo el carácter estocástico de la variable dependiente, y, procede del término de perturbación. Por lo tanto, si el término de perturbación es ruido blanco, eso es incompatible, en nuestro modelo, con que y sea una variable discreta.

Cuando la variable dependiente y sea discreta se utilizarán otro tipo de modelos diferentes, llamados de elección discreta, entre los que se encuentran, entre otros, los modelos lineales de probabilidad, los modelos tobit, o los modelos logit, todos ellos fuera del alcance de este curso.

TEMA 2

Page 31: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 31

2. FORMULACIÓN DEL MODELO LINEAL GENERAL2.4. Supuestos del Modelo Lineal General y su explicación

Sobre las variables independientes, x = (x1, x2, …, xk)

Las variables independientes deben cumplir dos propiedades:

1. En primer lugar, tienen que ser no estocásticas.

2. En segundo lugar, tienen que ser independientes.

Se supone que las variables x = (x1, x2, …, xk) deben ser variables deterministas, esto es, deben ser previsibles con total certidumbre. Este supuesto es bastante irreal en la mayor parte de los casos prácticos aunque, sin embargo, si las variables x = (x1, x2, …, xk) no están correlacionadas con el término de error ε, entonces las consecuencias pueden no ser muy graves.

Además, las variables x = (x1, x2, …, xk) deben ser linealmente independientes, es decir, ninguna variable independiente ha de poder ser expresada como una combinación lineal exacta de las restantes.

Si, por ejemplo, tenemos como variables explicativas el nivel de importaciones, el nivel de exportaciones, y las exportaciones netas, a las que llamaremos x1, x2 y x3, respectivamente, entonces es claro que se incumpliría este supuesto, dado que x3 ≡ x2 – x1.

TEMA 2

Page 32: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 32

2. FORMULACIÓN DEL MODELO LINEAL GENERAL2.4. Supuestos del Modelo Lineal General y su explicación

Sobre los parámetros, β = (β1, β2, …, βk)

Los parámetros del modelo deben ser constantes, es decir, no deben cambiar ni el tiempo (en caso de encontrarnos con datos de series temporales) ni entre individuos (cuando tratemos con datos de sección cruzada).

Si, por el contrario, los parámetros del modelo sí varían, entonces se dice que la estructura del modelo cambia o que existe un cambio estructural.

Un ejemplo en el cual se incumple el supuesto de parámetro constante es cuando tenemos el siguiente modelo econométrico:

En el modelo econométrico propuesto podemos ver que el parámetro β1 es constante pero, sin embargo, el parámetro β2 depende o de los individuos o del tiempo (dependiendo del tipo de datos con el que tratemos). Supongamos que sabemos que su comportamiento se puede explicar mediante el siguiente modelo econométrico:

es decir, el parámetro poblacional β2 en el presente depende de lo que ocurrió en el periodo inmediatamente anterior.

Blanco Ruido siendo con ,2,2,1 ttttt xy

Blanco Ruido siendo con ,7,0 2,12, tttt aa

TEMA 2

Page 33: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 33

2. FORMULACIÓN DEL MODELO LINEAL GENERAL2.4. Supuestos del Modelo Lineal General y su explicación

Sobre la perturbación del modelo, ε

Cada perturbación del modelo, εt, t = 1, 2, …, N, ha de seguir una distribución Normal, ha de tener esperanza matemática nula, es decir, se ha de cumplir que:

supuesto que, si existe un término constante en el modelo econométrico, no es demasiado restrictivo.

Además, cada perturbación del modelo debe tener la misma varianza, es decir, se tiene que cumplir que:

Si se cumple este supuesto se dice que las perturbaciones del modelo son homocedásticas. Sin embargo, si no se cumple, entonces existe un problema de heterocedasticidad.

Por último, las perturbaciones han de estar incorrelacionadas por pares, es decir:

Si todos los supuestos sobre las perturbaciones del modelo se cumplen, entonces se dice que εt sigue un proceso estocástico de Ruido Blanco.

NtE t , 2, 1, ,0)(

NtEEE ttt , 2, 1, constante, siendo ,)())(( 2222

stEEEE stsstt ,0)())())(((

TEMA 2

Page 34: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 34

2. FORMULACIÓN DEL MODELO LINEAL GENERAL2.5. Ejemplo de incumplimiento de Ruido Blanco

Primer caso: omisión de variables relevantes

Imaginemos que especificamos el siguiente modelo econométrico:

Sin embargo, supongamos que el verdadero modelo no es éste, sino el siguiente:

que es el mismo que el anterior, salvo por el hecho de que en el primero hemos omitido la variable explicativa xt,4, que es una variable relevante. En el modelo (2.2) se tiene que at es Ruido Blanco, mientras que, comparando los modelos (2.1) y (2.2) tendríamos, sin embargo, que:

Tomando esperanzas en la expresión anterior se tiene que:

Es decir, un error de especificación del modelo (haber omitido una variable relevante) llevaría a que la esperanza de la perturbación no fuera nula.

tttt xxy 3,32,21

ttt ax 4,4

ttttt axxxy 4,43,32,21

1.2

2.2

0

0

)()()()( 4,44,44,4

tttttt xaExEaxEE

TEMA 2

Page 35: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 35

2. FORMULACIÓN DEL MODELO LINEAL GENERAL2.5. Ejemplo de incumplimiento de Ruido Blanco

Segundo caso: autocorrelación del término de perturbación

Consideremos que tenemos el siguiente modelo econométrico:

donde se tiene que:

En este caso el término de perturbación εt no es independiente de su pasado, puesto que, como podemos observar, εt es función de εt–1. Entonces, si calculamos la autocovarianza entre εt y εt–1 se tendría que:

Demostraremos en Econometría II que:

con lo que la autocovarianza entre εt y εt–1 no es nula y, por lo tanto, no se cumple el supuesto de ausencia de autocorrelación. En la expresión anterior se tiene que:

ttt xy 2,21

Blanco Ruido es donde ,5,0 1 tttt aa

)()(5,0)5,0()( 12

1111 tttttttt aEEaEE

2

2

001 5,01 donde ,5,0

a

))())((( además, y, ))(( 1112

0 tttttt EEEEE

TEMA 2

Page 36: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 36

2. FORMULACIÓN DEL MODELO LINEAL GENERAL2.5. Ejemplo de incumplimiento de Ruido Blanco

Tercer caso: heterocedasticidad en el término de perturbación

Consideremos que tenemos el siguiente modelo econométrico:

en el cual se cumple que:

es decir, que la varianza no es constante, sino que varía o bien entre individuos o bien a lo largo del tiempo (en función del tipo de datos que estemos manipulando).

Además, sabemos que la varianza de la perturbación se comporta conforme al siguiente modelo:

siendo zt alguna variable que explica el movimiento o variabilidad de la varianza del término de perturbación, εt.

Si esto ocurre, entonces se incumple el supuesto de homocedasticidad. Se dice entonces que tenemos un problema de heterocedasticidad en el término de perturbación del modelo εt.

ttt xy 2,21

22 )( ttE

tt z102

TEMA 2

Page 37: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 37

2. FORMULACIÓN DEL MODELO LINEAL GENERAL2.6. Importancia de los supuestos del Modelo Lineal General

Los supuestos que hemos realizado antes y que hemos dicho que es importante que se cumplan en el Modelo Lineal General garantizan:

1. En primer lugar, buenas propiedades para los estimadores obtenidos tanto por Mínimos Cuadrados Ordinarios (MCO) como por Máxima Verosimilitud (MV) que vamos a usar para estimar los parámetros poblacionales (desconocidos) del Modelo Lineal General.

2. En segundo lugar, una distribución estándar para el estadístico de contraste habitualmente utilizado (el estadístico F). La especificación final de un modelo econométrico requiere de un buen estimador de los parámetros (esto es, un estimador con buenas propiedades) sobre el que se pueda construir un estadístico de contraste lo más potente posible.

TEMA 2

Page 38: Presentación Econometría I

TEMA 3ESTIMACIÓN DEL MODELO LINEAL GENERAL

3.1. Estimación del Modelo Lineal General por MCO

3.2. Propiedades algebraicas del estimador MCO

3.3. Coeficiente de determinación

3.4. Distribución de los coeficientes estimados y sus propiedades

Page 39: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 39

3. ESTIMACIÓN DEL MODELO LINEAL GENERAL3.1. Estimación del Modelo Lineal General por MCO

Mínimos Cuadrados Ordinarios (MCO de aquí en adelante) es el método de estimación más utilizado para la estimación de los parámetros poblacionales del Modelo Lineal General.

Sea el Modelo Lineal General escrito en forma matricial:

donde y es un vector columna de dimensión N × 1, X es una matriz de dimensión N × k (N individuos en la población y k variables independientes), β es un vector columna de dimensión k × 1 y, por último, ε es un vector columna de dimensión N × 1.

Se define el concepto de residuo como:

es decir, como la diferencia entre los valores observados y los valores estimados, siendo hucualquier estimador del vector paramétrico desconocido β.

Si cambiamos el vector de coeficientes estimados, entonces también variará el vector de residuos:

εXβy

bXyε~~

b~

εbXyεbb ~ sobtendremo entonces ~ de en vez utilizamos Si

TEMA 3

Page 40: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 40

3. ESTIMACIÓN DEL MODELO LINEAL GENERAL3.1. Estimación del Modelo Lineal General por MCO

El método MCO consiste en hallar el estimador de β que minimiza la suma de los cuadrados de los residuos, es decir, consiste en resolver el siguiente problema de optimización:

Teniendo en cuenta la definición de residuo, podemos reescribir el problema anterior de la siguiente manera:

A partir de ahora a la función objetivo del problema lo vamos a denominar como:

2

{ } { }1

min min n

ii

b b

ε ε

bXXbbXyyy

bXXbyXbbXyyy

bXyXby

bXybXyεε

b

b

b

bb

~~~2 min

~~~~ min

)~

)(~

( min

)~

()~

( min~~ min

}~

{

}~

{

}~

{

}~

{}~

{

bXXbbXyyyb~~~

2)~

( S

TEMA 3

Page 41: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 41

3. ESTIMACIÓN DEL MODELO LINEAL GENERAL3.1. Estimación del Modelo Lineal General por MCO

La condición necesaria de primer orden (CPO) de este problema de optimización es la siguiente:

Resumiendo, la condición de primer orden del problema es:

La condición (3.1) es conocida como el sistema de ecuaciones normales. Al vector de coeficientes estimados que cumpla la condición (3.1) se le cambia el nombre. Así, para los que cumplan la condición (3.1) se tendrá que:

0~

220

0~)

~~(

~)

~(

2~)(

0~)

~~~2(

0~)

~(

XXbXy

bbXXb

bbXy

byy

bbXXbbXyyy

bbS

02~

20~)

~(

XyXXb

bbS 1.3

normales) ecuaciones de sistema el cumpla que vector el para (sólo ˆ~βb

TEMA 3

Page 42: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 42

3. ESTIMACIÓN DEL MODELO LINEAL GENERAL3.1. Estimación del Modelo Lineal General por MCO

Operando en la condición (3.1) de óptimo tenemos que:

Si el rango de la matriz X es completo entonces también lo será el de la matriz X´X y, por lo tanto, existirá la inversa de esta última matriz, por lo que podremos despejar el vector de coeficientes estimados en la expresión (3.2). Es decir:

y, si esto se cumple, entonces operando en la expresión (3.2) llegamos a la manera en cómo se estiman los parámetros poblacionales del Modelo Lineal General a través del método MCO:

Por otro lado, la condición de segundo orden de nuestro problema de minimizar la suma de los cuadrados de los residuos es:

yXβXXyXβXX

XyXXβXyXXβXyXXβ

ˆ)(0ˆ

0ˆ0)ˆ(202ˆ2 2.3

existe )(completo es )(completo es )( Si 1 XXXXX

yXXXβ 1)(ˆ

mínimo)un es óptimo el que lopor positiva, definida es ( 2~~)

~(2

XXXXbbb

S

TEMA 3

Page 43: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 43

3. ESTIMACIÓN DEL MODELO LINEAL GENERAL3.2. Propiedades algebraicas del estimador MCO

El estimador MCO tiene cinco importantes propiedades. Las tres primeras se cumplen siempre. Sin embargo, las últimas dos propiedades se cumplen exclusivamente en el caso de que el Modelo Lineal General tenga término constante.

Las primeras tres propiedades son las siguientes:

1. Las variables explicativas están incorrelacionadas con los residuos del modelo:

2. Los valores estimados del modelo están incorrelacionados con los residuos:

3. La suma de los cuadrados de la variable dependiente se puede descomponer en la suma de dos componentes: por un lado, la suma de los cuadrados de los valores estimados de la variable dependiente con el método MCO y; por otro lado, la suma de los cuadrados de los residuos del modelo:

,1

ˆˆ 0 o, en forma algebraica, 0, n

t k tt

x k

X ε

1

ˆˆ ˆ ˆ0 o, en forma algebraica, 0n

t tt

y

y ε

2 2 2

1 1 1

ˆˆ ˆ ˆ ˆ ˆ o, en forma algebraica, n n n

t t tt t t

y y

y y y y ε ε

TEMA 3

Page 44: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 44

3. ESTIMACIÓN DEL MODELO LINEAL GENERAL3.2. Propiedades algebraicas del estimador MCO

Las últimas dos propiedades del estimador MCO que, recordemos, sólo se cumplen en el caso de que exista término constante en el Modelo Lineal General, son las siguientes:

4. La suma de los residuos del modelo es nula, es decir:

donde ι es un vector en el que todos sus elementos son la unidad:

5. La suma de los cuadrados de las desviaciones respecto de su media de la variable dependiente se puede descomponer en la suma de dos partes: por un lado, la suma de los cuadrados de las desviaciones respecto de su media de los valores ajustados por el método MCO y, por otro, la suma de cuadrados de los residuos, es decir:

o, escrito en forma algebraica:

1

ˆˆ 0 o, en forma algebraica, 0n

tt

ι ε

ˆ ˆ ˆ ˆ ˆˆ( ) ( ) ( ) ( ) ( ) y y y y y y y y ε ε

)111( ι

n

tt

n

tt

n

tt yyyy

1

2

1

2

1

2 ˆ)ˆˆ()(

TEMA 3

Page 45: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 45

3. ESTIMACIÓN DEL MODELO LINEAL GENERAL3.3. Coeficiente de determinación

A partir de la quinta propiedad algebraica del estimador MCO, si dividimos los dos miembros de dicha igualdad por el tamaño muestral, n, entonces se tiene que:

o, en forma algebraica:

Es decir, la varianza muestral de la variable dependiente se puede descomponer en la suma de dos partes: en primer lugar, la varianza muestral de los valores estimados por MCO de la variable dependiente y, por otro lado, la varianza muestral de lo residuos del modelo.

Si dividimos los dos miembros de la expresión (3.3) por la varianza de la variable dependiente, entonces se tiene que:

1 1 1( ) ( ) ( ) ( ) ( )ˆ ˆ ˆ ˆ ˆ ˆ

n n n y y y y y y y y ε ε

n

tt

n

tt

n

tt n

yyn

yyn 1

2

1

2

1

2 ˆ1

)ˆˆ(11 3.3

2

2

1

2

1

2

1

2

1

2

1

2

1

2

1)()1(

ˆ)1(

)()1(

)ˆˆ()1(

)()1(

)()1(

yy

yn

tt

n

tt

n

tt

n

tt

n

tt

n

tt

ss

s

s

yyn

n

yyn

yyn

yyn

yyn

TEMA 3

Page 46: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 46

3. ESTIMACIÓN DEL MODELO LINEAL GENERAL3.3. Coeficiente de determinación

Debido a que las varianzas, por definición, no pueden ser negativas, entonces el coeficiente de determinación debe ser un número positivo. Además, tal y como se desprende de la expresión (3.3) de la diapositiva anterior, la varianza muestral de la variable dependiente tiene que ser mayor o igual que la varianza muestral de la variable dependiente estimada por el método MCO y, debido a ello, el coeficiente de determinación es un número comprendido entre cero y uno. Debido a que R² ϵ [0, 1] entonces, multiplicándolo por 100, el mismo se puede interpretar como un porcentaje, esto es, como el porcentaje de la variabilidad de la variable dependiente que es explicada por la variabilidad de las variables independientes x = (x1, x2, …, xk).

Definición:

Definimos el coeficiente de determinación o R–cuadrado como el cociente entre la varianza muestral de la variable dependiente estimada por MCO y la varianza de la variable dependiente, es decir:

2

2ˆ2

2

1

2

1

2

2 1 también,o, )()1(

)ˆˆ()1(

yy

yn

tt

n

tt

ss

Rs

s

yyn

yynR

TEMA 3

Page 47: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 47

3. ESTIMACIÓN DEL MODELO LINEAL GENERAL3.3. Coeficiente de determinación

Al aumentar el número de variables explicativas en el Modelo Lineal General aumentamos la variabilidad de la variable dependiente estimada por el método MCO y, consecuentemente, provocamos que el R–cuadrado crezca acercándose a la unidad. Pero, sin embargo, puede que la capacidad explicativa de las nuevas variables independientes acerca del comportamiento de la variable dependiente sea inexistente. Por ello se calcula el coeficiente de determinación corregido, que sirve para compararlo con el R²:1. Si son similares en magnitud se concluye que no hay problemas con los grados de

libertad del modelo y el R² puede interpretarse de manera estándar.2. Si son muy diferentes, entonces el R² exagera la capacidad explicativa de las

variables independientes.

Definición:

Definimos el coeficiente de determinación corregido como una medida de bondad del ajuste del modelo econométrico que, a diferencia del coeficiente de determinación, tiene en cuenta los grados de libertad del modelo, penalizando la incorporación de un mayor número de variables explicativas en el mismo. Se calcula como:

)1( 1

1 22R

knn

R

TEMA 3

Page 48: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 48

3. ESTIMACIÓN DEL MODELO LINEAL GENERAL3.4. Distribución de los coeficientes estimados y sus propiedades

En este apartado llegaremos a demostrar que, si se cumplen los supuestos sobre el Modelo Lineal General vistos en el Tema 2, entonces la distribución del vector de coeficientes estimados por MCO es:

A partir de la distribución del estimador del vector de coeficientes estimados por MCO se obtendrá el estadístico pivote que nos servirá para construir intervalos de confianza del verdadero valor de los parámetros poblacionales (desconocidos).

También demostraremos que, si se cumplen determinados supuestos, la matriz de varianzas y covarianzas (MVC de aquí en adelante) de los coeficientes estimados es la más pequeña de todas las MVC entre todos los estimadores lineales e insesgados de β.

Así, debido a que:

y, además, se tiene que:

entonces se podrá decir que el vector de coeficientes estimados por MCO es el estimador lineal e insesgado óptimo de β, cuando se dan los supuestos del Modelo Lineal General.

))( ;(~ˆ 12 XXββ N

ββ )ˆ(E

2 1ˆ( ) ( ) es mínima,MVC β X X

TEMA 3

Page 49: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 49

3. ESTIMACIÓN DEL MODELO LINEAL GENERAL3.4. Distribución de los coeficientes estimados y sus propiedades

Primera demostración: el vector de coeficientes estimados tiene distribución Normal

El estimador por MCO del vector de parámetros poblacionales β es:

W es una matriz de dimensión k × n y es no estocástica, porque uno de los supuestos del Modelo Lineal General es que las variables explicativas contenidas en la matriz X son no estocásticas.

Cada uno de los elementos del vector de coeficientes estimados por MCO es una combinación lineal del vector y. Así, para j = 1, 2, …, k, se tiene que:

donde wj,1, wj,2, …, wj,n son los elementos de la fila j-ésima de la matriz W e y1, y2, …, yn, son los elementos del vector y.

Puesto que el vector y se distribuye como una Normal (debido a que y = Xβ + ε, donde a ε se le supone una distribución Normal, y donde Xβ es un término no estocástico de y, por ser X no estocástica y β un vector de parámetros), entonces cada uno de los coeficientes estimados por MCO es una combinación lineal de Normales y, por lo tanto, es Normal.

Wyy

W

XXXβ

1)(ˆ

nnjjjj ywywyw ,22,11,ˆ

TEMA 3

Page 50: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 50

3. ESTIMACIÓN DEL MODELO LINEAL GENERAL3.4. Distribución de los coeficientes estimados y sus propiedades

Segunda demostración: el vector de coeficientes estimados es insesgado

El estimador por MCO del vector de parámetros poblacionales β es:

Si operamos en dicha expresión, se tiene que:

Si tomamos esperanzas en la expresión anterior, se llega a que:

Pero, por un lado, como el vector de parámetros poblacionales β es un vector de constantes y, por otro, X es una matriz de variables no estocásticas, entonces:

yXXXβ 1)(ˆ

εXXXββ

εXXXβ

I

XXXXβ

yεXβXXXβyXXXβ

1

11

11

)(ˆ

)()(ˆ

)()(ˆ)(ˆ

))(()()ˆ())(()ˆ( 11 εXXXββεXXXββ EEEEE

ββ

0

εXXXββεXXXββ

)ˆ()()()ˆ())(()()ˆ( 11 EEEEEE

TEMA 3

Page 51: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 51

3. ESTIMACIÓN DEL MODELO LINEAL GENERAL3.4. Distribución de los coeficientes estimados y sus propiedades

Tercera demostración: obtención de la MVC del vector de coeficientes estimados

Vamos a demostrar que la MVC del vector de coeficientes estimados por MCO del vector de parámetros poblacionales β tiene la siguiente expresión:

y, además, vamos a demostrar (a partir de la diapositiva 53) que es la mínima MVC de entre todas las MVC de los estimadores lineales e insesgados.

Por definición, la MVC del vector de coeficientes estimados por MCO viene dada por:

Pero, como hemos visto en la demostración de la insesgadez del vector de coeficientes estimados, se tiene que:

1. El vector de coeficientes estimados es insesgado, es decir:

2. El vector de coeficientes estimados se puede expresar en función del vector de parámetros poblacionales de la siguiente manera:

12 )()ˆ( XXβ MVC

))ˆ(ˆ))(ˆ(ˆ()ˆ( βββββ EEEMVC

ββ )ˆ(E

εXXXββεXXXββ 11 )(ˆ)(ˆ

TEMA 3

Page 52: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 52

3. ESTIMACIÓN DEL MODELO LINEAL GENERAL3.4. Distribución de los coeficientes estimados y sus propiedades

Tercera demostración: obtención de la MVC del vector de coeficientes estimados

Si sustituimos estas dos últimas expresiones en la MVC del vector de coeficientes estimados por MCO, se tiene que:

Además, dado el supuesto de que la matriz de variables independientes X es no estocástica, entonces:

Por otro lado, dados los supuestos de no autocorrelación y de homocedasticidad del vector de perturbaciones del Modelo Lineal General se tiene que E(εε´) = σ²I, por lo que:

11

11

)()()ˆ(

)))(()(()ˆ(

)ˆ)(ˆ()ˆ())ˆ(ˆ))(ˆ(ˆ()ˆ(

XXXεεXXXβ

εXXXεXXXβ

ββββββββββ

EMVC

EMVC

EMVCEEEMVC

1111 )()()()ˆ()()()ˆ( XXXεεXXXβXXXεεXXXβ EMVCEMVC

1 1 1 2 1

2 1 1 2 1

ˆ ˆ( ) ( ) ( ) ( ) ( ) ( ) ( )

ˆ ˆ ( ) ( ) ( ) ( ) ( )

MVC E MVC

MVC MVC

β X X X εε X X X β X X X IX X X

β X X X X X X β X X

I

TEMA 3

Page 53: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 53

3. ESTIMACIÓN DEL MODELO LINEAL GENERAL3.4. Distribución de los coeficientes estimados y sus propiedades

Cuarta demostración: optimalidad del vector de coeficientes estimados

Por un lado, el vector de coeficientes estimados por MCO viene dado por:

Sabemos que si la matriz X es no estocástica, entonces se cumple que:

Por otro lado, sea b = Cy cualquier otro estimador lineal del vector de parámetros β. Para que b sea insesgado, se tiene que cumplir que CX sea igual a I. Si CX = I, entonces:

Teorema de Gauss-Markov:

Si se cumplen los supuestos del Modelo Lineal General, entonces el vector de coeficientes estimados por MCO es el estimador con menor matriz de varianzas y covarianzas de entre todos los estimadores lineales e insesgados del vector de parámetros poblacionales del modelo.

XXXWWyβ 1)(con ˆ

12 )()ˆ(y )ˆ( XXβββ MVCE

βbβI

CXb

0

εC

XβCb

εXβCbεXβCbCyb

)()()()()(

)()()()()()(

EEEEE

EEEEEE

TEMA 3

Page 54: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 54

3. ESTIMACIÓN DEL MODELO LINEAL GENERAL3.4. Distribución de los coeficientes estimados y sus propiedades

Cuarta demostración: optimalidad del vector de coeficientes estimados

La MVC del estimador b es, por definición:

Pero, suponiendo que efectivamente CX = I, entonces E(b) = β y, además, se tiene que:

Teniendo en cuenta esto, la MVC del estimador b se puede reescribir como:

Puesto que C = W + D (esto sucede siempre), entonces se tiene que:

CεβbCεβbCεβI

CXbεXβCbCyb

)(

))())((()( bbbbb EEEMVC

CCbCICbC

I

εεCb

CεCεbCεCεb

βbβbbbbbbb

22

2

)()()()(

)())(()(

))(()())())((()(

MVCMVCEMVC

EMVCEMVC

EMVCEEEMVC

2 2

2

( ) ( )( ) ( ) ( )( )

( ) ( )

MVC MVC

MVC

b W D W D b W D W D

b WW WD DW DD 4.3

TEMA 3

Page 55: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 55

3. ESTIMACIÓN DEL MODELO LINEAL GENERAL3.4. Distribución de los coeficientes estimados y sus propiedades

Cuarta demostración: optimalidad del vector de coeficientes estimados

Vamos a demostrar, analizando cada matriz de la expresión (3.4) que la MVC del estimador lineal genérico b es mayor que el del vector de coeficientes estimados por MCO. Así:

1. En primer lugar, puesto que W = (X´X)-1X´, entonces:

2. En segundo lugar:

Como hemos supuesto que CX = I, entonces trasponiendo los dos lados de la igualdad, también se tendrá que X´C´ = I. Además, sabemos que W = (X´X)-1X´, por lo que se tiene que:

121121122 )()()(])][()[( XXXXXXXXXXXXXXWW

WXXXCXXX

WCXXXDXXXDW

112

12122

)()(

)()()(

0XXXXXXXXXXXX

XXXXXXIXXWXXXCXXX

1121112

1112112

)()()()()(

])[()()()()(

TEMA 3

Page 56: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 56

3. ESTIMACIÓN DEL MODELO LINEAL GENERAL3.4. Distribución de los coeficientes estimados y sus propiedades

Cuarta demostración: optimalidad del vector de coeficientes estimados

3. En tercer lugar, puesto que σ²WD´ = 0, entonces si trasponemos esta expresión, se tiene que:

4. En cuarto lugar:

es una matriz semidefinida positiva.

Así, volviendo a la expresión (3.4) se tiene que:

Por lo tanto, podemos concluir que:

es decir, el vector de coeficientes estimados por MCO tiene la menor MVC de los estimadores lineales e insesgados.

0WD0DW0DW 222 )(

)())(( 222 WWCWWCCCWCWCDD

2 2 2 2

1

2 1

( ). .( )

( ) ( ) Matriz s.d.p

MVCs d p

MVC

b WW WD DW DD0 0X X

b X X

)()ˆ(s.d.p Matriz)ˆ()( bββb MVCMVCMVCMVC

TEMA 3

Page 57: Presentación Econometría I

TEMA 4INFERENCIA EN EL MODELO LINEAL GENERAL

4.1. Derivación del test de Wald

4.2. Uso del test de Wald

4.3. El estadístico F

4.4. Construcción de intervalos de confianza para β

4.5. Supuestos del Modelo Lineal General y uso de estadísticos

Page 58: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 58

4. INFERENCIA EN EL MODELO LINEAL GENERAL4.1. Derivación del test de Wald

Por un lado, sea A una matriz de dimensión m × k y, por otro lado, sea c un vector de constantes conocidas de dimensión m × 1.

Cualquier hipótesis lineal sobre el vector de parámetros β puede expresarse como Aβ = c.

Si, tal y como derivamos en el Tema 3:

entonces se tiene que:

puesto que:

1. En primer lugar, la esperanza matemática es:

2. En segundo lugar, la matriz de varianzas y covarianzas es:

))( ;(~ˆ 12 XXββ N

))( ;(~ˆ 12 AXXAAββA N

AββAβA )ˆ()ˆ( EE

AXXAA

β

ββββAAββββA

AββAAββAβAβAβAβAβA

12 )(

)ˆ(

)ˆ)(ˆ()ˆ)(ˆ(

)ˆ)(ˆ())ˆ(ˆ))(ˆ(ˆ()ˆ(

MVC

EE

EEEEMVC

TEMA 4

Page 59: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 59

4. INFERENCIA EN EL MODELO LINEAL GENERAL4.1. Derivación del test de Wald

Pero, si efectivamente se tiene que:

entonces se puede demostrar que se cumple que:

donde m es el número de filas de la matriz de coeficientes A o, lo que es lo mismo, es el número de restricciones incluidas en la hipótesis nula del contraste en el que estamos interesados.

Por lo tanto, bajo la hipótesis nula del contraste, es decir, si Aβ = c, la expresión (4.1) se convierte en:

Es a esta última expresión a la que se la conoce como el test de Wald, y sólo es verdad en el caso en que la hipótesis nula se cumpla, es decir, si y sólo si:

))( ;(~ˆ 12 AXXAAββA N

2 1 1 2ˆ ˆ( ) [ ( ) ] ( ) ~ m Aβ Aβ A X X A Aβ Aβ 1.4

2 1 1 2ˆ ˆ( ) [ ( ) ] ( ) ~ m Aβ c A X X A Aβ c

cAβ

2.4

TEMA 4

Page 60: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 60

4. INFERENCIA EN EL MODELO LINEAL GENERAL4.2. Uso del test de Wald

Si, en el Modelo Lineal General, se desean contrastar, conjuntamente, m hipótesis lineales sobre los elementos del vector de parámetros poblacionales desconocidos β, es decir, se desea contrastar si se cumple la hipótesis nula:

actuaremos de una manera u otra en función de si conocemos o no la varianza del término de perturbación del modelo. En general, es bastante irreal suponer que conocemos σ². Por lo tanto, existen dos posibilidades:

1. En primer lugar, cuando conocemos la varianza del término de error del modelo.

2. En segundo lugar, más realista, cuando desconocemos la varianza del término de error del modelo, teniendo que estimarla.

En este apartado veremos, en primer lugar, cómo contrastar hipótesis lineales cuando la varianza del error sea conocida para, a continuación, estudiar cómo hacerlo cuando ésta sea desconocida.

cAβ

TEMA 4

Page 61: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 61

4. INFERENCIA EN EL MODELO LINEAL GENERAL4.2. Uso del test de Wald

Primer caso: conocemos la varianza del error del Modelo Lineal General, σ²

Cuando conocemos la varianza del error del Modelo Lineal General, el contraste de hipótesis se hace como habitualmente.

En primer lugar, calculamos el estadístico de contraste, que viene dado por la expresión:

En segundo lugar, una vez calculado su valor, éste se compara con el valor crítico de una chi-cuadrado con m grados de libertad: si el valor del estadístico se encuentra a la izquierda del valor crítico, entonces no se rechaza la hipótesis nula; si, por el contrario, cae a la derecha, se rechaza H0 a favor de la hipótesis alternativa.

1 1

2

ˆ ˆ( ) [ ( ) ] ( )

Aβ c A X X A Aβ c

2. . ( %)m

v c

%1

0 de rechazo de Zona H0 de rechazo no de Zona H

x

xf

%

TEMA 4

Page 62: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 62

4. INFERENCIA EN EL MODELO LINEAL GENERAL4.2. Uso del test de Wald

Segundo caso: desconocemos la varianza del error del Modelo Lineal General, σ²

Cuando desconocemos la varianza del error del Modelo Lineal General, un paso previo a la realización del contraste de hipótesis consiste en estimar σ². Así, en este caso, más realista, el procedimiento es el siguiente:

1. En primer lugar, estimamos la varianza del error del modelo, a través del siguiente estimador:

Este estimador de la varianza de la perturbación del modelo está basado en el método de los momentos. Se divide por el número de grados de libertad para que el estimador sea insesgado.

2. En segundo lugar, una vez estimado la varianza del error, actuamos como en el caso de varianza del error conocida, usando el siguiente estadístico de contraste:

kn

n

tt

1

2

2

ˆˆ

1 1

2

ˆ ˆ( ) [ ( ) ] ( )

Aβ c A X X A Aβ c

TEMA 4

Page 63: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 63

4. INFERENCIA EN EL MODELO LINEAL GENERAL4.3. El estadístico F

Para el caso en el que la varianza del término de error del modelo, σ², es desconocida, existe un método alternativo al test de Wald expuesto hasta ahora.

Para derivarlo, en primer lugar, tenemos que tener en cuenta (no es difícil de demostrar) que si el término de perturbación del modelo se distribuye como una Normal, con media cero, es homocedástica y no presenta problemas de autocorrelación, es decir, si se cumple que ε ~ N(0; σ²I) , entonces se tiene que:

y es independiente de la expresión (4.2) de la diapositiva 59. Dado que las dos distribuciones chi-cuadrado son independientes, entonces:

22

2

~ˆ)(

kn

kn

1 1

2

ˆ ˆ( ) [ ( ) ] ( )

Aβ c A X X A Aβ c

( )m

n k 2

2

( )n k

1 1

, 2

ˆ ˆ( ) [ ( ) ] ( )~

ˆ m n kFm

Aβ c A X X A Aβ c

TEMA 4

Page 64: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 64

4. INFERENCIA EN EL MODELO LINEAL GENERAL4.3. El estadístico F

El estadístico F se utiliza exactamente de la misma manera que el test de Wald.

Así, para contrastar la hipótesis nula Aβ = c, los pasos que hay que seguir son los siguientes:

1. En primer lugar, se estima el modelo y = Xβ + ε por MCO, obteniéndose tanto el vector de coeficientes estimados de los parámetros β como (X´X)–1.

2. En segundo lugar, se estima la varianza de la perturbación aleatoria del modelo como ya dijimos antes, es decir, como:

3. En tercer lugar, se calcula el estadístico F a través de la expresión obtenida antes:

4. En cuarto y último lugar, se compara con el valor crítico de una distribución F con m grados de libertad en el numerados y n – k grados de libertad en el denominador al nivel de significatividad deseado y se actúa como siempre: si el estadístico cae a la derecha del valor crítico se rechaza H0, no rechazándose si cae a la izquierda.

kn

εε ˆˆˆ 2

1 1

2

ˆ ˆ( ) [ ( ) ] ( )ˆ

Fm

Aβ c A X X A Aβ c 3.4

TEMA 4

Page 65: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 65

4. INFERENCIA EN EL MODELO LINEAL GENERAL4.3. El estadístico F

Primer caso especial: contraste de significatividad individual de parámetros

Cuando sólo estamos interesados en contrastar si un parámetro poblacional determinado es nulo, es decir, si nuestra hipótesis nula:

para un determinado j, como, por ejemplo, en el caso específico de que queramos realizar el contraste de significatividad individual H0: β3 = 0, entonces el valor del estadístico F se convierte en:

lo que es fácil de comprobar que se cumple operando en la expresión (4.3) donde m = 1 y, además:

Pero si se cumple la expresión (4.4) entonces, alternativamente, se tiene que:

0 :0 jH

knFVar

F ,1

3

23 ~

)ˆ(

ˆ

0 ,)( ,)0100( 321 cβA k

4.4

33 3

3

ˆˆ ˆ~ , donde ( ) es la desviación típica de .

ˆ( )n kt t dt

dt

TEMA 4

Page 66: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 66

4. INFERENCIA EN EL MODELO LINEAL GENERAL4.3. El estadístico F

Primer caso especial: contraste de significatividad individual de parámetros

Por lo tanto, el contraste de significatividad individual puede llevarse a cabo, de manera equivalente, a través de una t de Student con n – k grados de libertad. El procedimiento es el siguiente:

1. En primer lugar, se calcula el estadístico de contraste:

Se calcula el valor absoluto del estadístico porque normalmente el contraste de significatividad individual se hace a dos colas, es decir, H1: βj ≠ 0.

2. En segundo lugar, se compara este estadístico con el valor crítico de una tn–k.

ˆ

ˆ( )j

j

tdt

. . ( %)n ktv c

. . ( %)n ktv c

%1

0 de rechazo de Zona H0 de rechazo de Zona H

x

xf

%2 %2

TEMA 4

Page 67: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 67

4. INFERENCIA EN EL MODELO LINEAL GENERAL4.3. El estadístico F

Segundo caso especial: contraste de significatividad global de parámetros

En el Modelo Lineal General, dado por la expresión:

Si, una vez estimado por MCO, supongamos que queremos comprobar si alguna de las variables independientes son capaces de explicar el comportamiento de la variable dependiente, es decir, estamos interesados en realizar el contraste de significatividad global:

donde fijémonos que, en la hipótesis nula, no se incluye el parámetro asociado al término constante del Modelo Lineal General.

En este caso concreto, la expresión del estadístico F se reduce a:

siendo el R² el coeficiente de determinación estudiado anteriormente.

Ntxxxy tktkttt , 2, 1, ,,3,32,21

falsa es :

0 :

01

320

HH

H k

knkFR

R

k

knF

,12

2

~11

TEMA 4

Page 68: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 68

4. INFERENCIA EN EL MODELO LINEAL GENERAL4.4. Construcción de intervalos de confianza para β

La hipótesis βj= βj, que es siempre cierta (por tratarse de una tautología), implica que:

por lo que si operamos en la expresión (4.3) el estadístico de contraste se simplificaría a:

En el caso de que utilicemos el segundo estadístico de contraste propuesto tendríamos que compararlo con el valor crítico de una t de Student con n – k grados de libertad, al nivel de significatividad deseado.

Con esto, se tendrá que:

donde α es el nivel de significatividad deseado. Por lo tanto, el intervalo de confianza al (1 – α)% para el parámetro βj viene dado por:

jcAβ

kn

j

jjkn

j

jj tdt

tFVar

F

~

)ˆ(

ˆ amente,alternativ o, ,~

)ˆ(

)ˆ( ,1

2

/2 /2 /2 /2

/2 /2

ˆPr 1 Pr 1

ˆ( )

ˆ ˆ ˆ ˆ Pr ( ) ( ) 1

j jn k

j

j j j j j

z t z z zdt

z dt z dt

(1 )% /2 /2ˆ ˆ ˆ ˆ ˆ( ) ( ); ( )j j j j jIC z dt z dt

TEMA 4

Page 69: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 69

4. INFERENCIA EN EL MODELO LINEAL GENERAL4.5. Supuestos del Modelo Lineal General y uso de estadísticos

La distribución del estadístico de contraste F analizada anteriormente, que venía dado por la expresión:

se ha deducido sobre la base de dos resultados o supuestos, que son los siguientes:

1. En primer lugar, el vector de coeficientes estimados por MCO se distribuyen de la siguiente manera:

2. En segundo lugar, el vector de perturbaciones o términos de error del Modelo Lineal General son Ruido Blanco, es decir:

Sin embargo:

3. Si no se cumple el primer supuesto, el numerador del estadístico F no se distribuye como una chi-cuadrado con m grados de libertad.

4. Si no se cumple el segundo supuesto, el denominador del estadístico F no se distribuye como una chi-cuadrado con n – k grados de libertad.

1 1

, 2

ˆ ˆ( ) [ ( ) ] ( )~

ˆ m n kF Fm

Aβ c A X X A Aβ c

))( ;(~ˆ 12 XXββ N

) ;(~ 2I0ε N

TEMA 4

Page 70: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 70

4. INFERENCIA EN EL MODELO LINEAL GENERAL4.5. Supuestos del Modelo Lineal General y uso de estadísticos

Incumplimiento del primer supuesto

Si no se cumple el primer supuesto mencionado, es decir, si se tiene que:

lo cual puede ocurrir por uno de los siguientes motivos:

1. El vector de perturbaciones del Modelo Lineal General no se distribuye como una Normal.

2. El vector de variables independientes x son estocásticas.

3. El término de error del Modelo Lineal General presenta heterocedasticidad.

4. El término de error del Modelo Lineal General presenta autocorrelación.

Entonces, tal y como se vio en la derivación del test de Wald, se tiene que:

y, por consiguiente, el estadístico F no se distribuye como una F de Snedecor con m grados de libertad en el numerador y n – k grados de libertad en el denominador.

))( ;(~ˆ 12 XXββ N

1 12

2

ˆ ˆ( ) [ ( ) ] ( )~ m

Aβ c A X X A Aβ c

TEMA 4

Page 71: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 71

4. INFERENCIA EN EL MODELO LINEAL GENERAL4.5. Supuestos del Modelo Lineal General y uso de estadísticos

Incumplimiento del segundo supuesto

Para que se cumpla que:

es necesario que el término de error del Modelo Lineal General sea Ruido Blanco, puesto que, en ese caso, se cumple que:

Este último es un resultado estadístico que dice:

22

2

~ˆ)(

kn

kn

2)(2 ~ Q

Qεεtr

Teorema:

Si el término de error es Ruido Blanco, es decir, si ε ~ N(0; σ2I) y, por otro lado, Q es una matriz idempotente, entonces la forma cuadrática:

se distribuye como una chi-cuadrado con los g.l. iguales a la traza de la matriz Q.

2Qεε

TEMA 4

Page 72: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 72

4. INFERENCIA EN EL MODELO LINEAL GENERAL4.5. Supuestos del Modelo Lineal General y uso de estadísticos

Incumplimiento del segundo supuesto

En nuestro caso, usando el resultado del Teorema anterior, donde la matriz Q se define como Q = M = I – X(X´X)–1X´, siendo M una matriz idempotente de dimensiones n – k, entonces tenemos inmediatamente que:

Pero, dado que el vector de residuos del Modelo Lineal General se puede calcular como:

Entonces, operando en la expresión (4.5) se tiene que:

o, teniendo en cuenta que:

22)(2 ~ kntr

Q

Mεε

Mεε ˆ

5.4

222 ~ˆˆ

kn

εεMεε

22

2

222 ~

ˆ)(ˆˆ : tienese finalmente entonces, ,ˆ)(ˆˆ

ˆˆˆ kn

knkn

kn

εεεε

εε

TEMA 4

Page 73: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 73

4. INFERENCIA EN EL MODELO LINEAL GENERAL4.5. Supuestos del Modelo Lineal General y uso de estadísticos

Cualquier incumplimiento de los supuestos del Modelo Lineal General que lleve a que:

hará que el estadístico F no se distribuya como una F de Snedecor con m g.l. en el numerador y n – k g.l. en el denominador. Y, en particular, si se tiene que:

Hará, en este caso, por vía doble, que el estadístico F no se distribuya como una Fm,n–k, ya que el incumplimiento de los supuestos sobre el vector de perturbaciones ε afectará tanto al numerador como al denominador del estadístico de contraste F.

A la distribución del vector de coeficientes estimados por MCO le afectan los siguientes incumplimientos de los supuestos del Modelo Lineal General:

1. Las variables independientes x son estocásticas.

2. El vector de parámetros poblacionales β no son constantes.

3. La esperanza del vector de parámetros es no nula, E(ε) ≠ 0.

4. Existe heterocedasticidad y/o autocorrelación, es decir, E(εε´) ≠ σ²I.

5. El vector de términos de error no sigue una distribución Normal.

))( ;(~ˆ 12 XXββ N

) ;(~ 2I0ε N

TEMA 4

Page 74: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 74

4. INFERENCIA EN EL MODELO LINEAL GENERAL4.5. Supuestos del Modelo Lineal General y uso de estadísticos

Conclusión y nota final

Si alguno de los supuestos del Modelo Lineal General se incumple y, en particular, si lo hace alguno de los tres supuestos asociados a ε entonces el estadístico F no podrá usarse para contrastar hipótesis o construir intervalos de confianza.

Su uso indebido (al ignorar el incumplimiento del supuesto) llevará a aceptar o a rechazar indebidamente restricciones que harán que especifiquemos mal el modelo. Por otro lado, los intervalos de confianza no contendrán la probabilidad que deseamos, por lo que las decisiones que tomemos a partir de ellas se harán con un riesgo no deseado.

Una incorrecta especificación del modelo, por omisión de alguna variable relevante, puede llevar a sesgos en la estimación de los parámetros asociados a las variables incluidas en el modelo.

Dada la importancia del estadístico de contraste en la especificación del Modelo Lineal General, y dado lo sensible que es este estadístico al incumplimiento de los supuestos sobre el Modelo Lineal General, antes de contrastar ninguna hipótesis es necesario estar seguro de que los supuestos sobre el Modelo Lineal General se cumplen.

TEMA 4

Page 75: Presentación Econometría I

TEMA 5PREVISIÓN CON EL MODELO LINEAL GENERAL

5.1. Cálculo de previsiones puntuales

5.2. Error de previsión

5.3. Previsión por intervalos

Page 76: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 76

5. PREVISIÓN CON EL MODELO LINEAL GENERAL5.1. Cálculo de previsiones puntuales

Sea el modelo finalmente especificado el siguiente:

De la misma manera, sea el modelo estimado por MCO:

con una muestra de n observaciones {(xt,1, xt,2, xt,3, yt): t = 1, 2, …, n}.

Si nuestro interés se centra en prever el valor de yp (donde p denota previsión) entonces, con el modelo estimado, dado por la expresión (5.1), se tendría que su previsión puntual viene determinado por (sustituyendo t por p):

puesto que suponemos que el valor de xp,2 y xp,3 son conocidos (las variables independientes x son no estocásticas, aunque no necesariamente tienen que ser valores que tengamos en la muestra). Escrito en forma matricial se tendría que:

donde:

A este valor predicho de la variable dependiente se le denomina predictor.

TEMA 5

tttt xxy 3,32,21

3,32,21ˆˆˆˆ ttt xxy 1.5

1 2 ,2 3 ,3ˆ ˆ ˆˆ p p py x x

ˆˆ p py x β

,2 ,3 1 2 3ˆ ˆ ˆˆ(1 ) , ( )p p px x β β β x β

Page 77: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 77

5. PREVISIÓN CON EL MODELO LINEAL GENERAL5.2. Error de previsión

El error de previsión de la variable dependiente, denotada como ep, se define como:

es decir, como la diferencia entre el valor real y el estimado por MCO. El error de previsión es estocástico debido a que la estimación de la previsión de yp es estocástica.

El error de previsión, ep, sigue una distribución Normal, ya que el valor estimado de yp se distribuye como una Normal (por los supuestos del Modelo Lineal General).

Además, vamos a demostrar que:

1. En primer lugar, la esperanza matemática del error de previsión es nula, es decir:

2. En segundo lugar, la varianza del error de predicción, Var(ep) viene dado por:

ˆp p pe y y

0pE e

2 2 1[1 ( ) ]p p p p p pVar e E e e E e x X X x

TEMA 5

Page 78: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 78

5. PREVISIÓN CON EL MODELO LINEAL GENERAL5.2. Error de previsión

Esperanza matemática del error de previsión

Por un lado, se tiene que el valor real de la variable dependiente yp será:

mientras que, por otro lado, el valor predicho de la variable dependiente será:

por lo que la esperanza matemática del error de previsión, ep, vendrá dado por:

Puesto que el vector xp es no estocástico y, además, se tiene que:

entonces, finalmente, llegamos a que:

ˆˆ p py x β

p p py x β

ˆ( ) ( )ˆ

ˆ ( )

p p p p p p

p p

E e E y y E ε

E ε

x β x β

x β β

ˆ ˆ( ) ( ) ( ) 0

0p p p p p pE e E ε E E ε E e

x β β x β β

0

ˆ ˆ( ) ( ) ,

( ) 0p

E E

E ε

β β β β β β 0

TEMA 5

Page 79: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 79

5. PREVISIÓN CON EL MODELO LINEAL GENERAL5.2. Error de previsión

Varianza del error de previsión

Por definición, la varianza del error de previsión viene dado por:

Pero, tal y como hemos visto, E(ep) = 0, por lo que Var(ep) = E(epep´) = E(ep2). Entonces,

aplicando la definición de error de previsión y como el vector xp es no estocástico, se tiene que:

Analizando las esperanzas matemáticas de cada uno de los términos de la última igualdad de la expresión (5.2) llegaremos a la varianza del error de previsión, Var(ep).

2[ ( )][ ( )] [ ( )]p p p p p p pVar e E e E e e E e E e E e

2 ˆ ˆ[ ( ) ][ ( ) ]

ˆ ˆ [ ( ) ][( ) ]

ˆ ˆ ˆ ˆ ( )( ) ( ) ( )

ˆ ˆ ( )( )

p p p p p p p p

p p p p

p p p p p p p p

p p

Var e E e e E e E ε ε

E ε ε

E ε ε ε ε

E

x β β x β β

x β β β β x

x β β β β x x β β β β x

x β β β β x x ˆ ˆ( ) ( )p p p p p pE ε E ε E ε ε β β β β x

2.5

TEMA 5

Page 80: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 80

5. PREVISIÓN CON EL MODELO LINEAL GENERAL5.2. Error de previsión

Varianza del error de previsión

En la última igualdad de la expresión (5.2) se tiene que:

1. La esperanza del primer término no es más que la MVC del vector de coeficientes estimados por MCO y, como ya sabemos:

2. La esperanza del segundo término es nula. Como ya demostramos antes:

Entonces, se tiene que:

puesto que, por el supuesto de no autocorrelación entre los términos de error, las esperanzas del último término son nulas.

2 1ˆ ˆ ˆ ˆ ˆ( ) ( )( ) ( )( ) ( )MVC E E β β β β β β β β β X X

εXXXββεXXXββ 11 )(ˆ)(ˆ

1 1

11

2 21 1

ˆ( ) ( ) ( )

( ) ( )

p p p

p

pp

n n p

E ε E ε E ε

E ε

E εE ε

E ε

β β X X X ε X X X ε

X X X X X X 0

TEMA 5

Page 81: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 81

5. PREVISIÓN CON EL MODELO LINEAL GENERAL5.2. Error de previsión

Varianza del error de previsión

3. La esperanza del tercer término también es nula, por ser la traspuesta del segundo término:

4. La esperanza del cuarto término es igual a la varianza poblacional de la perturbación del Modelo Lineal General, puesto que:

donde se ha utilizado el hecho de que εp es un escalar.

Entonces, sustituyendo toda esta información en la expresión (5.2) se tiene que:

ˆ ˆ[ ( ) ] [( ) ]p pE ε E ε

β β β β 0

0

2 2( ) ( ) ( )p p p pE E Var

2 12

2 1 2

( )

ˆ ˆ ˆ ˆ( )( ) ( ) ( ) ( )

( ) ˆ( )( )ˆ

p p p p p p p p p

p p p p p

pp

Var e E E ε E ε E ε ε

Var e Var y VarVarVar y

X X 0 0

x β β β β x x β β β β x

x X X x

TEMA 5

Page 82: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 82

5. PREVISIÓN CON EL MODELO LINEAL GENERAL5.2. Error de previsión

Por lo tanto, hemos demostrado que el error de previsión ep se distribuye de la siguiente manera:

donde:

Si estandarizamos, es decir, si restamos a ep su esperanza matemática y, a todo ello, lo dividimos por su desviación típica, entonces se tiene que:

Además, puesto que:

siendo la última igualdad un estadístico pivote que utilizaremos para calcular intervalos de confianza para yp.

2 2~ (0; ), donde p p p pe N Var e A A

11 ( )p p p A x X X x

2~ (0; 1)p

p

eN

A

22

22

ˆ( )~ , entonces p

n k

en k

( )

p

n k

A

2

2

( )n k 2

pn k

p

et

A 3.5

TEMA 5

Page 83: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 83

5. PREVISIÓN CON EL MODELO LINEAL GENERAL5.3. Previsión por intervalos

Una vez obtenido el estadístico pivote dado por la expresión (5.3), es posible llevar a cabo la previsión por intervalos (calcular un intervalo de confianza) del valor de yp.

A un nivel de significatividad de α% se tiene que:

Para grados de libertad elevados, es decir, cuando n – k es grande, la distribución t de Student se aproxima a una distribución Normal estandarizada.

Utilizando el estadístico pivote y operando:

/2 /2Pr 1n kz t z

/2 /2 /2 /22

2 2/2 /2

2 2/2 /2

Pr 1 Pr 1ˆ

ˆ ˆ Pr 1

ˆ ˆ ˆ Pr 1

pn k

p

p p p

p p p p

ez t z z z

z e z

z y y z

A

A A

A A

2 2/2 /2ˆ ˆ ˆ ˆ Pr 1p p p p py z y y z A A

TEMA 5

Page 84: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 84

5. PREVISIÓN CON EL MODELO LINEAL GENERAL5.3. Previsión por intervalos

Por lo tanto, el intervalo de confianza para yp con un nivel de confianza del (1–α)% será:

siendo la desviación típica del error de previsión:

Pero, al mismo tiempo que podemos estar interesados en construir intervalos de confianza para la previsión de yp, también podemos estar interesados en calcular cuál es la probabilidad de ocurrencia de determinados sucesos como, por ejemplo, Pr(yp > y0), siendo y0 un determinado valor de la variable dependiente y. Si operamos, tendremos que:

probabilidad que puede ser consultada en las tablas de la t de Student con n – k grados de libertad, ya que todos los términos de la misma son conocidos.

2(1 )% /2ˆ ˆp p pIC y y z

A

2ˆp pdt e A

0

0

2 2

0 0

2 2 2

ˆ ˆPr Pr

ˆ ˆ

ˆ ˆ Pr Pr

ˆ ˆ ˆ

p p pp

p p

p p pn k

p p p

y y y yy y

e y y y yt

A A

A A A

TEMA 5

Page 85: Presentación Econometría I

TEMA 6EXTENSIONES

6.1. Restricciones sobre los parámetros

6.2. Mínimos Cuadrados Restringidos (MCR)

6.3. Reflexión sobre los supuestos del Modelo Lineal General

6.4. Estimación Máximo-Verosímil del Modelo Lineal General

Page 86: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 86

6. EXTENSIONES6.1. Restricciones sobre los parámetros

En este apartado partimos de un modelo cuya especificación no es la más adecuada porque contiene:

1. O bien más variables explicativas de las necesarias, es decir, incluye algunas variables x que son irrelevantes o superfluas.

2. O bien existen restricciones lineales del tipo Aβ = c entre los parámetros del modelo que no se han incorporado al mismo.

En este apartado demostraremos dos proposiciones muy importantes:

TEMA 6

Proposición 1:

Si restringimos un modelo con restricciones verdaderas, entonces ganaremos precisión en la estimación de los coeficientes y, por lo tanto, también en la previsión de la variable dependiente y.

Proposición 2:

Si restringimos un modelo con restricciones falsas, entonces perderemos la insesgadez del estimador MCO asociado a los parámetros poblacionales desconocidos del modelo restringido.

Page 87: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 87

6. EXTENSIONES6.1. Restricciones sobre los parámetros

Acerca de la Proposición 1

Supongamos que partimos del siguiente modelo correcto o restringido:

y, sin embargo, especificamos el siguiente modelo incorrecto o sin restringir:

Cuando, efectivamente, el parámetro β3 = 0 entonces, para estimar β1 y β2 es mejor aplicar el método MCO al modelo restringido que al modelo sin restringir, ya que, haciéndolo así, ganaremos precisión en la estimación de β1 y β2.

De la misma manera, supongamos que partimos del siguiente modelo correcto o restringido:

y, sin embargo, especificamos el siguiente modelo incorrecto o sin restringir:

De nuevo, en este caso, es mejor aplicar el método MCO al modelo restringido que al modelo sin restringir. De esta manera la estimación de β1 y β2 y, por lo tanto, de β3 (puesto que β2 = β3) será más precisa.

ttt xy 2,21

tttt xxy 3,32,21

323,2,213,32,21 que puesto ,)( ttttttt xxxxy

tttt xxy 3,32,21

1.6

2.6

TEMA 6

Page 88: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 88

6. EXTENSIONES6.1. Restricciones sobre los parámetros

Acerca de la Proposición 2

Si, por el contrario, el parámetro poblacional β3 ≠ 0 en el modelo dado por la expresión (6.1) y aplicamos el método MCO al modelo restringido yt = β1 + β2xt,2 + εt, entonces los estimadores MCO de los parámetros β1 y β2 serán, por lo general, sesgados.

Pero hay una excepción: el caso en el que la variable indebidamente omitida sea ortogonal a las variables incluidas. Esto es, si, en nuestro ejemplo, se cumple que:

entonces, si estimamos el modelo restringido, pese a que β3 ≠ 0, se seguiría cumpliendo que el estimador MCO del parámetro β2 es insesgado, es decir:

De la misma manera, si en el modelo dado por la expresión (6.2) se tiene que β2 ≠ β3 pero se impone que β2 sea igual a β3, entonces si aplicamos MCO al modelo restringido (incorrectamente especificado, en este caso) se obtendrán estimadores sesgados.

El sesgo de un estimador vendrá dado por:

n

ttt xx

13,2, 0

22 )ˆ( E

)ˆ(~

)~

( jjj ESesgo

TEMA 6

Page 89: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 89

6. EXTENSIONES6.2. Mínimos cuadrados restringidos (MCR)

Estimar un modelo utilizando el método de Mínimos Cuadrados Restringidos (MCR de aquí en adelante) es lo mismo que aplicar el método MCO al modelo restringido y, después, utilizar la restricción para estimar los parámetros que aparecen en el modelo sin restringir.

Alternativamente, puede obtenerse MCR resolviendo el siguiente problema de optimización con restricciones:

es decir, consiste en minimizar la suma de los cuadrados de los residuos pero, a diferencia de cuando se estimaban por MCO, teniendo en cuenta que se imponen una serie de restricciones sobre los parámetros a estimar.

La función auxiliar de Lagrange asociada a este problema de minimización con restricciones es:

siendo λ = (λ1, λ2, …, λm)´ un vector que contiene por elementos tantos multiplicadores auxiliares de Lagrange como restricciones existan.

cbA

bXXbbXyyyεεbb

~ :a sujeto

~~~2~~)

~(

}~

{SMin

)~

(2~~~

2)~

()~

() ;~

( cbAλbXXbbXyyycbAλbλb SL 3.6

TEMA 6

Page 90: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 90

6. EXTENSIONES6.2. Mínimos cuadrados restringidos (MCR)

Las condiciones necesarias de primer orden de óptimo asociadas a (6.3) son:

Si operamos en la primera de las condiciones de primer orden, tenemos que:

Pre-multiplicando esta última expresión por la matriz A, se tiene que:

Despejando el vector de multiplicadores de Lagrange estimado en la expresión anterior:

2 2 ( )( ; ) ˆ ˆ0 2 2 2 0

; 2 2 ( )ˆ0 2( ) 0

L

L

MCR

MCR

y y y Xb b X Xb λ Ab cb λy X β X X λ A

b b

b λ y y y Xb b X Xb λ Ab cAβ c

λ λ

λAXXyXXXβ

λAβXXyX

AλXXβXyAλXXβXy

MCR

MCR

MCRMCR

ˆ)()(ˆ

0ˆˆ

0ˆˆ0ˆ2ˆ22

11

λAXXAβAcλAXXA

β

yXXXAc

βA MCO

MCO

MCRˆ)(ˆˆ)(

ˆ

)(ˆ 111

4.6

)ˆ()(ˆˆ)(ˆ 111MCOMCO βAcAXXAλλAXXAβAc

5.6

TEMA 6

Page 91: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 91

6. EXTENSIONES6.2. Mínimos cuadrados restringidos (MCR)

Finalmente, sustituyendo la expresión (6.5) en la (6.4) llegamos a que:

Vemos que el estimador obtenido por el método MCR es igual al estimador MCO (obtenido del modelo sin restringir) más un término que depende, asimismo, del estimador MCO. Por lo tanto, para calcular el estimador MCR utilizando la expresión (6.6) habría que:

1. Aplicar MCO al modelo sin restringir y obtener el vector de coeficientes estimados por MCO.

2. Calcular, utilizando el vector de coeficientes estimados por MCO anterior, la expresión:

donde la matriz X es la correspondiente al modelo sin restringir, y sumarlo al vector de coeficientes estimados por MCO.

La expresión (6.6) se ha obtenido para poder demostrar tanto la Proposición 1 como la Proposición 2 adelantadas en la diapositiva 86. A continuación, empezaremos demostrando la Proposición 2 y, posteriormente, la Proposición 1.

)ˆ()()(ˆˆ 111MCOMCOMCR βAcAXXAAXXββ

6.6

)ˆ()()(111

MCOβAcAXXAAXX

TEMA 6

Page 92: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 92

6. EXTENSIONES6.2. Mínimos cuadrados restringidos (MCR)

Demostración de la Proposición 2

Tal y como hemos visto:

Sin embargo, ya vimos, al derivar la insesgadez del vector de coeficientes estimados por MCO, que:

con lo cual podemos rescribir la expresión (6.7), y reordenando términos, llegamos a que:

donde L ≡ (X´X)–1 – (X´X)–1A´[A(X´X)–1A´]–1A(X´X)–1.

Proposición 2:

Si restringimos un modelo con restricciones falsas, entonces perderemos la insesgadez del estimador MCO asociado a los parámetros poblacionales desconocidos del modelo restringido.

)ˆ()()(ˆˆ 111MCOMCOMCR βAcAXXAAXXββ

εXXXββMCO 1)(ˆ

7.6

εXLAβcAXXAAXXβ

εXXXβAcAXXAAXXεXXXββMCR

)()()(

)()()()(ˆ

111

11111

8.6

TEMA 6

Page 93: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 93

6. EXTENSIONES6.2. Mínimos cuadrados restringidos (MCR)

Demostración de la Proposición 2

Pero teniendo en cuenta, por un lado, que E(ε) = 0 y, por otro lado, que las matrices A y X son no estocásticas, entonces, tomando esperanzas en la expresión (6.8) se tiene que:

Por lo tanto, existen dos posibilidades:

1. Si Aβ = c, es decir, si la restricción es cierta, entonces MCR es insesgado:

2. Si Aβ ≠ c, es decir, si la restricción es falsa, entonces MCR es sesgado:

)()()(

)()()()(

)()()()ˆ(

111

111

111

AβcAXXAAXXβ

0

εXLAβcAXXAAXXβ

εXLAβcAXXAAXXββMCR

E

EE

ββ

0

AβcAXXAAXXββ MCRMCR

)ˆ()()()()ˆ(111 EE

ββ

0

AβcAXXAAXXββ MCRMCR

)ˆ()()()()ˆ(111 EE

TEMA 6

Page 94: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 94

6. EXTENSIONES6.2. Mínimos cuadrados restringidos (MCR)

Demostración de la Proposición 1

Es decir, la Proposición 1 nos dice que si Aβ = c, entonces el estimador MCR es más eficiente o preciso que el estimador MCO (aplicando ambos estimadores sobre el modelo sin restringir).

Dado que, tal y como se puede ver en la expresión (6.8), cuando Aβ = c, se tiene que:

donde L ≡ (X´X)–1 – (X´X)–1A´[A(X´X)–1A´]–1A(X´X)–1.

Si éste es el caso, la MVC del estimador MCR es:

Proposición 1:

Si restringimos un modelo con restricciones verdaderas, entonces ganaremos precisión en la estimación de los coeficientes y, por lo tanto, también en la previsión de la variable dependiente y.

εXLββεXL

0

AβcAXXAAXXββ MCRMCR

ˆ)()()(ˆ 111

))(()ˆ)(ˆ()ˆ( εXLεXLβββββ MCRMCRMCR EEMVC 9.6

TEMA 6

Page 95: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 95

6. EXTENSIONES6.2. Mínimos cuadrados restringidos (MCR)

Demostración de la Proposición 1

Pero, dado que las matrices L y X son no estocásticas, entonces, operando en la expresión (6.9) se tiene que:

Pero, como LX´XL´ = L (el alumno debe demostrarlo), entonces se tiene que:

Pero, como se tiene que: (i) en primer lugar, σ2(X´X)–1 es la MVC del estimador MCO y, (ii) en segundo lugar, la matriz (X´X)–1A´[A(X´X)–1A´]–1A(X´X)–1 es definida positiva, entonces:

lo cual demuestra la mayor precisión del estimador MCR cuando la restricción es cierta.

LXXLLX

I

εεXLLXεεXLεXLεXLβMCR

2

2

)()())(()ˆ( EEEMVC

1111212

11111222

)()()()(

)()()()()ˆ(

XXAAXXAAXXXX

XXAAXXAAXXXXLLXXLβMCR

MVC

)ˆ()ˆ(

)()()()()ˆ( 1111212

MCOMCR

MCR

ββ

XXAAXXAAXXXXβ

MVCMVC

MVC

TEMA 6

Page 96: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 96

6. EXTENSIONES6.2. Mínimos cuadrados restringidos (MCR)

Comentario final

Restringir un modelo con restricciones ciertas es conveniente ya que se gana precisión en la estimación de los parámetros y, también, como se demuestra en el Tema 5, en la previsión de la variable dependiente y.

Sin embargo, hay que tener en cuenta que introducir restricciones falsas lleva a introducir sesgos en la estimación de los coeficientes.

Nunca sabremos si una determinada restricción es cierta o falsa con certeza, por lo que siempre habrá una probabilidad de errar. Existen dos tipos de errores:

1. Error de Tipo I: consiste en rechazar H0: Aβ = c cuando ésta es verdadera, lo que conduce a una pérdida de eficiencia.

2. Error de Tipo II: consiste en no rechazar H0: Aβ = c cuando ésta es falsa, lo que produce sesgos.

En los dos casos el estadístico F juega un papel fundamental y, por lo tanto, es necesario que todos los supuestos del Modelo Lineal General se cumplan para que el estadístico pueda ser utilizado con garantías de éxito, esto es, con garantías de que no nos engañe más de lo asumido por nosotros (al nivel de significatividad elegido).

TEMA 6

Page 97: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 97

6. EXTENSIONES6.2. Mínimos cuadrados restringidos (MCR)

Comentario final

Existen dos tipos de errores:

1. Error de Tipo I: consiste en rechazar H0: Aβ = c cuando ésta es verdadera, lo que conduce a una pérdida de eficiencia

2. Error de Tipo II: consiste en no rechazar H0: Aβ = c cuando ésta es falsa, lo que produce sesgos.

El error de Tipo I tiene que ver con el nivel de significatividad elegido (1, 5 y 10% son los más habituales en la práctica).

Por su parte, el error de Tipo II tiene que ver con la potencia del contraste de hipótesis. A mayor potencia del contraste, menor será el error de Tipo II. Dicha potencia tiene que ver, entre otras cosas, con:

3. En primer lugar, el número de observaciones de la muestra. Así, a mayor número de observaciones, mayor será la potencia del contraste, y viceversa.

4. En segundo lugar, la precisión del estadístico utilizado. Así, cuanto más preciso sea el estadístico, más potente será el contraste.

TEMA 6

Page 98: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 98

6. EXTENSIONES6.3. Reflexión sobre los supuestos del Modelo Lineal General

En la formulación del Modelo Lineal General se han hecho supuestos sobre:

1. Los parámetros poblacionales desconocidos, β.

2. Las variables explicativas o independientes, x.

3. Las perturbaciones o término de error del modelo, ε.

4. La variable a explicar o variable dependiente, y.

Todos y cada uno de los supuestos tienen efectos sobre las propiedades estadísticas del vector de coeficientes estimados por MCO, así como sobre su distribución y sobre la distribución del estadístico de contraste, por lo que antes de comenzar a utilizar el Modelo Lineal General es necesario investigar si se cumplen o no los supuestos con los que ha sido construido.

En este apartado analizaremos el incumplimiento de los supuestos sobre los parámetros β y sobre las variables independientes x y estudiaremos:

5. Las causas y las consecuencias de los incumplimientos.

6. Cómo detectar cada uno de los incumplimientos de los supuestos.

7. Cómo solucionar los incumplimientos.

TEMA 6

Page 99: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 99

6. EXTENSIONES6.3. Reflexión sobre los supuestos del Modelo Lineal General

Supuesto de parámetros poblacionales, β, constantes (introducción)

Consideremos el siguiente sencillo modelo con un único regresor:

Si el parámetro poblacional ha permanecido constante durante los 50 periodos de la muestra (o con los 50 individuos de la muestra, en función del tipo de datos con el que estemos trabajando), entonces tendremos:

Si éste es el caso se dice que no ha existido cambio estructural. Pero si, por el contrario, β1 cambia a partir de, por ejemplo, el periodo (o individuo) 20, entonces se tendría que:

Si estamos en esta situación se dice que ha habido cambio estructural (o cambio de estructura) a partir del periodo (o individuo) número 20.

50 , ,2 ,1 ,1 txy ttt

. :50 Para

, :1 Para

5050150

1111

xyt

xyt

. :50 Para

, :20 Para

, :91 Para

, :1 Para

5050150

2020120

1919119

1111

xyt

xyt

xyt

xyt

10.6

TEMA 6

Page 100: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 100

6. EXTENSIONES6.3. Reflexión sobre los supuestos del Modelo Lineal General

Supuesto de parámetros poblacionales, β, constantes (causas y consecuencias)

Los cambios estructurales están asociados a hechos relevantes que hacen cambiar el comportamiento de los agentes que es el que crea la relación entre las variables independientes x y la variable dependiente y.

Por ejemplo, si estamos analizando la relación entre los tipos de interés a distintos plazos, entonces el pánico en un periodo de crisis puede ocasionar que una relación que durante años había sido estable entre el tipo de interés a muy corto plazo (1 día, que maneja el Banco Central) y el tipo a más largo plazo (1 año, que se fija en el mercado interbancario), se modifique. Hasta el punto de interrumpir la conexión entre ambos, tal y como sucedió al comienzo de esta última crisis.

Si estimamos por MCO el modelo dado por la expresión (6.10) habiendo cambio estructural, y utilizamos todas las observaciones en la estimación, entonces el coeficiente estimado por MCO del parámetro β1 no será un estimador insesgado ni de β1 ni de γ1 ya que estimar un solo parámetro para el total de la muestra es equivalente a incorporar al verdadero modelo (que es el que tiene dos parámetros, β1 para la primera parte de la muestra, y γ1 para la parte final de la muestra) la restricción falsa de que β1 = γ1 = β. La incorporación de restricciones falsas produce sesgos, como ya vimos anteriormente.

TEMA 6

Page 101: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 101

6. EXTENSIONES6.3. Reflexión sobre los supuestos del Modelo Lineal General

Supuesto de parámetros poblacionales, β, constantes (detección)

Una vez estimado el modelo (6.10) y si durante el periodo de la muestra han ocurrido sucesos destacados que pudieran hacernos pensar en un cambio de estructura, entonces deberíamos investigarlo. Por ejemplo, supongamos que, como hemos hecho antes, a partir del periodo 20 se sospecha que hay un cambio de estructura.

Si es así, ante la sospecha podríamos especificar el siguiente modelo:

donde las variables yt y xt son las mismas que en (6.10), y donde d1t y d2t son variables dicotómicas que toman los posibles valores {0, 1} en función del periodo de la muestra en el que nos encontremos. Así, de esta manera, se tiene que:

Así, se tendría, por ejemplo:

1 1( 1 ) ( 2 ) , 1, 2, , 50 t t t t t ty x d x d t

50, , 21, ,20 si ,1

19, , 2, ,1 si ,02

50, , 21, ,20 si ,0

19, , 2, ,1 si ,11

t

td

t

td tt

1)2 ,01( ,

0)2 ,11( ,

22222222122

18181818118

ddxy

ddxy

11.6

TEMA 6

Page 102: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 102

6. EXTENSIONES6.3. Reflexión sobre los supuestos del Modelo Lineal General

Supuesto de parámetros poblacionales, β, constantes (detección)

El modelo dado por la expresión (6.11) sería el modelo no restringido, frente al modelo restringido, que es el modelo dado por la expresión (6.10), en donde se tendría, por ejemplo:

En el modelo sin restringir (6.11) se puede contrastar, de la manera habitual:

Si no se rechaza la hipótesis nula, entonces no ha habido cambio de estructura. Si, por el contrario, si sí se rechaza la hipótesis nula, entonces sí ha existido tal cambio estructural.

El estadístico de contraste es, en este ejemplo concreto:

donde Sr es la suma de cuadrados de los residuos del modelo restringido, mientras que S es la suma de cuadrados de los residuos del modelo sin restringir, es decir:

2222122

1818118 ,

xy

xy

0 : emente,equivalent o, , : 110110 HH

48,1~1

250F

S

SS

m

kn

S

SSF

rr

(6.10) modelo elen ,ˆˆ εεS

TEMA 6

Page 103: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 103

6. EXTENSIONES6.3. Reflexión sobre los supuestos del Modelo Lineal General

Supuesto de parámetros poblacionales, β, constantes (solución)

Si se ha detectado un cambio de estructura como en el ejemplo anterior, entonces habrá que estimar cada modelo con su muestra o, lo que es lo mismo, estimar y utilizar el método MCO restringido.

Así, si partimos del modelo:

y se ha detectado y contrastado un cambio estructural en el comportamiento del parámetro β2 a partir del periodo (o a partir del individuo) t = h, entonces deberíamos construir dos modelos diferentes, el primero de los cuales sería:

mientras que el segundo sería:

y estimar estos dos modelos por MCO. Si no lo hiciéramos de esta manera obtendríamos estimadores sesgados.

Ttxxy tktktt , ,2 ,1 ,,2,21

1 , ,2 ,1 ,,2,21 htxxy tktktt

Thtxxy tktktt , ,2 , ,,2,21

TEMA 6

Page 104: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 104

6. EXTENSIONES6.3. Reflexión sobre los supuestos del Modelo Lineal General

Supuesto de variables independientes, x, linealmente independientes

Cuando se formuló el Modelo Lineal General, se supuso que las variables independientes, x, eran linealmente independientes, es decir, que:

Sin embargo, es posible que este supuesto no se cumpla. Existen dos tipos de incumplimiento de este supuesto:

1. Cuando una variable explicativa (o más de una) es una combinación lineal exacta del resto de las variables independientes, es decir, cuando:

En este caso estamos ante un problema de multicolinealidad exacta.

2. Cuando una variable explicativa (o más de una) es una combinación lineal casi exacta (pero no perfecta) del resto de las variables independientes, es decir, cuando:

En este caso estamos ante un problema de multicolinealidad aproximada.

kkkjjjjj aaaxaxaxaxaxax , , , , 2111112211

12.6 kkkjjjjj aaaxaxaxaxaxax , , , , 2111112211

kkkjjjjj aaaxaxaxaxaxax , , , , 2111112211

TEMA 6

Page 105: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 105

6. EXTENSIONES6.3. Reflexión sobre los supuestos del Modelo Lineal General

Multicolinealidad exacta (causas y consecuencias)

Las causas más probables por las que se produce la multicolinealidad exacta son las siguientes:

1. Cuando ha existido un error en la especificación del modelo. Por ejemplo, si incluimos como variables independientes del modelo (todas ellas medidas en minutos a la semana): sleep, que mide cuánto duerme una persona; work, que mide cuánto trabaja una persona; y leisure, que mide cuánto dedica al ocio una persona, y una persona tiene que emplear su tiempo a una de estas tres actividades en cada instante, entonces es obvio que la información de cada una de las variables está contenida en las otras dos.

2. Por casualidad. Durante el periodo muestral, y por mero azar, se ha dado la relación (6.12). Esto suele ocurrir cuando el tamaño de la muestra es pequeño.

En caso de tener multicolinealidad exacta, el estimador MCO del vector de parámetros β tiene infinitas soluciones, porque el sistema de ecuaciones normales:

tiene infinitas soluciones, al haber más incógnitas que ecuaciones independientes. yXβXX ˆ)(

TEMA 6

Page 106: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 106

6. EXTENSIONES6.3. Reflexión sobre los supuestos del Modelo Lineal General

Multicolinealidad exacta (detección y solución)

En la práctica, la mayoría de los paquetes econométricos, cuando se encuentran con un problema de multicolinealidad exacta, no serán capaces de invertir la matriz (X´X), y nos avisarán de una u otra manera. Así, por ejemplo, EViews nos mostrará el siguiente mensaje de error:

Para solucionar el problema de la multicolinealidad exacta: (i) en el caso de que el problema se deba a un error en la especificación del modelo, la solución pasa por eliminar del modelo una de las variables independientes con problemas y; (ii) si la multicolinealidad exacta es consecuencia de un tamaño muestral excesivamente pequeño y se da por casualidad, la solución pasa por aumentar la muestra.

TEMA 6

Page 107: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 107

6. EXTENSIONES6.3. Reflexión sobre los supuestos del Modelo Lineal General

Multicolinealidad aproximada (causas y consecuencias)

Las causas más habituales por las que se produce la multicolinealidad aproximada son las siguientes:

1. Cuando nos encontramos que el modelo ha sido estimado con un tamaño muestral reducido.

2. Cuando las variables explicativas x tienen, cada una de ellas, poca información independiente sobre la variable a explicar y.

3. Cuando se han incluido variables independientes que son irrelevantes o superfluas en el modelo.

Las principales consecuencias de encontrarnos con el problema de la multicolinealidad aproximada son las dos siguientes:

4. Los parámetros poblacionales se estiman con poca precisión, lo cual provoca que los intervalos de confianza sean excesivamente amplios.

5. El estadístico t tiende a no rechazar la hipótesis nula H0: βj = 0 y, por lo tanto, existe el peligro de eliminar variables relevantes del modelo, lo cual, como ya hemos visto, ocasionaría sesgos.

TEMA 6

Page 108: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 108

6. EXTENSIONES6.3. Reflexión sobre los supuestos del Modelo Lineal General

Multicolinealidad aproximada (detección)

Hay dos maneras de detectar un problema de multicolinealidad aproximada:

1. El primero de ellos es cuando muchos o todos los parámetros del vector β no rechazan la hipótesis nula de ausencia de significatividad individual pero, sin embargo, la hipótesis nula del contraste de significatividad global H0: β2 = β3 = … = βk = 0 se rechaza de forma contundente. En este caso es casi seguro que tenemos un problema de multicolinealidad aproximada.

En este caso, se tendrá que:

Si |X´X| ≈ 0, entonces los elementos de (X´X)–1 serán muy grandes y, por lo tanto, tendremos que el estadístico t adopta valores muy pequeños al ser muy grande la desviación típica del coeficiente estimado.

2. El segundo de ellos es cuando regresiones del tipo

con un R2 muy alto, es decir, la información de xj está incluida, en gran parte, en x–j.

XX

XXXXβ

)(ˆ)(ˆ)ˆ( 212 Adj

MVC

tktkjtjjtjttj uxxxxxx ,1,11,12,21,1

TEMA 6

Page 109: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 109

6. EXTENSIONES6.3. Reflexión sobre los supuestos del Modelo Lineal General

Multicolinealidad aproximada (solución)

La solución va a depender, de manera fundamental, de la causa por la que se ha producido la multicolinealidad aproximada. Así:

1. Si estamos en el primer caso, es decir, si tenemos un problema de muestra pequeña, la solución pasa por aumentar el tamaño de la muestra.

2. Si estamos en el segundo caso, es decir, si las variables independientes x tienen, cada una de ellas, poca información sobre la variable dependiente y, no hay ninguna solución generalmente aceptada. Habrá que aceptar el hecho de que los parámetros β no puedan estimarse con precisión y, por lo tanto, deberemos tener cuidado a la hora de suprimir variables del modelo. Si estamos en este caso, tendremos que ser más flexibles o permisivos, y los contrastes habría que llevarlos a cabo con un nivel de significatividad mayor del 5% como, por ejemplo, a niveles del 10 o del 15%.

3. Si estamos en el tercer caso, es decir, si tenemos variables independientes que son superfluas o irrelevantes en el modelo, entonces la solución pasa, exclusivamente, por eliminar las variables irrelevantes.

TEMA 6

Page 110: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 110

6. EXTENSIONES6.4. Estimación Máximo-Verosímil del Modelo Lineal General

Partiendo del Modelo Lineal General escrito en forma matricial:

La función de verosimilitud de y es:

siendo el último término la matriz jacobiana. Así, bajo el supuesto de Normalidad de los términos de error del modelo, ε, se tiene que:

donde se ha tenido en cuenta que, en el Modelo Lineal General, la matriz jacobiana es igual a la unidad.

El logaritmo neperiano de la función de verosimilitud es:

εXβy

y

εεβXyβ

) ,() , ,( 22 ff

)()(2

1exp)2(

)(2

1exp)2() , ,(

2

222

2

2222

XβyXβyI

y

εεεIXyβ

nn

nnf

)()(2

1)ln(

2)2ln(

2) , ,(ln 2

22 XβyXβyXyβ

nnf

TEMA 6

Page 111: Presentación Econometría I

ECONOMETRÍA I – EL MODELO LINEAL GENERAL 111

6. EXTENSIONES6.4. Estimación Máximo-Verosímil del Modelo Lineal General

Los parámetros β y σ2 que maximizan la función de verosimilitud f(β, σ2| y, X) son los mismos parámetros que maximizan el logaritmo neperiano de la función de verosimilitud ln f(β, σ2| y, X), puesto que el logaritmo neperiano es una transformación monótona no decreciente. Pero los parámetros que maximizan ln f(β, σ2| y, X) son los que minimizan el término:

o, lo que es lo mismo, son los parámetros que minimizan el término:

es decir, son los parámetros que minimizan la suma de los cuadrados de los residuos, al igual que el método MCO. Es decir, bajo el supuesto de Normalidad del término de perturbación, los coeficientes estimados por MCO y los estimados por el método de Máxima-Verosimilitud son los mismos.

)()(2

12 XβyXβy

)()( XβyXβy

TEMA 6