ECONOMETRÍA(Bolos del 1 al 10)

157
Bolo Nº1 y 4 AUTOCORRELACION 1. INTRODUCCIÓN En el desarrollo del presente Bolo, se encontrará similitudes en muchos aspectos con el bolo de heteroscedasticidad, puesto que en presencia de autocorrelación y de heteroscedasticidad, los estimadores MCO corrientes, a pesar de ser insesgados, dejan de tener mínima varianza entre todos los estimadores lineales insesgados. En resumen, dejan de ser MELI. El termino autocorrelacion se puede definir como la “correlación entre miembros de series de observaciones ordenadas en el tiempo.” ( Como en información de series de tiempo) o en el espacio ( como en informaciones de corte transversal). En el contexto de regresión, el modelo clásico de regresión lineal supone que no existe tal autocorrelación en las perturbaciones u i . Simbólicamente E (u i u j ) = 0 i j Expresado en forma sencilla, el modelo clásico supone que el término de perturbación relacionado con una observación cualquiera no está influenciado por el término de perturbación relacionado con cualquier otra observación. Por ejemplo, si se está tratando con información trimestral de series de tiempo, para efectuar una regresión de la producción sobre los insumos trabajo y capital y si, por ejemplo hay una huelga laboral que afecta la producción en un trimestre, no hay razón para pensar que esta interrupción afectará la producción de trimestre siguiente. Es decir, si la producción es inferior este trimestre, no hay razón para esperar que ésta sea baja en el siguiente trimestre. En forma similar, si se está tratando con información de corte transversal que involucra la regresión del gasto de consumo familiar sobre el ingreso familiar no se espera que el efecto de un incremento en el ingreso de una familia sobre su gasto de consumo incida sobre el gasto de consumo de otra. Sin embargo, si tal dependencia existe, se tiene autocorrelación. Simbólicamente, E (u i u j ) 0 i j En esta situación, la interrupción ocasionada por una huelga este trimestre puede afectar muy fácilmente la producción del siguiente trimestre, o los incrementos en el gasto de consumo de una familia pueden inducir muy fácilmente a otra familia a aumentar su gasto de consumo para no quedarse atrás de la primera. 1

Transcript of ECONOMETRÍA(Bolos del 1 al 10)

Page 1: ECONOMETRÍA(Bolos del 1 al 10)

Bolo Nº1 y 4 AUTOCORRELACION

1. INTRODUCCIÓN

En el desarrollo del presente Bolo, se encontrará similitudes en muchos aspectos con el bolo de heteroscedasticidad, puesto que en presencia de autocorrelación y de heteroscedasticidad, los estimadores MCO corrientes, a pesar de ser insesgados, dejan de tener mínima varianza entre todos los estimadores lineales insesgados. En resumen, dejan de ser MELI.

El termino autocorrelacion se puede definir como la “correlación entre miembros de series de observaciones ordenadas en el tiempo.” ( Como en información de series de tiempo) o en el espacio ( como en informaciones de corte transversal). En el contexto de regresión, el modelo clásico de regresión lineal supone que no existe tal autocorrelación en las perturbaciones u i. Simbólicamente

E (ui uj) = 0 i jExpresado en forma sencilla, el modelo clásico supone que el término de perturbación relacionado con una observación cualquiera no está influenciado por el término de perturbación relacionado con cualquier otra observación. Por ejemplo, si se está tratando con información trimestral de series de tiempo, para efectuar una regresión de la producción sobre los insumos trabajo y capital y si, por ejemplo hay una huelga laboral que afecta la producción en un trimestre, no hay razón para pensar que esta interrupción afectará la producción de trimestre siguiente. Es decir, si la producción es inferior este trimestre, no hay razón para esperar que ésta sea baja en el siguiente trimestre. En forma similar, si se está tratando con información de corte transversal que involucra la regresión del gasto de consumo familiar sobre el ingreso familiar no se espera que el efecto de un incremento en el ingreso de una familia sobre su gasto de consumo incida sobre el gasto de consumo de otra.Sin embargo, si tal dependencia existe, se tiene autocorrelación. Simbólicamente,

E (ui uj) 0 i jEn esta situación, la interrupción ocasionada por una huelga este trimestre puede afectar muy fácilmente la producción del siguiente trimestre, o los incrementos en el gasto de consumo de una familia pueden inducir muy fácilmente a otra familia a aumentar su gasto de consumo para no quedarse atrás de la primera.Antes de encontrar la razón de la existencia de la autocorrelación, es esencial aclarar algunos aspectos de terminología. Aunque, hoy en día, es práctica común tratar como sinónimos los términos autocorrelación y correlación serial, algunos autores prefieren diferenciar los dos términos.Por ejemplo; Tintner define la autocorrelacion como “correlación rezagada de una serie dada consigo misma, rezagada por un número de unidades de tiempo”, mientras que reserva el término de correlación serial para “correlación rezagada entre dos series diferentes”.Así la correlación entre dos series de tiempo tales como u1,u2,....,u10 y u2, u3,....,u11, donde la primera es igual a la última rezagada un período de tiempo, es autocorrelación, mientras que la correlación entre dos serie de tiempo tales como u1,u2,...u10 y v2,v3,...,v11, donde u y v son dos series de tiempo diferentes, se denomina correlación serial. Aunque la distinción entre los dos términos puede ser de utilidad, en este bolo se considerará como sinónimos.Se puede visualizar algunos de los patrones razonables de autocorrelación u de no autocorrelación, los cuales están dados en la figura (A). Las figuras (A) a hasta d muestran que hay un patrón distinguible entre las u. La figura (A) muetra un patrón cíclico; la figuras (A) b y c sugueren una tendencia lineal hacia arriba o hacia abajo en las perturbaciones; y la figura (A= d indica que tanto términos de tendencia lineal como de tendencia cuadrática están presentes en las perturbaciones.

1

Page 2: ECONOMETRÍA(Bolos del 1 al 10)

Solamente la figura (A) e indica que no hay un patrón sistemático, apoyando el supuesto de no autocorrelación del modelo clásico de regresión linealEntonces;

1) Y = 2) u N3) E (u) = 0

MRLNC 4) V(ui) = E(ui2)= Homoscedasticidad

5) Cov(ui,uj) = E(ui,uj)=0 No autocorrelación5.- “X” es fijo

Si: AUTOCORRELACION

Donde

AUTOCORRELACIONCAUSAS DE LA AUTOCORRELACIÓN:

Auge Auge

Crisis Crisis tiempo

Algunas de las diversas rezones son las siguientes:- Inercia : Una característica relevante de la mayoría de las series de tiempo económicas es la

inercia o lentitud. Como bien se sabe, las series de tiempo tales como el PNB, los índices de precios, la producción, el empleo y el desempleo, presentan ciclos (económicos). Empezando en el fondo de la recesión, cuando se inicia la recuperación económica, la mayoría de estas series empiezan a moverse hacia arriba. En este movimiento, el valor de una serie en un punto en el tiempo es mayor que su valor anterior. Por tanto, existe un momento intrínseco en ellas que continua hasta que algo ocurre (por ejemplo, un aumento en la tasa de interés o en los impuestos o ambos) que hace que estas disminuyan su ritmo. Por tanto, en las regresiones que consideran datos de series de tiempo, es probable que las observaciones sucesivas sean independientes.

- Sesgo de especificación: caso de variables excluidas (Especificación errónea):En el análisis empírico, el investigador frecuentemente empieza con un modelo de regresión razonable que puede no ser más “perfecto”. Después del análisis de regresión, el investigador haría el “examen post-mortem”, para encontrar si los resultados están de acuerdo con las expectativas a priori.De no ser así, se iniciaría “la cirugía”.

2

Depresión

Depresión

Recuperación

Recuperación

Page 3: ECONOMETRÍA(Bolos del 1 al 10)

Frecuentemente, la inclusión de tales variables elimina el patrón de correlación observado entre los residuales. Por ejemplo, supóngase que se tiene el siguiente modelo de demanda:

((1))Donde: Yi = Cantidad de carne de res demandada

X2 = Precio de la carne de res X3 = Ingreso del consumidor X4 = Precio del cerdo t = tiempo

Sin embargo por alguna razón se efectúa la siguiente regresión: ((2))

Ahora, si ((1)), es el modelo “correcto o el “verdadero” o la relación verdadera, efectuar ((2)) equivale a permitir que AutocorrelacionAsí en la medida en que el precio del cerdo afecte el consumo de carne de res, el término de error o de perturbación v reflejará un patrón sistemático, creando así autocorrelación.

AUTOCORRELACION- Especificación incorrecta

Modelo correcto

Modelo incorrecto

Donde: AUTOCORRELACION

- Sesgo de especificación: forma funcional incorrecta; Supóngase que el modelo “verdadero” o correcto en un estudio de costo-producción es el siguiente:

Pero se ajusta el siguiente modelo:

La curva de costo marginal correspondiente al “verdadero” modelo se muestra en la figura ((A)) junto con la curva “incorrecta” de costo lineal.Como se muestre en la figura ((A)), entre los puntos Ay B, la curva de costo marginal lineal sobreestimará consistentemente al costo marginal verdadero, mientras es de esperarse porque el término de perturbación vi es, en realidad, igual a la producción2+ ui, y por tanto, capta el efecto sistemático del término producción2 sobre el costo marginal. En este caso vi reflejará autocorrelación por el uso de una forma funcional incorrecta.

BA

0

--- Fenómeno de la telaraña; La oferta de muchos productos agrícolas refleja el llamado

fenómeno de la telaraña en donde la oferta reacciona al precio con un resago de un período de tiempo debido a que la implementación de las decisiones de oferta toman tiempo. Por tanto, en la siembra de cosechas al principio de este año, los agricultores están influenciados por el precio prevaleciente el año anterior, de tal forma que su función de oferta es:

3

Producción

Cos

to M

argi

nal d

e P

rodu

cció

n

Figura ((1))Sesgo de

especificación:

forma funcional

Page 4: ECONOMETRÍA(Bolos del 1 al 10)

Supóngase que al final del periodo t, el precio Pt resulta ser inferior a Pt-1. Por consiguiente, es muy probable que los agricultores decidan producir en el período t + 1 menos de los que produjeron en el periodo t. Obviamente, en esta situación no se espera que las perturbaciones ui, sean aleatorias porque si los agricultores producen excedentes en el año t , es probable que reduzcan su producción en t +1 y así sucesivamente, conduciendo a un patrón de telaraña.ut ut

0 tiempoAC (+) 0 ut-1

AC (+)

ut ut

t

ut-1

AC(-)

2. ESTIMACIÓN DE MCO EN PRESENCIA DE LA AUTOCORRELACION (MELI EN PRESENCIA DE AC)¿Qué les sucede a los estimadores MCO y a sus varianzas si se introduce autocorrelación en las perturbaciones, suponiendo que E(ui,uj) 0 (i j), pero se conservan todos los demás supuestos del modelo clásico?Para explicar esto tenemos el siguiente modelo de regresión con dos variables:

Modelo originalDonde t denota los datos u observaciones en el tiempo t; obsérvece que ahora se está tratando con series de tiempo.Para orientar el camino, se debe ahora suponer el mecanismo que generan las ut, ya que E(ut * ut+s)

0 (s 0) es muy general como supuesto para ser de alguna utilidad práctica. Como punto de partida, o primera aproximación, se puede suponer que las perturbaciones se generan de la siguiente manera:

Modelo AR(1) (2.1)

Autocorrelacion

Donde Se conoce como el coeficiente de autocovarianza y donde es la perturbación estocástica establecida de tal forma que satisface los supuestos MCO estándar, a saber;

(2.2)

El esquema (2.1) se conoce como un esquema autoregresivo de primer orden y se denota como AR(1). El nombre de autoregresivo, es apropiado puesto que (2.1) puede ser interpretado como la regresión de ui sobre su propio resago un período. Es de primer orden porque solamente ui y su valor pasado inmediato están involucrados, es decir, el rezago máximo es 1.

4

Ausencia de Autocorrelación

Page 5: ECONOMETRÍA(Bolos del 1 al 10)

MODELO AR-1AR- 1 = modelo de autoregresion de primer orden (cuantifica el valor de las variables aleatorias)AR-2 = Modelo de autoregresion de segundo orden.Si el modelo fuera:

MODELO AR-2

Obsérvese que , el coeficiente de autocovarianza, también puede ser interpretado como el coeficiente de autocorrelación de primer orden, o, en forma más precisa, el coeficiente de autocorrelación del rezago t.Lo que (2.1) postula es que el movimiento o desplazamiento en ui consta de dos partes: una parte

, que corresponde a un desplazamiento sistemático y la otra que es puramente aleatoria.Obsérvese que no hay razón a priori por la cual no podamos adoptar un AR(2) o AR(3) o cualquier esquema autorregresivo de orden superior al de (2.1). De hecho, se hubiera podido suponer que ui

es generado por el siguiente mecanismo:Modelo MA(1) (2.3)

Donde v es un término de perturbación aleatorio con media cero y varianzas constante y es una constante tal que . El esquema generador de errores (2.3) es conocido como un media móvil de primer orden o esquema MA(1) porque comprende la obtención del promedio de dos variables aleatorias adyacentes. Es posible considerar también esquemas MA de órdenes mayores. No solo eso, se puede suponer que ut se genera por una mezcla de procesos autorregresivos y de medias móviles. Por ejemplo:

Modelo ARMA(1,1) (2.4)

Es una combinación de los esquemas autorregresivos de primer orden y de media móvil de primer orden.MINIMOS CUADRADOS ORDINARIOS EN PRESENCIA DE AC

5

Page 6: ECONOMETRÍA(Bolos del 1 al 10)

- Cuando se considera la AC Modelo Original

ahora, el estimador MCO de , como es usual es:

a) Es linealb) Insesgado

c) No es de mínima varianza (No eficientes)

MODELO AR-1

En términos de desviaciones y dejan de ser MELI

Deja de ser eficiente

Es insesgado

PROPIEDADES:,

;

Varianza de en presencia de AC es :

(2.5)

6

n

iiYw1

2

^

n

iiuw1

22

^

n

iiuw1

22

^

Page 7: ECONOMETRÍA(Bolos del 1 al 10)

Donde significa varianza de bajo el esquema autorregresivo de primer orden.

Realizando el contraste de esta fórmula y la fórmula corriente en ausencia de autocorrelación:

(2.6)

Una comparación de (2.5) y (2.6) muestra que la primera es igual a la última más un término que depende de , igual que de las covarianzas muestrales entre los valores que toma X. En general, no

se puede decir que la sea menor o mayor que .

MÉTODO DE MINIMOS CUADRADOS GENERALIZADOS Modelo Original (((a)))

AutocorrelacionNaturaleza de la Autocorrelación;

MODELO AR-1

- CUANDO SE CONOCE O LA POBLACIÓNMultiplicando (((a))) por

oPero antes:

(((b)))Restar (((b))) de (((a))):

-

Llegamos al modelo transformado Modelo transformado

Modelo transformadoAplicar MCO al modelo transformado. Tomando en términos de desviación.

7

Es MELI (lineal, insesgado y de mínima varianza)

Page 8: ECONOMETRÍA(Bolos del 1 al 10)

- CUANDO = 0 Ausencia de Autocorrelación

Es al mejor V de todas

= es el coeficiente de AC que cumple un papel de parámetro poblacional y no muestral es un estadístico y no un estadígrafo puede tomar valores dentro de:

3. ¿CÓMO DETECTAR LA AUTOCORRELACION?La autocorrelacion es un problema grave. Por consiguiente, las medidas remédiales son ciertamente apropiadas. Por supuesto, antes de hacer algo, es esencial averiguar si existe autocorrelacion en una situación dada.Se considerarán alguna de las pruebas de Autocorrelación:

3.1) Método Gráfico3.2) Prueba de Aleatoriedad o método de corridas3.3) Prueba de Durbin Watson

3.1 MÉTODO GRAFICOUn autor afirma:La importancia de producir y analizar graficas de los residuos como una parte estándar del análisis estadístico no puede ser enfatizada. Éstas además de proporcionar ocasionalmente un resumen de fácil para entender un problema complejo, permiten un examen simultáneo de la información, considerados en su conjunto, mientras que a la vez ilustran claramente el comportamiento de los casos individuales.

Hay diversas formas de examinar los residuales. Se puede simplemente graficarlos frente al tiempo, a través de una grafica de secuencia de tiempo.

8

Page 9: ECONOMETRÍA(Bolos del 1 al 10)

0 t 0 tAC AC

0 t 0 t

0 t

3.2 PRUEBA DE ALEATORIEDAD O MÉTODO DE CORRIDASConocida también como prueba de Geary esta prueba trata de seleccionar los signos positivos y negativos de los residuos.Ejemplo:

---------++++++………..+++++++

0 t

AC(- - - - - ) (+ + + + + + + ) (- - - - - - - - ) (+ + + + + ) Son 4 corridas (3.2.1)

Una racha se define como una secuencia ininterrumpida de un símbolo o atributo, tal como + ó -.Se expresa además la longitud de una rachacomo el número de elementos en ésta. En la secuencia mostrada en (3.2.1) hay 4 rachas: una racha de 5 signos menos (es decir de longitud 8), una racha de 7 signos más, una racha de 8 signos menos, una racha de 5 signos más. APRA un mejor efecto visual, hemos presentado las diversas rachas en paréntesis.Ahora sea:

nr = número de corridas nr = 4N = número total de observaciones = N1 + N2

N = 25N1 = número de signos + N1 = 12

9

Page 10: ECONOMETRÍA(Bolos del 1 al 10)

N2 = número de símbolos – (es decir, residuales -)N2 = 13

Numero de corridas variable

N E ( );

Donde:

Docimas paramétricas “t”Hipótesis:

Ausencia de AC

Presencia de AC

Intervalo de confianza al 95%

Por consiguiente se tiene:

Si el número de corridas se encuentra en el intervalo se acepta Ausencia de AC.En el ejemplo; N1=12 y N2 =13. Por consiguiente se obtiene:E(nr) = 13,48

= 5,9696

= 2,4433

Por tanto el intervalo de confianza al 95% es;[13,48 1,96(2,4433)] =(8,6911 ; 18,2689)Puesto que el número de rachas es , éste claramente cae por fuera de este intervalo. Por consiguiente, se puede rechazar la hipótesis de que la secuencia observada de los residuales sea aleatoria, con el 95% de confianza. Se rechaza la .

(Esta prueba es recomendable para muestras grandes y )3.3. PRUEBA DE DURBIN – WATSON

La prueba más conocida para detectar la Autocorrelación es la desarrollada por los estadísticos Durbin y Watson. Es comúnmente conocida como el estadístico d de Durbin – Watson. el cual se define de la siguiente manera:

10

Siempre que: N1 > 10 N2 >10

Page 11: ECONOMETRÍA(Bolos del 1 al 10)

Es simplemente la razón de la suma de las diferencias al cuadrado de residuales sucesivos sobre la SRC. Obsérvese que en el numerador del estadístico d el número de observaciones es n-1 porque una observación se pierde al obtener las diferencias consecutivas.Supuestos:

1) El modelo debe contener un término o parámetro independiente.2) La naturaleza de la Autocorrelación es AR-1:

3) Que la Prueba d-w. No se puede aplicar en caso donde exista variables endógenas rezagadas.

Pero:

Entonces:

;

Pero:

11

Page 12: ECONOMETRÍA(Bolos del 1 al 10)

También:

Entonces:

Sus límites son:Presencia de una perfecta No existe correlación Presencia de una perfecta correlación negativa correlación positiva

d = 4 (AC inversa perfecta) d = 2 (Ausencia de AC) d = 0 (AC perfecta positiva)

REGLAS DE DECISIÓN: Estos son los límites de d; cualquier valor d estimado debe caer dentro de estos límites:

ZONA DE ACEPTACIÓN

ó Ausencia de AC

De

0 2 4 d

Dòcima: Ausencia de AC positiva

Presencia de AC positivaDòcima:

Ausencia de AC negativa

Presencia de AC negativaPrueba d de Durbin – Watson: REGLAS DE DECISIONHipótesis nula Decisión Sí

12

Zona de Rechazo de

H0

Zona de

Indecisión

Zona de

IndecisiónZona de

Rechazo de H0

Page 13: ECONOMETRÍA(Bolos del 1 al 10)

No existe autocorrelación positiva Rechazar

No existe autocorrelación positiva No tomar decisión

No existe autocorrelación negativa Rechazar

No existe autocorrelación negativa No tomar decisión

No existe autocorrelación positiva o negativa Se acepta

Despejando: tenemos:

Restricciones o limitaciones para utilizar d;-

1) El modelo debe incluir un parámetro independiente.2) La naturaleza de la AC debe corresponder a; MODELO AR-13) No conviene utilizar la prueba de D-W en modelos que incluyen variables rezagadas del siguiente tipo:

4. MEDIDAS REMEDIALES

El remedio depende del conocimiento que se tenga sobre la naturaleza de la interdependencia existente entre las perturbaciones. Se distingue dos situaciones:

a). Cuando se conoce el coeficiente de AC b). Cuando no se conoce el coeficiente de AC

a). Cuando se conoce el coeficiente de AC 1

El problema de Autocorrelación puede ser resuelto satisfactoriamente si se conoce , el coeficiente de Autocorrelación. Para apreciar esto tomamos en cuenta el modelo de dos variables:

2Si 2 es cierta en el tiempo t, también es cierta en el tiempo t-1. Por tanto:

3 Multiplicando a ambos lados se obtiene:

4Restando 4 de 2 se obtiene:

5Donde en el último paso se hace uso de 1:Se puede expresar 5 como:

6 (Modelo transformado, ya no existe AC)

13

Page 14: ECONOMETRÍA(Bolos del 1 al 10)

Donde

Puesto que satisface todos los supuestos MCO, se puede proceder a aplicar MCO sobre las variables transformadas Y* y X* y obtener estimadores con todas las propiedades óptimas, es decir MELI. En efecto, realizar la regresión de 6 es equivalente a utilizas los mínimos cuadrados generalizados (MCG).

b). Cuando no se conoce el coeficiente de AC Aunque la regresión en diferencias generalizada es de aplicación sencilla, esta regresión generalmente es difícil de efectuar en la práctica porque raramente se conoce. Por consiguiente se requiere diseñar métodos alternativos, algunos de los cuales son los siguientes:

- Método de primera deferencia.Puesto que se encuentra entre 0 y 1, se podrían adoptar dos posiciones extremas:

, no hay Autocorrelación , Autocorrelación positiva o negativa perfecta En realidad, cuando se efectúa una regresión, generalmente se supone que no hay Autocorrelación y luego se deja que la prueba de Durbin- Watson u otras pruebas demuestren si el supuesto es justificado. Sin embargo, si , la ecuación en diferencia generalizada 5 se reduce a la Ecuación en primera diferencia ya que:

7Donde , denominado delta, es el operador de primera diferencia y es un símbolo u operador (igual que el operador E de valor esperado), para diferencias consecutivas de dos valores. Al efectuar la regresión de 7, todo lo que se debe hacer es formar las primeras diferencias de la variable dependiente y explicativa y utilizarlas en el análisis de regresión.Obsérvese una característica importante del modelo en primera diferencia: No hay término de intercepto en él. Por tanto, para efectuar (7), deberá utilizarse el modelo de regresión a través del origen. Pero supóngase que el modelo original fuera:

8Donde t es la variable de tendencia y donde ut sigue un esquema autorregresivo de primer orden. Se puede verificar que la transformación de primera diferencia de (8) es el siguiente:

9

Donde y la ecuación 9 muestra que hay término de intercepto en la forma de primera diferencia, que ésta en contraste con (7).Pero por supuesto, es el coeficiente de la variable de tendencia en el modelo original. Por tanto, la presencia de un término de intercepto en la forma de primera diferencia significa que hay término de tendencia lineal en el modelo original y que el término de intercepto es, en realidad, el coeficiente de la variable de tendencia. Si , por ejemplo, es positivo en (9), significa que hay tendencia hacia arriba en Y después de permitir la influencia de todas las otras variables.En lugar de suponer que , si se supone que , es decir, correlación serial negativa perfecta (lo caul no es típico en las serie de tiempo económicas), la ecuación en diferencia generalizada (5) se convierte ahora en:

14

Page 15: ECONOMETRÍA(Bolos del 1 al 10)

10 (Regresión de promedio móviles de dos

periodos)La transformación de primera diferencia, presentada anteriormente, es bastante popular en la econometría aplicada puesto que es fácil de realizar. Pero obsérvese que esta transformación descansa sobre el supuesto de que ; es decir, que las perturbaciones están correlacionadas positivamente en forma perfecta. Si este no es el caso, el remedio puede ser peor que la enfermedad.

- A través o mediante el estadístico D-W1

AC

MODELO AR-1

2

3

Restar 3 de 1

-

Llegamos al modelo transformado

Donde:

MODELO AR-1

15

Page 16: ECONOMETRÍA(Bolos del 1 al 10)

Debe ser mínimo

Entonces:

OTROS MÉTODOS PARA ESTIMAR Se han estudiado apenas algunos de los métodos comúnmente utilizados para estimar pero esta lista, de ninguna manera es exhaustiva. Por ejemplo se puede utilizar el método de máxima verosimilitud para estimar los parámetros de directamente, sin tener que recurrir a algunas de las rutinas iterativas. Sin embargo, el método de MV comprende procedimientos de estimación no lineales siendo aun más complicados.

Concluimos esta sección con las siguientes observaciones. Los diversos métodos mencionados básicamente corresponden a métodos en dos etapas: En la etapa 1 se obtiene una estimación del valor desconocido de y en la etapa 2 se utiliza esa estimación para transformar las variables con las cuales se estima la ecuación en diferencia generalizada, que es básicamente MCG. Pero, puesto

que se utilizamos en lugar del verdadero valor de , todos estos métodos de estimación se

conocen en la literatura como métodos de mínimos cuadrados generalizados estimados MCGE o factibles.

Bolo Nº 2

INTRODUCCIÓN A LOS MODELOS DE ECUACIONES SIMULTÁNEAS

1.INTRODUCCIÓN

Hasta el momento se han hecho referencia a modelos uniecuacionales, es decir, modelo en los cuales había una sola variable dependiente Y y una o más variables explicativas, las X. En tales modelos, el énfasis estuvo en la estimación y/o la predicción del valor medio de Y condicional a los valores fijos de las variable X. Por consiguiente, la relación causa efecto en esos modelos iba de las X a Y.

Y =Y2 = 2

La relación solo va en un sentido

MODELOS UNIECUACIONALES:

16

X X XX X X

X

Page 17: ECONOMETRÍA(Bolos del 1 al 10)

En los modelos Uniecuacionales, una variable (la variable dependiente Y) es expresada como función lineal de una o más variables ( las variable explicativas, las X). En tales modelo, un supuesto implícito es que la relación causa efecto, de existir, entre Y y X es unidireccional: Las variables explicativas son la causa y la variable dependiente es el efecto.

Yi =f (Xi,ui)

Yi =f (X2i, X3i, ui)

X depende de Y y Y depende de X Hablamos de:

MODELOS DE MÁS DE UNA ECUACIÓN

En las que hay situaciones en las cuales hay influencia bidireccional entre las variables económicas; es decir, una variable económica afecta otra (s) variable(s) económica (s) y, a su vez, es afectada por ésta(s).

En muchas situaciones, la relación causa efecto en un sentido o unidireccional no tiene sentido. Esto sucede cuando Y está determinada por las X y algunas de las X están, a su vez, determinadas por Y.En otras palabras, hay relación en dos sentidos, o simultáneas, entre Y y (algunas de) las X, que hace que la distinción entre variable dependientes y explicativas tenga valor dudoso. Por ello se tiene los modelos de más de una ecuación.

Es mejor reunir un conjunto de variables que puedan ser determinadas simultáneamente mediante el conjunto restante de variables – precisamente lo que se hace en los modelos de ecuaciones simultáneas. En tales modelo, hay más de una ecuación- una para casa una de las variables mutuamente o conjuntamente, dependiente o endógena o. Y, a diferencia de los modelos uniecuacional, en los modelos de ecuaciones simultáneas, no es posible estimar lo parámetros de una ecuación aisladamente sin tener en cuenta la información proporcionada por las demás ecuaciones en el sistema. ¿ Qué sucede si los parámetros de cada ecuación son estimados aplicando, por ejemplo, el método de MCO, sin considerar las otras ecuaciones en el sistema?Sabiendo que uno de los supuestos cruciales del método de MCO es que las variables explicativas X no son no estocásticas o, de serlo (aleatorias), están distribuidas independientemente del término de perturbación estocástico. Si ninguna de estas condiciones se cumple, entonces, los estimadores de mínimos cuadrados no solamente son sesgados, sino también inconsistentes; es decir, a medida que el tamaño de la muestra aumenta indefinidamente, los estimadores no convergen hacia sus verdaderos valores (poblacionales). Así, en el siguiente sistema hipotético de ecuaciones;

17

......

...

................................

Page 18: ECONOMETRÍA(Bolos del 1 al 10)

[ 1 ]

[ 2 ]

Donde Y1 y Y2 son variables mutuamente dependientes, o endógenas y X1 una variable exógena y u1 y u2 son los términos de perturbación estocástica, las variables Y1 y Y2 son ambas estocásticas. Por consiguiente, a menos que pueda demostrarse que la variable explicativa estocástica Y2 en [1] está distribuida independientemente de u1 y que la variable explicativa estocástica Y1 en [2]está distribuida independientemente de u2, la aplicación del MCO clásico a estas ecuaciones individualmente conducirá a estimaciones inconsistentes.

Yi =f (X, u2i ) Modelos interdependientesYi =f (Y, u2i )

Modelo Económico

1) Simplificación de la realidad2) Esta sustentado por una teoría económica3) Esta expresado en términos Matemáticos o probabilísticos o ecométricos

1. - Ecuaciones de comportamiento

2. – Ecuaciones Tecnológicas

3. – Ecuaciones Institucionales o legales 4. – Ecuaciones de Definición5. – Ecuaciones de Equilibrio móvil 0 = 0

1. ESPECIFICACIÓN DE UN MODELO MULTIECUACIONAL (FORMA ESTRUCTURAL)

Para ello tenemos el siguiente ejemplo:

- Modelo Macroeconómico elemental (Modelo Keynesiano de determinación del ingreso)

Donde:C = Gasto de consumoY = Ingreso

18

Admiten v.a.

Son identidadesNo susceptibles a v. a.

Función de consumo:Identidad del ingreso:

[3][4]

Forma Estructural

Ecuación de: Comportamiento Definición

Page 19: ECONOMETRÍA(Bolos del 1 al 10)

Z = Inversión (se supone exógena)S = Ahorrot = Tiempou = Término de perturbación estocástico

y = Parámetros

Restricciones : PMg C

Son parámetros de la forma estructural del modelo.El parámetro se conoce como la Propensión marginal a consumir (PMgC) ( la cantidad de gasto de consumo extra resultante de un dólar extra de ingreso). De la teoría económica se espera que se encuentre entre 0 y 1. La ecuación [3] es la función de consumo (estocástica) y [4] es la identidad de ingreso nacional, que significa que el ingreso total es igual al gasto de consumo total más el gasto de inversión total, entendiendo que el gasto de inversión total es igual al ahorro total. Se tiene en la figura [1].De la función consumo postulada y de la figura [1], es claro que C y Y son interdependientes y que no se espera que Yt [3] sea independiente del término de perturbación porque cuando ut se desplaza (debido a la diversidad de factores contenido dentro del término de error), entonces la función consumo también se desplaza, la cual, a su vez afecta a Yt. Por consiguiente, una vez más el método clásico de mínimos cuadrados no es aplicable a [3]. De aplicarse, los estimadores obtenidos de dicho método serán inconsistentes.

C,Z

45º0 Ingreso nacional Y

Figura [1]; Modelo keynesiano de determinación del ingreso

MRLNC

E (ui2) = = V(Y) =

Cov ( ui,X) = E[ui - E(ui)][Xi - E(Xi)] = E[u(X-X)] = 0

2. FORMA REDUCIDA DEL MODELO: IDENTIFICACIÓN

En este punto se considera la naturaleza y el significado del problema de identificación ( y la manera de resolverlo).

19

Con

sum

o, in

vers

ión

Page 20: ECONOMETRÍA(Bolos del 1 al 10)

Yt + zt = ut

Matriz de variables endógenas Forma estructural del Modelo

En general:

Yit: Variables endógenasZit: Variables Exógenas

Yt + Zt = ut

3. FORMA REDUCIDA DEL MODELO (IDENTIFICACIÓN)

Forma restringida

Sí:

Forma libre

Ejemplo: Modelo Macroeconómico simple

Forma Estructural

20

Sis

tem

a de

E

cuac

ion

es

Sim

ult

ánea

s

Page 21: ECONOMETRÍA(Bolos del 1 al 10)

Primero estimar en su forma reducida y luego en su forma estructural

IDENTIFICACIÓN

Reglas de Identificación:

- Sub identificación ( no existe solución)- Perfectamente Identificada (Solución única) existe solución) - Sobre identificación (hay varias soluciones)

Si la matriz no es singular; se puede resolver

Ambas ecuaciones están perfectamente identificadas.

Ejemplo:

QDt =QS

t

(4)

Reemplazando (4) en (1):

21

(1)

(2)

(3)

Page 22: ECONOMETRÍA(Bolos del 1 al 10)

Forma Reducida

Demanda

22

Forma Estructural

Page 23: ECONOMETRÍA(Bolos del 1 al 10)

(No tiene solución está sub identificada)

Función de Oferta

Condición de orden ( se conoce como la condición necesaria para que la ecuación tenga una solución única

Condición de rango (condición suficiente

Rango.- Determinante no singular con el máximo de filas y columnas independientes

a) Condición de Orden

G = Número de variables endógenas = Variables endógenas presentes en la ecuación= Variables endógenas ausentes en la ecuación

K* = Variables predeterminadas presentes en la ecuación K** = Variables predeterminadas ausentes en la ecuación

+ = G ; K* + K** = K ( número de variables exógenas)

+ K** G-1Pero: = G - = G -

K** G-1 - K** G-1 – (G - ) K** G –1 – G + Sí:

K** < -1 Ecuación Sub identificadaK** = -1 Ecuación Perfectamente IdentificadaK** = -1 Ecuación Sobre Identificada

23

K** –1

Identificación

Page 24: ECONOMETRÍA(Bolos del 1 al 10)

Ejemplo: Modelo Microeconómico Elemental

Demanda

No Existe Solución única

Oferta

Existe Solución única

Demanda (Condición de Orden)

G = 2 ; = 2 ; = 0 ; K* = 1 ; K** = 0

sub identificada ( No tiene solución)

Oferta (Condición de orden)

G = 2 ; = 2 ; = 0 ; K* = 0 ; K** = 1

Perfectamente identificada ( tiene solución)

Del Modelo Macroeconómico Simple:

Función de Consumo:

G = 2 ; = 2 ; = 0 ; K* = 0 ; K** = 1

Exactamente identificada ( tiene solución única)

24

0 < 1

1 = 1

1 = 1

Page 25: ECONOMETRÍA(Bolos del 1 al 10)

b) Condición de Rango

Rango de la Matriz A: Es el Número máximo de columnas linealmente independiente [r (A)]

“Se entiende como el determinante más alto no nulo”

Sí: r < G-1 Subidentificada

Condición de Rango r = G-1 Perfectamente identificada r > G-1 Sobre identificada

Ejemplo: Modelo Macroeconómico Simple

G = 2 G-1 = 2-1 =1 Exactamente identificada

Modelo elemental de Mercado

Forma Estructural

Forma Reducida

25

Page 26: ECONOMETRÍA(Bolos del 1 al 10)

Función de Demanda

No esta identificada

Función de Oferta

Exactamente identificada

4. MÉTODOS DE ESTIMACIÓN

4.1 MÍNIMOS CUADRADOS INDIRECTOS (MCI)

EJEMPLO EN LA ECUACIÓN DE (6) Y (1) (1º ECUACIÓN)

Pero:

Despejar de (9) Despejando de (8)

26

1

11

111121

11

121

1221221211

tttt

tt

t

ttttt

uuuu

uu

u

vuvZZ

Page 27: ECONOMETRÍA(Bolos del 1 al 10)

Aplicando Mínimos cuadrados ordinarios (MCO)

Sabiendo que;

Reemplazando (13) en (14)en (12:

(MELI Directa)

Si:

Si:

27

2

2

ˆ

t

tt

t

tt

z

zy

z

cz

1

11

22

11

ˆ

ˆ

Page 28: ECONOMETRÍA(Bolos del 1 al 10)

Estimadores MCO es MELI

4.2 MÍNIMOS CUADRADOS BIETÁPICOS

- M.C. en dos etapas

PRIMERA ETAPA SÍ:

Reemplazando (5) en (4)

Expresar en términos de desviación:

En (5)

28

4

3

22221

11211

ttt

ttt

vZY

vZC

2

22222ˆ tttt

tt zzyz

zy

Page 29: ECONOMETRÍA(Bolos del 1 al 10)

Utilizando MCO:

SEGUNDA ETAPA:

En (9):

Expresando en términos de desviación del Ct:

Ejemplo: Con los siguientes datos aplicar los Métodos de estimación;

Ct Zt Yt Ct2 zt

2 yt2 ct yt ct zt yt zt

90 20 110 256 49 529 368 112 161

95 23 118 121 16 225 165 44 60

100 25 125 36 4 64 48 12 16

110 26 136 16 1 9 12 4 3

29

Page 30: ECONOMETRÍA(Bolos del 1 al 10)

112 30 142 36 9 81 54 18 27

115 32 147 81 25 196 126 45 70

120 33 153 196 36 400 280 84 120

742 189 931 742 140 1504 1053 319 457

; ; a) MCO (Directos)

b) MCI (Indirecto)

c) MC Bietápicos

EJEMPLO DEL MODELO DE OFERTA Y DEMANDA

Donde: las Variables endógenas Qt

Variables Exógenas Yt

30

Page 31: ECONOMETRÍA(Bolos del 1 al 10)

Demanda:

Oferta:

(*)

Qt

Y X u

(4)

Reemplazando (4) en (1)

(5)

31

Forma reducida o Forma libre que no esta sujeto a

restricción

ttt

ttt

vY

vYQ

22221

11211

11

12

11

2

11

00

11

1121

11

21

11

1001

tttt

tttt

Y

YQ (4)

(5)

ttSt

tttDt

uQ

uYQ

210

1210

ttt

ttttt

uQ

uYQ

201

121

0

Page 32: ECONOMETRÍA(Bolos del 1 al 10)

Bolo Nº 3

REGRESIÓN CON VARIABLES FICTICIAS

1. INTRODUCCIÓN

El propósito de este tema es considerar el papel de las variables explicativas cualitativas en el análisis de regresión. Se demostrará que la inclusión de las variables cualitativas, conocidas como Variables ficticias, hace que el modelo de regresión lineal sea una herramienta extremadamente flexible, capaz de manejar muchos problemas interesantes que se presentan en los estudios empíricos.

32

Regresando Regresor

Cuantitativa

ii uXfY ,

Page 33: ECONOMETRÍA(Bolos del 1 al 10)

Todos los regresores son cualitativas.

Clasificación de Variables:

- ContinuasCuantitativas

- Discretas

Variables

Cualitativas Atributos, que identifica la calidad o la cualidad.

Naturaleza de las variables ficticias: En el análisis de regresión, la variable dependiente está influenciada frecuentemente no sólo por variables que pueden ser fácilmente cuantificadas sobre una escala bien definida ( por ejemplo, sexo, raza color, religión, nacionalidad, guerras, terremotos, huelgas, trastornos políticos y cambios en la política económica gubernamental).

Por ejemplo: manteniendo los demás factores constantes, se ha encontrado que las profesoras universitarias ganan menos que sus colegas masculinos y que las personas de color ganan menos que las blancas. Este patrón puede resultar de la discriminación sexual o racial, pero cualquiera que sea la razón, las variables cualitativas tales como sexo y raza si influyen sobre la variable dependiente y es claro que deben ser incluidas dentro de las explicativas.

Salario = f ( sexo, ui)

- Variables cualitativas; se llaman también;

Variable dicotómica Variable Dummy Variable Ficticia Variable Binaria Variable Pirulin

2. REGRESIÓN CON VARIABLES CUALITATIVAS COMO REGRESORES (ANAVA)

Puesto que las variable cualitativas usualmente indican la presencia o ausencia de una “cualidad” o atributo, tal como femenino o masculino, negro o blanco, o católico o no católico, un método de “cuantificar tales atributos es mediante la construcción de variables artificiales

33

Cuantitativa Cualitativa

ii uXfY ,

Page 34: ECONOMETRÍA(Bolos del 1 al 10)

que pueden adquirir valores de 1 o de 0, el 0 indicando ausencia del atributo y el 1 indicando la presencia (o posesión) de ese atributo.

Donde:

Xi = Variable ficticia

0: Ausencia de un atributo (categoría base) por que sirve para comparaciones

1 : Presencia del Atributo

Media Aritmética de los que no tienen el Atributo

Lo contrario

0

Por ejemplo; El 1 puede indicar que una persona es de sexo masculino o puede designar una de sexo femenino; o el 1 puede indicar que una persona se ha graduado en la universidad y 0 que no lo ha hecho y así sucesivamente.Las variables que adquieren tales valores 0 y 1 se llaman variables ficticias.

Las variables ficticias pueden ser utilizadas en los modelos de regresión en forma tan fácil como las variables cuantitativas. De hecho, un modelo de regresión puede contener variables explicativas que son exclusivamente ficticias o cualitativas, por naturaleza. Tales modelos se denominan modelos de análisis de varianza (ANOVA).

Como ejemplo, considérese el siguiente modelo:

(1)Donde:

Yi = Salario de profesores del Nivel SecundarioXi = Sexo Categorías - Varón

- Mujer

Xi = 1 : Varón 0 : No varón ( Mujer)

Obsérvese que (1), se parece a los modelos de regresión de dos variables, excepto que en lugar de tener una variable cuantitativa X se tiene una variable ficticia Xi . El modelo (1) puede servir para encontrar si el sexo es la causa de cualquier diferencia en el salario de una profesor del nivel secundario, suponiendo, por supuesto, que todas las demás variable tales como la edad, el grado

34

Xi =

Page 35: ECONOMETRÍA(Bolos del 1 al 10)

alcanzado y los años de experiencia se mantienen constantes. Suponiendo que las perturbaciones satisfacen los supuestos usuales del modelo clásico de regresión lineal, de (1) se obtiene:

Categoría base: Mujer

Salario promedio de un profesor de nivel secundario

Salario promedio de una profesora de nivel secundario

Es decir, el término intercepto , da el salario promedio de las profesoras de nivel secundario y el coeficiente pendiente dice en cuánto difiere el salario promedio de un profesor de nivel Secundario del salario promedio de su colega femenina, estando el salario promedio de un profesor de nivel secundario masculino representado por + .

Efectuando la regresión (1) en la forma usual, puede hacerse fácilmente una prueba de la hipótesis nula de que no hay discriminación por sexo ( ) y es posible averiguar si, con base en la prueba t, el estimado es estadísticamente significativo.

Dócima de Hipótesis:

No hay diferencia de salarios

Dócima

Dócima

Donde: Yi = Salario de Profesores de la Educación formal

35

Page 36: ECONOMETRÍA(Bolos del 1 al 10)

Primaria, Secundaria, Universidad

Xi = Educación formal - Primaria - Secundaria - Universitaria

Cuantas variables explicativas se debe introducir en el Modelo:

REGLA:

m = 3 –1 = 2

1 : Educación Secundaria X2i =

0 : No Educación Secundaria

1 : Educación UniversitariaX3i

0 : No Educación Universitaria

Base : Educación Primaria

- APLICACIÓN DE MÍNIMOS CUADRADOS ORDINARIOS

Ej:

Donde:

Yi = Salarios iniciales de ingresantes a la Fuerza Laboral

Xi = Educación Formal Superior

Xi = 1 : Con Post Grado 0 : Sin Post Grado

36

# de variables ficticias en el Modelo igual al # de categorías menos uno

Page 37: ECONOMETRÍA(Bolos del 1 al 10)

Notación

n0 = Tamaño Muestral de Ingresantes a la Fuerza Laboral sin Post Gradon1 = Tamaño Muestral de Ingresantes a la Fuerza laboral con Post Grado

n0 + n1 = n tamaño de la muestra

Media Muestral de salarios de ingresantes sin Post Grado

Media Muestral de salarios de ingresantes con Post Grado

Sí;

(1)

(2)

Pero:

(3)

37

Page 38: ECONOMETRÍA(Bolos del 1 al 10)

(4)

Calculo auxiliar:

1)

n0 veces n1 veces

2)

3)

n0 veces n1 veces

4)

Realizando Operaciones en (3)

38

Page 39: ECONOMETRÍA(Bolos del 1 al 10)

Realizando Operaciones en (4)

Reemplazando (3) en (2):

Operando en (2)

Ejemplo:En la siguiente tabla se presenta la información hipotética sobre los salarios de 7 Profesionales con título de Post – Grado y sin título de Post – Grado. Sean los siguientes datos: n = 7

39

Page 40: ECONOMETRÍA(Bolos del 1 al 10)

Y X (Y- ) (X- ) (Y- )(X- ) (X- )2

70901109080100110650

01100114

-22,857-2,85717,143-2,857-12,8507,14317,1430

-0,57140,42860,4286-0,5714-0,57140,42860,42860

13,0605-1,22457,34751,63257,34653,06157,347538,5714

0,32650,18370,18370,32650,32650,18370,18371,7143

Objetivo de la Investigación:“Diferencias Salariales de Profesionales con título de Post – Grado y sin título de Post – Grado.

Xi = 0 : Sin Post Grado 1 : Con Post Grado

MCO.

40

Page 41: ECONOMETRÍA(Bolos del 1 al 10)

Como lo demuestran estos resultado de la regresión, el salario promedio estimado de los profesionales con título de Post – Grado es 22500 Bs. Y el de los profesionales con título de Post- grado es 80.000 Bs. De la información en la tabla.

= = 20,5953

DÓCIMA DE DIFERENCIA DE MEDIAS

Cuando no se conoce

Además n<30

Donde:

1 0

156,2556,256,2556,25

1001000

275 200

41

Page 42: ECONOMETRÍA(Bolos del 1 al 10)

“t” calculado

Regla de Decisión

Sí:

Dado que:

Por lo tanto: Existe diferencias salariales entre los que poseen título de Post Grado y los que no lo poseen.

Los modelos ANOVA del tipo de (1), aunque son comunes en campos tales como la sociología, la psicología, la educación y la investigación de mercados, no lo son tanto en economía. Típicamente, en la mayor parte de la investigación económica, un modelo de regresión contiene algunas variables explicativas que son cuantitativas y algunas que son cualitativas.

3. REGRESIÓN CON VARIABLES CUANTITATIVAS Y CUALITATIVAS COMO REGRESORES (ANACOV)

Los modelos de regresión que contienen una mezcla de variables cuantitativas y cualitativas se llaman modelos de análisis (ANCOVA) o (ANACOV).

Como ejemplo del modelo ANCOVA, se modifica el modelo (1) de la siguiente manera:

(2)

42

Page 43: ECONOMETRÍA(Bolos del 1 al 10)

C0>0 PMC (Propensión Marginal al consumo)

El modelo (2) contiene una variable cuantitativa (Y) y una variable cualitativa (Z) que tiene dos clases ( o niveles, clasificaciones o categorías) a saber, Época de guerra y Época de paz.

P de la v. Parámetro de la variable cualitativaCuantitativa

Donde.Ct = ConsumoYi = IngresoZt = Efecto temporal

1: Época de guerraZt =

0: Época de paz¿Cuál es el significado de (2)? Suponiendo, como es usual, que , se observa que:

(a) Promedio del consumo en época de guerra

(e) Promedio del consumo en época de paz

Geométricamente, se tiene la situación que se muestra en la figura (A) (como ilustración se supone que ) En palabras, el modelo (2) postula que las funciones Época de guerra y Época de paz con relación al ingreso tienen la misma pendiente , pero interceptos diferentes. En otras palabras, se supone que Promedio del consumo en época de guerra difiere de aquél Promedio del consumo en época de paz.

Ct

Época de GuerraÉpoca de Paz

Yt

Dócima:

Si el supuesto de una pendiente común es valido, una prueba de hipótesis de que las dos regresiones (a) y (e) tienen el mismo intercepto que no hay discriminación en el consumo en época de guerra y paz, se puede hacer fácilmente efectuando la regresión (2) y evaluando la significancia estadística de estimado con base en la prueba t tradicional. Si la prueba t muestra que es estadísticamente significativo, se rechaza la hipótesis nula de que los niveles anuales de consumo promedio en época de guerra y de paz sean iguales.

43

Cambio es la Propensión Marginal al Consumo

Efecto bélico producido por la guerra

Page 44: ECONOMETRÍA(Bolos del 1 al 10)

Antes de proceder, obsérvese las siguientes características del modelo de regresión con variables ficticias considerado anteriormente:

1. para diferenciar las dos categorías, Guerra y paz, se ha introducido solamente una variable ficticia Zi. Si Zi = 1 representa Época de guerra, se sabe que Zi = 0 es Época de paz puesto que solamente hay dos resultados posibles. Por lotanto, es suficiente una variables ficticia para diferencias dos categorías. Supóngase que el modelo de regresión contiene un término de intercepto, si fuera a escribir el modelo (2) como.

Cambio simultáneos en el Nivel de Subsistencia y en la PMC.

(3)

1: Época de guerra HiperinflaciónZt =

0: Época de pazEstabilidad

Época de Guerra

Época de Paz

Dócima:

Entonces, el modelo (3), como está planteado, no puede ser estimado debido a la presencia de colinealidad perfecta entre . Hay diversas formas de resolver este problema, pero la más simple es asignar las variables ficticias en la forma que se hizo para el modelo (1), a saber, utilícese solamente una variable ficticia si hay dos niveles o clases de variables cualitativa. Regla:

44

“Si una variables cualitativa tiene m categorías, introdúzcase solamente m-1 variables ficticias.

Page 45: ECONOMETRÍA(Bolos del 1 al 10)

Por ejemplo Época tiene dos categorías y, por tanto, se introdujo solamente una variable ficticia. Si esta regla no se sigue, se caerá en lo que podría llamarse la trampa de la variable ficticia, es decir, la situación de multicolinealidad perfecta.

2. La asignación de los valores 1 y 0 a las dos categorías, tales como época de guerra y época de paz, es arbitraria en el sentido de que en el ejemplo se hubiera podido asignar

Zi = 1 para Época de paz, y Zi = 0 para época de guerra. En esta situación, las dos regresines obtenidas de (2) serán

(a) Promedio del consumo en época de paz

(e) Promedio del consumo en época de guerra

En contraste con (a) y (e) en los modelo anteriores, dice cuánto difiere el consumo promedio en época de paz del consumo promedio en época de guerra. En este caso si hay discriminación entre ambas entonces se espera que sea negativo, mientras que antes se esperaba que sea positivo. Por consiguiente, al interpretar los resultados de los modelos que utilizan variables ficticias, es de gran importancia saber la forma como los valores de 1 y de 0 han sido asignados.

3. Frecuentemente se hace referencia al grupo, categoría o clasificación a l cual se asigna el valor de 0 como a categoría base, marca fija, control, comparación, referencia o categoría omitida. Esta es la base en el sentido de que se hacen comparaciones con respecto a esa categoría. Así en el modelo (1), la profesora es la categoría base.

4. El coeficiente que compara a la variable ficticia puede llamarse coeficiente de intercepto diferencial porque dice qué tanto difiere el valor del término de intercepto de la categoría que recibe el valor de 1 del coeficiente del intercepto de la categoría base.

BOLO Nº 5

HETEROSCEDASTICIDAD

45

Page 46: ECONOMETRÍA(Bolos del 1 al 10)

1. INTRODUCCION.

La heterocedasticidad es un problema de la población se puede presentar en el modelo de dos variables o en el de k variables.Heterocedasticidad quiere decir desigual varianza, es decir las varianzas no son las mismas que en el caso de homocedasticidad. En símbolos

Obsérvese el subíndice de , que nos recuerda que las varianzas condicionales de = varianza

condicional de no continúan siendo constantes.Como se menciono, uno de los supuestos importantes del modelo clásico de regresión lineal (ó Modelo de Regresión Lineal Normal Clásico MRLNC), es que la varianza de cada término de perturbación condicional a los valores seleccionados de las variables explicativas, es algún

número constante igual a .Este es el supuesto de homoscedasticidad, o igual (homo) dispersión (cedasticidad), es decir igual varianza, simbólicamente:E ( ) = i = 1,2,…….,n

La homoscedasticidad en el modelo de regresión con dos variables, la varianza condicional de

(la cual es igual a la de ), condicional a las dadas, permanece igual sin importar los valores que tome la variable

En tanto que la varianza condicional de .aumenta a medida que aumenta. Aquí, las varianzas

de no son las mismas. Por tanto, hay Heteroscedasticidad. Simbólicamente:

E ( ) =

Obsérvese el subíndice de , que nos recuerda que las varianzas condicionales de (= varianzas

condicionales de ) han dejado de ser constantes.

Para entender la diferencia entre homoscedastidad y heteroscedasticidad, supóngase que en el modelo con dos variables = + + , Y representa el ahorro y X representa el ingreso. A medida que el ingreso aumenta, el ahorro en promedio también aumenta. Pero la varianza del ahorro permanece igual en todos los niveles de ingreso.

Hay diversas razones por las cuales las varianzas de pueden ser variables, algunas de las cuales son las siguientes:

1. Con base de los Modelos de aprendizaje sobre errores, a medida que la gente aprende, con el tiempo, sus errores de comportamiento se hacen menores. En este caso, se espera que se

reduzca.2. A medida que aumenta los ingresos, la gente posee mas ingreso discrecional y, por tanto tiene mayores posibilidades de selección con respecto a la forma de disponer de su ingreso. En consecuencia, es probable que aumente con el ingreso, pues las personas tienen mayores

posibilidades de selección acerca de su comportamiento respecto al ahorro. En forma similar, se espera que las compañías con mayores ganancias presenten mayor variabilidad en sus políticas de dividendos, que las compañías cuyas ganancias son menores. Además, es probable que las empresas orientadas hacia el crecimiento presenten una mayor variabilidad en sus tasas de pago de dividendos que las empresas ya establecidas.

46

Page 47: ECONOMETRÍA(Bolos del 1 al 10)

3. A medida. que mejoran las técnicas de recolección de información, es probable que se

reduzca. Así es probable que los bancos que poseen equipos sofisticados de procesamiento de información cometan menos errores en los extractos mensuales o trimestrales de sus clientes que los bancos que no los posean.4. La Heteroscedasticidad también puede surgir como resultado de la presencia de factores atípicos. Una observación o factor atípico es una observación que es muy diferente (o bien es muy pequeña o es muy grande) con relación a las demás observaciones en la muestra. La inclusión o exclusión de una observación de este tipo, especialmente si el tamaño de la muestra es pequeño, puede alterar sustancialmente los resultados del análisis de regresión.5. Otra fuente de Heteroscedasticidad surge del MCRL (MRLNC) que establece que el modelo de regresión esta correctamente especificado. Aunque se analizaran mas a fondo los errores de especificación en los siguientes capítulos, con mucha frecuencia, lo que parece ser heteroscedasticidad puede deberse al hecho de que algunas variables importantes son omitidas del modelo. Así, en la función de demanda de un bien, si no se incluyen los precios de los bienes que le son complementarios o de los que compiten con este (sesgo de variable omitida), los residuales obtenidos de la regresión pueden dar la clara impresión de que la varianza del error no es constante. Pero si las variables omitidas son incluidas en el modelo, esa impresión puede desaparecer.

ANALISIS GRAFICO DE HOMOCEDASTICIDAD Y HETEROCEDASTICIDAD.Para una mayor comprensión veamos lo que se explico anteriormente, de manera grafica para una mayor comprensión del tema.

DISTRIBUCIÓN HOMOCEDÁSTICA

47

Page 48: ECONOMETRÍA(Bolos del 1 al 10)

DISTRIBUCIÓN HETEROCEDÁSTICA

2. ESTIMACION MCO EN PRESENCIA DE HETEROSCEDASTICIDAD.

Cuando se incluye heterocedasticidad en MCO los estimadores dejan de ser eficientes y por lo mismo dejan de ser MELI.

¿Qué sucede a los estimadores MCO y a sus varianzas si se introduce la heteroscedasticidad permitiendo que E ( ) = pero se conservan todos los demás supuestos del modelos clásico?

Para responder esta pregunta, recuérdese el modelo con dos variables: = + +

Aplicando la formula usual, el estimador MCO de es:

=

= ( 1 )

Pero su varianza esta dada ahora por la siguiente expresión:

var( ) = ( 2 )

Que, obviamente, difiere de la formula usual de varianza obtenida bajo el supuesto de homoscedasticidad, es decir:

var( ) = ( 3 )

Ciertamente, si = para cada i, las dos formulas serán idénticas. ¿Por qué?

Recuérdese que es el mejor estimador lineal e insesgado (MELI) si se mantienen los supuestos

del modelo clásico, incluyendo el de homoscedasticidad. ¿Sigue aun siendo este MELI cuando se elimina solamente el supuesto de homoscedasticidad y se reemplaza por el supuesto de

heteroscedasticidad? Es fácil probar que sigue siendo lineal e insesgado. En realidad, para

establecer el insesgamiento de , no es necesario que las perturbaciones ( ) sean

48

Page 49: ECONOMETRÍA(Bolos del 1 al 10)

homoscedasticas. Realmente, la varianza de homoscedastica o heteroscedastica no juega papel alguno en la determinación de la propiedad de insesgamiento.

Una vez se ha garantizado que continua siendo lineal e insesgado, ¿sigue siendo “eficiente” o “el

mejor”, es decir, tendrá varianza mínima en la clase de los estimadores lineales e insesgados? y

¿dicha varianza mínima estará dada por la ecuación ( 2 )?La respuesta a ambas preguntas es no:

deja de ser el mejor y la varianza mínima ya no esta dada por ( 2 )Entonces, ¿Cuál estimador es MELI en presencia de heteroscedasticidad? la respuesta se da en la siguiente sección.La heterocedasticidad suele ser muy común en datos de Corte Transversal y también se presenta, menos frecuentemente, en series de tiempo.Si se regresiona un modelo a través de Mínimos Cuadrados Ordinarios con presencia de heterocedasticidad, los coeficientes siguen siendo lineales e insesgados pero ya no poseen mínima varianza (eficiencia).

3. EL MÉTODO DE MÍNIMOS CUADRADOS GENERALIZADOS (MCG)

El método de MCO usual no hace uso de la información contenida en la variabilidad desigual de la variable dependiente Y, este método asigna igual peso o importancia a cada observación. Pero existe un método de estimación, conocido como mínimos cuadrados generalizados (MCG), que tiene en cuenta esa información explícitamente y por consiguiente, y por consiguiente es capaz de producir estimadores que son MELI.

Si se conoce la población:

Para ver la forma como esto se logra, considere el modelo de dos variables:

Modelo Original

El cual para facilitar el reordenamiento algebraico, puede escribirse como:

Donde X0i = 1 para cada i. Podemos observar que estas dos formulas son idénticas.Ahora suponemos las varianzas heteroscedásticas:Si; Heteroscedasticidad

Supuesto:Conocemos la población, entonces se conoce

Donde: X0i = 1 Dividimos ambos lados por para obtener:

Modelo transformado

La cual se puede escribir para facilitar exposición así:

Modelo Transformado

49

Page 50: ECONOMETRÍA(Bolos del 1 al 10)

Donde las variables asteriscos son las variables transformadas, obsérvese que la variable aleatoria transformada es:

(Constante)

Heteroscedaticidad Homoscedasticidad

Aplicar MCO al Modelo Transformado.Se denomina MÍNIMOS CUADRADOS GENERALIZADOS

En resumen MCG es MCO sobre las variables transformadas que satisfacen los supuestos estándar de mínimos cuadrados. Los estimadores así obtenidos se conocen como estimadores MCG y son éstos los estimadores que son MELI.Este procedimiento de transformar las variables originales de tal manera que las variables transformadas satisfagan los supuestos del modelo clásico, y de aplicar a continuación MCO se conoce como el método de mínimos cuadrados generalizados MCG. MCG es MCO aplicados sobre las variables transformadas que satisfagan los supuestos tradicionales de los mínimos cuadrados. Los estimadores obtenidos de esta manera se conocen como estimadores de MCG, los cuales son MELI.

- Estimadores de Mínimos Cuadrados Generalizados.El mecanismo de estimación de es el siguiente. Primero se escribe la FRM de:

Convenio:

50

Page 51: ECONOMETRÍA(Bolos del 1 al 10)

(1)

(2)

(1) (2)

Dividiendo (1) entre

;

Tenemos:

(3)

(4)

(5)

Reemplazando (5) en (2):

51

iiiii XwwYw *2

*1

ˆˆ 2*

2*

1ˆˆ

iiiiiii XwXwYXw

Sistema de Ecuaciones Normales

Page 52: ECONOMETRÍA(Bolos del 1 al 10)

Tenemos para es:

Es MELI

En caso de Homoscedasticidad

52

Page 53: ECONOMETRÍA(Bolos del 1 al 10)

4.CONSECUENCIAS DE UTILIZAR MCO EN PRESENCIA DE HETEROSCEDASTICIDAD.

- Considerando la heterocedasticidad .

53

Page 54: ECONOMETRÍA(Bolos del 1 al 10)

Homoscedasticidad Heteroscedasticidad

54

Page 55: ECONOMETRÍA(Bolos del 1 al 10)

MELI

(1)

55

(2)

Page 56: ECONOMETRÍA(Bolos del 1 al 10)

Suponiendo que utilizamos y la formula para la varianza que toma en cuenta la

presencia de heterocedasticidad en forma explicita.

Entonces:

(2) < (1)

Varianza está dada por:

Satisface la propiedad de Mínima Varianza

Pero:

( Heteroscedasticidad)

(Homoscedasticidad)

56

222

22*

ii XXn

nV

Page 57: ECONOMETRÍA(Bolos del 1 al 10)

Pero:

Hasta el momento ya se ha visto, que ambos y son estimadores (lineales)

insesgados: en muestreo repetido, en promedio y serán iguales al verdadero

, es decir ambos son insesgados. Pero se sabe que es el eficiente, es decir, tiene la menor

varianza. ¿Qué sucede con el intervalo de confianza, las pruebas de hipótesis y con otros

procedimientos si se continúa utilizando el estimador MCO, ? Se distinguen dos

situaciones.

a) Desconocer la Heteroscedasticidadb) Reconocer la presencia de Heteroscedasticidad

a) Desconocer la Heteroscedasticidad

Dado que:

(1) > (2)

Existe mayor impresión al utilizar (1) y peor aún si se considera

que:

(1) es sesgado de (2)

Por lo tanto la (1) puede sobre estimar o subestimar (2)

Entonces:Estimación Mínimos Cuadrados Ordinarios (MCO) Ignorando La Heteroscedasticidad.

La situación se toma grave si, además de utilizar , también se sigue utilizando la

formula usual de varianza (homoscedástica) dada en:

57

Page 58: ECONOMETRÍA(Bolos del 1 al 10)

FORMULA (1)

Aun si existe heteroscedasticidad como si se sospecha de su existencia: obsérvese que este es el caso más probable de los dos que aquí se analizan,

En primer lugar, la var( ) dada en la formula (2), es un estimador sesgado de var( )

dada en ala formula (1), es decir, en promedio ésta sobreestima o subestima la ultima y en general no se puede decir si el sesgo es positivo (sobreestimación) o negativo (subestimación) pues este depende de la naturaleza de la relación entre y los valores tomados por la

variable explicativa X, como puede verse claramente en la formula (1). El sesgo surge del

hecho de que , el estimador convencional de , a saber: Deja de ser un

estimador insesgado del último cuando hay presencia de heteroscedasticidad. Como resultado, ya no podemos depender de los intervalos de confianza calculados convencionalmente y de las pruebas t y F tradicionalmente empleadas.

b) Reconocer la presencia de Heteroscedasticidad

Si:

Heteroscedasticidad

En el caso de aplicar M.C.G. tenemos:

<

Estimación Mínimos Cuadrados Ordinarios (MCO) Considerando La Heteroscedasticidad.

Supóngase que se utiliza y se usa la formula de varianza dada en la formula:

FORMULA (2)

58

22

22

i

ii

x

xV

22

ˆi

ii

x

yx

(2)

Page 59: ECONOMETRÍA(Bolos del 1 al 10)

La cual considera explícitamente la heteroscedasticidad. Utilizando esta varianza y suponiendo que los son conocidos, ¿es posible establecer intervalos de confianza y

probar hipótesis con las pruebas t y F usuales? .

La respuesta generalmente es no, pues puede demostrarse que var( )≤ var( ), lo

cual significa que los intervalos de confianza basados en estos últimos serán innecesariamente grandes. Como resultado, es probable que las pruebas t y F nos den

resultados imprecisos en el sentido de que la var( ) es demasiado grande y lo que parece

ser un coeficiente estadísticamente no significativo (puesto que el valor t es mas bajo de lo apropiado), de hecho, puede resultar significativo si se establecen intervalos de confianza correctos con base en el procedimiento MCG.Conclusión; si se persiste en utilizar los procedimientos de pruebas usuales, a pesar de la presencia de heteroscedasticidad, las conclusiones a las cuales se llegue o las inferencias que se hagan pueden ser erróneas.

5. ¿COMO DETECTAR LA HETEROSCEDASTICIDAD?De igual forma que sucede con la multicolinealidad, la pregunta práctica importante es: ¿Cómo se sabe que la heteroscedasticidad está presente en una situación específica? Nuevamente, como en el caso de la multicolinealidad, no existen reglas fuertes y rápidas para detectar la heteroscedasticidad, solamente algunas reglas prácticas.

a) Método gráficoSi no hay información a priori o empírica sobre la naturaleza de la heteroscedasticidad, en la práctica se puede llevar a cabo análisis de regresión bajo el supuesto de que no has heteroscedasticidad y luego hacer un examen post mortem de los residuales elevados al cuadrado para ver si ellos exhiben algún patrón sistemático.

En la practica cuando se obtiene información a priori o empírica acerca de la heterocedasticidad, se puede llevar a cabo el análisis de la regresión sobre el supuesto de que no existe heterocedasticidad y luego realizar un examen posterior de los residuos estimados al cuadrado

para ver si ellos presentan algún patrón sistemático; Aunque y , no son la misma cosa,

pueden usarse como aproximaciones, especialmente cuando la muestra es suficientemente grande.

Ausencia de Heterocedasticidad Heterocedasticidad

59

Page 60: ECONOMETRÍA(Bolos del 1 al 10)

Heterocedasticidad Heterocedasticidad

Heterocedasticidad

b) Prueba de ParkPark formaliza el método gráfico sugiriendo que es algún tipo de función de la variable

explicativa . La forma funcional sugerida por él fue:

Donde es el término de perturbación estocástico.(A)

Si resulta ser estadísticamente significativo, esto sugerirá que hay heteroscedasticidad en los datos. Si resulta ser no significativo, se puede aceptar el supuesto de homoscedasticidad. La prueba de Park es, por tanto, un procedimiento de dos etapas. En la primera etapa se efectúa la regresión de MCO ignorando el interrogante de la heteroscedasticidad. Se obtiene de esta regresión y luego, en

la segunda etapa, se efectúa la regresión (A).Aunque empíricamente la prueba de Park es atractiva, ésta tiene algunos problemas. Goldfeld y Quandt han argumentado que el término de error que entra en al ecuación (A) puede no satisfacer los supuestos MCO y puede en sí mismo ser heteroscedástico. No obstante, es posible utilizar la prueba de Park como un método estrictamente exploratorio.Aplicando MCO obtenemos:

DOCIMA

60

Page 61: ECONOMETRÍA(Bolos del 1 al 10)

HOMOCEDASTICIDAD

HETEROCEDASTICIDAD

SI: ”t” calculado > “t” tablas

SE RECHAZA LA R.C R.A. R.C.

Será significativo si cae en la R.C.

SE ACEPTA LA HETEROCEDASTICIDAD

c) Docima de BARTLETTDocima: Ho: = HOMOSCEDATICIDAD

H1: > HETEROSCEDATICIDAD

BARTLETT plantea es siguiente estadístico:

k = Número de grupos

Donde: i = 1,2…k

n = tamaño de la muestrani = tamaño de submuestras

Si entonces se rechaza la hipótesis nula Ho lo que indica que existe presencia de

Heteroscedasticidad

d) Prueba de Goldfeld –QuandtEste popular método es aplicable si se supone que la varianza heteroscedástica, está

relacionada positivamente con una de las variables explicativas en el modelo de regresión. Por simplicidad, considérese el modelo usual con dos variables:

Supóngase que está relacionado positivamente con en la forma:

El anterior supuesto postula que es proporcional al cuadrado de la variable X.

61

Page 62: ECONOMETRÍA(Bolos del 1 al 10)

Si el supuesto anterior es la relación apropiada, significaría que sería mayor entre mayores

fueran los valores de . Si éste resulta ser el caso, es muy probable que haya heteroscedasticidad en el modelo. Para probar esto explícitamente, Goldfeld y Quandt sugieren los siguientes pasos:Paso1. Ordénense las observaciones de acuerdo con los valores de empezando por el valor de

más bajo (menor a mayor).Paso 2. Omítase las observaciones centrales, donde c se ha especificado a priori y divídanse las observaciones restantes en dos grupos, cada uno de observaciones.Paso 3. Regresionar por MCO cada grupo con el fin de terminar SEC1 y SEC2 que representan la suma de error de cuadrados mas bajos y altos respectivamente (grupo de varianza pequeña y grupo de varianza grande, respectivamente).Paso 4. Calcúlese la razón o el estadístico F:

Si “F”calculado >“F”tablas entonces se rechaza la hipótesis de homoscedasticidad

6.- MEDIDAS REMEDIALESExisten dos enfoques para remediar el problema de heterocedastcidad:

- Cuando se conoce (cuando se conoce la población)

- Cuando no se conoce (cuando no se conoce la población)

Cuando se conoce (cuando se conoce la población)

Si se conoce el método más directo de corregir la heterocedasticidad es a través de los

llamados mínimos cuadrados ponderados, MCP, método en el cual los estimadores obtenidos

son MELI. Pero en muy contadas ocasiones se tiene conocimiento previo de los .

Cuando no se conoce (cuando no se conoce la población)

Se puede considerar diferentes supuestos: para proceder a transformar el modelo de regresión original de tal manera que el modelo transformado cumpla el supuesto de homocedasticidad.

SUPUESTO 1

HETEROCEDASTICIDAD

62

Page 63: ECONOMETRÍA(Bolos del 1 al 10)

MODELO TRANSFORMADO

HOMOCEDASTICIDAD

MODELO ORIGINAL

SUPUESTO 2

HETEROCEDASTICIDAD

Pero:

Entonces:

MODELO TRANSFORMADO

HOMOCEDASTICIDAD

63

Page 64: ECONOMETRÍA(Bolos del 1 al 10)

MODELO ORIGINAL

SUPUESTO 3

MODELO TRANSFORMADO

HOMOCEDASTICIDAD

F.R.P.

F.R.M.

Reemplazando tenemos:

MODELO TRANSFORMADO

HOMOCEDASTICIDAD

SUPUESTO 4: Transformación logarítmica

También:

64

Page 65: ECONOMETRÍA(Bolos del 1 al 10)

Con la transformación logarítmica muy frecuentemente se reduce le problema de heterocedasticidad. Esto se debe a que las transformaciones logarítmicas comprimen las escalas en las que se miden las variables.Para concluir el análisis de las medidas remédiales se debe hacer énfasis en que todas las transformaciones mencionadas previamente son ad hoc esencialmente, estamos especulando

sobre la naturaleza de . De las transformaciones mencionadas anteriormente la que funcione

dependerá de la naturaleza del problema y de la severidad de la heterocedasticidad.

HETEROCEDASTICIDAD

Utilizando esta varianza y suponiendo que se conocen . En este caso no se pueden establecer

intervalos de confianza ni pruebas de hipótesis, puesto que se puede demostrar que

lo cual implica que los intervalos de confianza basados en esta última

serán innecesariamente mayores. Como resultado, las pruebas t y F posiblemente producirán

resultados inexactos puesto que la es excesivamente grande y el que parece a primera

vista ser un coeficiente estadísticamente no significativo, de hecho puede ser significativo si los correctos intervalos de confianza se establecieran con base en el procedimiento de MCG.

- Ignorando la heterocedasticidad.

HETEROCEDASTICIDAD

HOMOCEDASTICIDAD

La situación se complica si no solamente utilizamos , sino que continuamos usando la

formula de la varianza tradicional (homocedastica) aun en el caso en que este

presente o se sospeche que exista heterocedasticidad; obsérvese que al ignorar o no conocer la

heterocedasticidad producirá una varianza dada por . Ante todo,

dada en , hecho que implica que, en promedio, se esta sobrestimando o subestimando esta ultima. En general, no podemos darnos cuenta de si dicho sesgo es positivo o negativo,

porque el depende de la naturaleza de la relación existente entre y los valores que toma la

variable explicativa X.

5.- COMO DETECTAR LA HETEROCEDASTICIDAD

- Método gráfico- Prueba de Park- Criterios de Goldfeld-Quant- Docima de Bartlett

65

Page 66: ECONOMETRÍA(Bolos del 1 al 10)

La mayoría de estos métodos están basados en el examen de los residuos , de los MCO,

puesto que estos son los que observamos y no las perturbaciones . Esperamos que los sean

buenas estimaciones de , los cual se puede cumplir si el tamaño de la muestra es relativamente grande.

- Método grafico.

En la practica cuando se obtiene información a priori o empírica acerca de la heterocedasticidad, se puede llevar a cabo el análisis de la regresión sobre el supuesto de que no existe heterocedasticidad y luego realizar un examen posterior de los residuos estimados al cuadrado

para ver si ellos presentan algún patrón sistemático; Aunque y , no son la misma cosa,

pueden usarse como aproximaciones, especialmente cuando la muestra es suficientemente grande.

66

Page 67: ECONOMETRÍA(Bolos del 1 al 10)

BOLO 6MULTICOLINEALIDAD

1. INTRODUCCON

Uno de los supuestos del modelo clásico de regresión lineal es que no haya multicolinealidad entre variables explicativas, las X.

El termino multicolinealidad se atribuye a Ragnar Frisch en 1934. Originalmente implicaba la existencia de una relación lineal “perfecta o exacta” entre algunas o la totalidad de las variables explicativas de un modelo de regresión.

Multicolinealidad se refiere a la relación de dependencia que puede existir entre las variables explicativas o independientes. Interpretada en términos generales se refiere a una situación en la cual existe una relación lineal exacta o aproximada entre las variables X.

Cuando se toma una muestra podemos encontrar muchas enfermedades entre esas es la multicolinealidad y afecta al supuesto 5 del modelo de regresión lineal normal clásico MRLNC.

1.- Y = 2.- N

MRLNC 3.- E (u u`) = I

4.- = K< n5.- “ ” es una matriz cuyos elementos son fijos

Si los X no son linealmente independientes entonces no son fijos y no se podría encontrar la solución.Para la regresión en k variables, con las variables explicativas

(donde =1 para todas las observaciones de tal manera que se permita la inclusión de la intersección), se dice que existe una relación lineal exacta si se satisfacen las siguientes condiciones:

Donde son constantes tal que no todas sean simultáneamente 0.No obstante, en la actualidad el término multicolinealidad se utiliza en un sentido más amplio para incluir el caso de multicolinealidad perfecta, como también aquella situación en donde las

67

Page 68: ECONOMETRÍA(Bolos del 1 al 10)

variables X están intercorrelacionadas, peor no en forma perfecta, de la siguiente manera:

Donde es un término estocástico de error.Para apreciar la diferencia existente entre multicolinealidad perfecta y multicolinealidad menos que perfecta, supongamos, por ejemplo, que en consecuencia

se puede expresar como:

Lo cual muestra que esta exactamente relacionada en forma lineal con otras variables o que se puede derivar a partir de la combinación lineal de las restantes variables X. En esta situación, el coeficiente de correlación entre la variable y la combinación lineal del lado derecho de

debe ser igual a uno.

En forma similar, el , la ecuación se puede expresar como:

Lo cual muestra que no es exactamente una combinación lineal de las restantes X`s debido a

que también está determinada por el termino del error estocástico .

A propósito podemos observar que la multicolinealidad, de acuerdo con nuestra definición, excluye únicamente las relaciones lineales entre las variables X. Elimina las relaciones no lineales existentes entre ellas entre ellas. Por ejemplo consideremos el siguiente modelo de regresión.

Donde: Y = costo total de producción y X = producción

Es obvio que las variables (producción de cuadrado) y (producción al cubo) están

funcionalmente relacionadas con , pero la relación no es lineal. Por tanto, hablando

estrictamente, modelos similares a no violan el supuesto de

no multicolinealidad. Sin embargo, en aplicaciones concretas el coeficiente de correlación

convencionalmente medido demostrara que , y están estrechamente correlacionadas,

lo cual, dificultara la estimación de los parámetros de con

mayor precisión.¿Por qué supone el modelo clásico de regresión lineal que no existe multicolinealidad entre las X?. El razonamiento es el siguiente:

- Si la multicolinealidad es perfecta en el sentido de , los coeficientes de regresión de las variables X son indeterminados y sus errores estándar son infinitos.

- Si la multicolinealidad es menos que perfecta como en los coeficientes de regresión, aunque

determinados o finitos, poseen errores estándar demasiado grandes, lo cual implica que los coeficientes no se pueden estimar con gran precisión o exactitud.

68

Page 69: ECONOMETRÍA(Bolos del 1 al 10)

Existen diversas fuentes de multicolinealidad. Como afirman Montgomery y Peck, la multicolinealidad puede deberse a los siguientes factores:1.- El método de recolección de información empleado, por ejemplo, la obtención de muestras en un intervalo limitado de valores tomados por las regresoras en la población.2.- Restricciones en el modelo o en la población objeto del muestreo, por ejemplo, en la regresión del consumo de electricidad sobre el ingreso (X2) y el tamaño de las viviendas (X3) hay una restricción física en en la población puesto que las familias con ingresos mas altos generalmente tienen viviendas mas grandes que las familias con ingresos mas bajos.3.- Especificación del modelo, por ejemplo, la adición de términos polinomiales a un modelo de regresión, especialmente cuando el intervalo de la variable X es pequeño.4.- Un modelo sobre determinado. Esto sucede cuando el modelo tiene más variables explicativas que el número de observaciones. Esto podría suceder en investigación médica, donde puede haber un número reducido de pacientes sobre quienes se reúne información respecto a un gran número de variables.

Una razón adicional para la existencia de la multicolinealidad, sobre todo en los datos de series de tiempo, podría ser que las regresoras incluidas en el modelo compartan una tendencia común, es decir, que tosas aumenten o disminuyan a lo largo del tiempo. Por tanto, en la regresión del gasto de consumo sobre el ingreso, la riqueza y la población, las regresoras ingresos, riqueza y población quizá se incrementaran con el tiempo a una tasa aproximadamente igual, con lo cual se presentaría la colinealidad entre dichas variables.

CARACTERISTICAS DE MULTICOLINEALIDAD

a). Es un problema que se genera en la muestra y no en la población.b). Es un problema de grado y no de tipo.

Grados de la multicolinealidad

- Ausencia de multicolinealidad- Alto grado de multicolinealidad.- Multicolinealidad perfecta.

- AUSENCIA DE MULTICOLINEALIDAD

Entonces:

0

- ALTO GRADO DE MULTICOLINEALIDADLa situación en el caso de la multicolinealidad perfecta es un extremo de tipo patológico. Generalmente no existe una relación lineal exacta entre las variables X, especialmente con información relacionada con series de tiempo en Economía. Por tanto, teniendo un modelo con tres variables podemos tener:

69

Page 70: ECONOMETRÍA(Bolos del 1 al 10)

Donde y es un termino de error estocástico, tal que . Porque es este caso

es factible la estimación de los coeficientes de regresión y , por ejemplo, sustituyendo

en la solución para , en el caso del modelo de tres variables, obtenemos:

Si:

AGM

- MULTICOLINEALIDAD PERFECTA

Teniendo:

Pero:

1 EXISTE MULTICOLINEALIDAD PERFECTA

Si:

70

Page 71: ECONOMETRÍA(Bolos del 1 al 10)

MP

2. ESTIMACION EN EL CASO DE MULTICOLINEALIDAD

Se estableció previamente que en el caso de multicolinealidad perfecta, los coeficientes de regresión son indeterminados y sus errores estándar infinitos.Lo cual se puede demostrar fácilmente en términos del modelo de regresión con tres variables. Utilizando la estimación del modelo en forma de desviaciones de sus medias muéstrales. El modelo de regresión con tres variables se puede escribir como:

Se puede demostrar entonces que:

Supóngase que:Donde es una constante diferente de 0. Sustituyendo esto tenemos:

INDETERMINADO

Es una expresión indeterminada comprobando también que es indeterminado.

: Este da la tasa de cambio en el valor promedio de Y a medida que X 2 cambia en una

unidad, manteniendo X3 constante. Pero si X3 y X2 son perfectamente colineales, no hay forma que X3 se mantenga constante: a medida que X2 cambia, también lo hace X3 por el factor λ . Lo que esto significa, entonces, es que no hay forma de desenredar las influencias separadas de X3 y X2 de la muestra dad: para fines prácticos X3 y X2 don distinguibles.

GRAFICO DE BALLENTINE DE MULTICOLINEALIDAD

71

Page 72: ECONOMETRÍA(Bolos del 1 al 10)

a) Ausencia de multicolinealidad b) leve presencia de multicolinealidad r23 = 0 r23 ≈ 0

c) Moderado grado de multicolinealidad d) Alto grado de multicolinealidad r23 ≈ 1

e) Multicolinealidad perfecta

r23 = 1 GRAFICOS DE BALLENTINE

Ausencia de multicolinealidad Bajo nivel de multicolinealidad

Moderado nivel de multicolinealidad Alto grado de multicolinealidad

72

2X 3X2X 3X

2X3X 2X3X Y

Y Y

Y

Y

Page 73: ECONOMETRÍA(Bolos del 1 al 10)

3.- CONSECUENCIAS TEORICAS Y PRACTICAS DE MULTICOLINEALIDAD

- CONSECUENCIAS TEÓRICAS

Recordemos que si satisfacen los supuestos del modelo clásico, los estimadores de MCO de los coeficientes de regresión son MELI.Se puede entonces demostrar que, aun en el caso de multicolinealidad muy alta, aquella situación de casi multicolinealidad, los estimadores de MCO continúan manteniendo su propiedad de ser estimadores MELI.(puesto que la multicolinealidad no vielo por si misma los otros supuestos).No obstante, el problema de la casi multicolinealidad o alta multicolinealidad se presenta frecuentemente en análisis de tipo empírico y presenta problemas de estimación suficientemente importantes para garantizar que le consideremos como una violación al modelo clásico de regresión lineal.

- En primer lugar, es cierto que aun en el caso de casi multicolinealidad los estimadores de MCO continuaran siendo insesgados, siguen siendo MELI. Sin embargo, el insesgamiento es una propiedad de muestras múltiples o de muestreo repetido.

- En segundo lugar, sin embargo y que pesen a que siguen siendo MELI en caso de multicolinealidad en algún grado sus varianzas y covarianzas pese a ser mínimas son exageradamente grandes y en este sentido afectan a la precisión de las estimaciones.

- En tercer lugar, la multicolinealidad es esencialmente en fenómeno muestral (de regresión), en el sentido de que aunque las variables X no estén linealmente relacionadas en la población, pueden relacionarse en la muestra específica que se tenga a mano. En conclusión, nuestra muestra puede no ser suficientemente “rica” para incluir todas las variables X en el análisis.

- CONSECUENCIAS PRÁCTICAS

Los casos de casi multicolinealidad o de alta multicolinealidad pueden traer consigo las siguientes consecuencias:1.- Aun cuando los estimadores MCO son MELI, estos presentan Varianzas y covarianzas amplias o grandes que hacen difícil la estimación precisa.2.- Debido a la consecuencia 1, los intervalos de confianza tienden a ser mucho más amplios. Lo cual propicia una aceptación mas fácil de la “hipótesis nula cero” (es decore ñ verdadero coeficiente poblacional es cero).3.- también debido a la consecuencia 1, la razón t de uno o más coeficientes tiende a ser estadísticamente no significativa.4.- Aun cuando la razón t de uno o más coeficientes sea estadísticamente no significativa, R 2, la medida global de bondad de ajuste, puede ser muy alta.5. Los estimadores MCO y sus errores estándar son sensibles a pequeños cambios en la información.Se da en los tres grados de multicolinealidad:

- AUSENCIA DE MULTICOLINEALIDAD

y son determinadas

Pero:

73

Page 74: ECONOMETRÍA(Bolos del 1 al 10)

Covarianzas:

Si:

- ALTO GRADO DE MULTICOLINEALIDAD .

1.- Las varianzas y covarianzas son exageradamente grandes2.- Los intervalos de confianza son mucho mas amplios consecuentemente existe la tendencia a aceptar la hipótesis nula.3.- El estadístico “t” como consecuencia de las varianzas y covarianzas son exageradamente grandes tiende a ser no significativa.4.- Estadísticos “t” son no significativos pero alto.

y son determinadas

Pero:

Covarianzas:

Si:

74

Page 75: ECONOMETRÍA(Bolos del 1 al 10)

- MULTICOLINEALIDAD PERFECTA.

y son indeterminadas

Intervalos de confianza, AGM- En el modelo de 2 variables:

- En el modelo de k variables:

Dòcimas- Dòcima “t”

Si: R.C R.A. R.C.

AGMEn presencia de AGM entonces el valor de “t” se hace más pequeña y por tanto puede entrar en la región de rechazo cuando tal vez sea de la región de aceptación.

4, ¿COMO DETECTAR LA MULTICOLINEALIDAD?La detección de multicolinealidad es la mitad de la batalla. La otra mitad esta relacionada con hallar la forma de deshacerse del problema

¿Cómo puede conocerse la presencia de colinealidad en cualquier situación dada, especialmente en modelos que contienen mas de dos variables explicativas?. Aquí es útil tener en mente la advertencia de Kmenta:

1.- La multicolinealidad es un problema de grado y no de tipo. La distinción significativa no es entre la presencia y la ausencia de multicolinealidad, sino entre sus diferentes grados y magnitudes.2.- Puesto que la multicolinealidad se refiere a la condición de las variables explicativas, que se supone que no son estocásticas, ella es una característica de la muestra y no de la población.

Lo que tenemos en realidad son ciertas reglas generales, algunas de ellas formales y otras informales, peor solamente reglas generales. Consideremos a continuación algunas de estas.

75

Page 76: ECONOMETRÍA(Bolos del 1 al 10)

1.- Un elevado pero pocas razones t significativasEte es un síntoma “clásico de multicolinealidad”. Si el es alto, digamos 0,8, la prueba F en la mayoría de los casos rechazara la hipótesis de que los coeficientes parciales de las pendientes son simultáneamente iguales a cero. Sin embargo las pruebas t individuales mostraran que ningún coeficiente parcial de las pendientes, o muy pocos de ellos, son estadísticamente diferentes de cero.Este diagnostico es sensible, su gran desventaja consiste en que “es demasiado fuerte, en el sentido de que la multicolinealidad se considera dañina, únicamente cuando la totalidad de las influencias de las variables explicativas sobre Y no se pueden separar”.

de la regresión es alto >=0,8

Para

comprobar se utiliza esta formula

2.- Altas correlaciones pares entre regresoresOtra regla general que se sugiere utilizar consiste en observar el coeficiente de correlación de orden cero o para entre regresores. Si este es alto, digamos superior a 0,8 entonces la multicolinealidad es un problema serio.Las correlaciones de orden cero elevadas son una condición suficiente pero no necesaria para la existencia de multicolinealidad debido a que esta puede existir, a pesar de que las correlaciones de orcen cero o correlaciones simples sean comparativamente bajas (es decir inferiores a 0.50). Por tanto, en los modelos que involucren más de dos variables explicativas la correlación simple o de orden cero no proporcionara una guía infalible sobre la presencia de multicolinealidad.

3.- Regresiones parciales

Coeficiente de correlación

4.- Regresión con omisión de variables

ALTO

BAJO

BAJO

5.- MEDIDAS REMEDIALES

76

Page 77: ECONOMETRÍA(Bolos del 1 al 10)

¿Qué puede hacerse si multicolinalidad es grave? Se tiene dos elecciones: 1) no hacer nada, o 2) seguir algunas reglas prácticas.No hacer nada. La multicolinealidad es en esencia un problema de deficiencia de datos y en algunas ocasiones no hay elección respecto a los datos que se tienen disponibles para el análisis empírico. “Blanchard”

PROCEDIMIENTOS PRÁCTICOS: Se pueden llevar a cabo los siguientes lineamientos prácticos para abordar el problema de la multicolinealidad; el éxito depende de la severidad de la multicolinealidad.

1.- Información a prioriSuponiendo que consideramos el siguiente modelo

Donde: consumo

= ingreso

= riquezaLas variables ingreso y riqueza tienden a ser altamente colineales

Información a priori (la tasa de cambio del consumo con respecto a la riqueza es un decima parte de la correspondiente con respecto al ingreso) Entonces se puede efectuar la siguiente regresión:

SI: Entonces:

Una vez que se a obtenido se puede estimar a partir dela relación postulada entre y¿Cómo se obtiene información a priori? puede obtenerse de investigaciones o trabajos anteriores dentro del país o fuera de el; esta puede provenir de trabajos empíricos anteriores donde el problema de colinealidad resulto ser menos grave o de teoría relevante

2.- Transformación en primeras diferencias También llamadas diferencias de primer orden.Supóngase que tiene información de series de tiempo sobre el gasto de consumo, el ingreso y la riqueza. Una razón para la alta multicolinealidad entre el ingreso y la riqueza en tal información es que con el tiempo las dos variables tienden a moverse en la misma dirección. Una forma de minimizar esa dependencia es proceder de la siguiente manera

- Si la relación: 1

se cumple en el periodo t, también debe cumplirse en el periodo t-1 puesto que el orden del tiempo es, de todas formas, arbitrario. Por consiguiente, se tiene que:

2

Restamos 2 de 1-

Transformaciones de 1ras diferencias

77

Page 78: ECONOMETRÍA(Bolos del 1 al 10)

En esta última función ya no hay multicolinealidad

Donde:

3.- Aumentar el tamaño de la muestraPuesto que la multicolinealidad es una característica de la muestra, es posible que en otra muestra que contenga las mismas variables, la colinealidad no sea tan grave como la primera. A veces, con solo aumentar el tamaño de la muestro (si esto es posible), puede atenuarse el problema de colinealidad.

n

n

Para concluir el análisis de las medidas remédiales, es importante una nota de advertencia. En el análisis de regresión, cuando obtenemos valores t no significativos para los coeficientes de regresión, con frecuencia existe la tentación de culpar por esta falta de significancia a la multicolinealidad pero puede ser otro factor diferente.

BIBLIOGRAFIA

DOMODAR N. GUJARATI ECONOMETRIA

78

.

.

.

.

.

.

.

.

.

.

.

.

.

.

. ...

.

.

.

.

.

.

Page 79: ECONOMETRÍA(Bolos del 1 al 10)

BOLO Nº 7BOLO Nº 7MODELO LINEAL GENERALMODELO LINEAL GENERAL

1.- INTRODUCCIÓN.-El propósito de este tema es presentar generalizaciones de detalles textuales importantes y se logrará con la aplicación del álgebra matricial, como primero explicaremos el modelo lineal de forma matricial y también abarcaremos algunos supuestos básicos donde su principal característica es que “Depende no solo de una variable explicativa sino de muchas más”.

2.- SUPUESTOS BÁSICOS (Hipótesis):

1.- Y = 2.- N3.- E (u) = 0

MRLNC 3.- E (u u`) = I

4.- = K< n5.- “ ” es una matriz cuyos elementos son fijos

Supongamos que existe una relación lineal entre una variable Y y K-1 variables explicativas y un termino de perturbación .

Explicaremos ahora el MODELO LINEAL en forma matricial:

79

1131321211 ... uXXXY ii

2232322212 ... uXXXY ii

nininnn uXXXY ...33221

Page 80: ECONOMETRÍA(Bolos del 1 al 10)

Deduciendo ; si tenemos una muestra de n observaciones de Y y X podemos escribir.

Los coeficientes “ “ y los parámetros de la distribución de son desconocidos, y el problema que se nos presente es obtener estimaciones de estas incógnitas. Las n ecuaciones de

se pueden formular concisamente con notación matricial así;

En donde

Donde : Y = n x 1 Vector de columna de observaciones de la variable dependiente.

X = n X i matriz de observaciones de la variable independiente. En el que n indica la fila; i señala la columna de dicha matriz X.

= i X 1 Vector columna de parámetros desconocidos. u=Términos de perturbación.

El termino independiente “ ” ordenada en el origen precisa la introducción de una columna de

unos en la matriz X. El convenio de utilizar para designar a la i-esima observación de la

variable supone que los subíndices de la matriz X estén en orden contrario al habitual.Para proceder a la estimación del vector de los coeficientes , hemos de establecer algunas hipótesis sobre el modo en que se han generado las observaciones en :

. Estas hipótesis son decisivas en el proceso de estimación, así que comenzamos con el conjunto más sencillo. El conjunto más simple de hipótesis importante es este:

E (u) = 0E (u u`) = IX es un conjunto de números fijosX tiene de rango k<n

La primera hipótesis establece que E (u) = 0 para todo i, es decir, que las u son variables aleatorias con esperanza matemática cero. La segunda hipótesis es una forma abreviada de escribir una doble hipótesis muy importante.

80

niuXXXY nininni ,........2,1...33221

Page 81: ECONOMETRÍA(Bolos del 1 al 10)

Dado que u es un vector columna n x 1 y u` un vector fila, el producto u u` es una matriz simétrica de orden n y puesto que la operación de tomar esperanzas matemáticas ha de aplicarse a cada uno de los elementos de la matriz, tenemos:

E (u u`) =

I

Los términos de la diagonal principal muestran que para todo i; esto es, las

tienen varianza constante , propiedad que se denomina homocedasticidad. Los términos

restantes de la matriz dan .La hipótesis X es un conjunto de números fijos según la cual la matriz X indica un conjunto de números fijos. Esto significa que, en el muestreo, la única fuente de variación en el vector y procede de la variación en el vector u y que las propiedades de nuestros estimadores están condicionadas a X.La hipótesis final sobre X es que el número de observaciones excede al numero de parámetros a estimar y que no existe ninguna relación lineal exacta entre las variables X para incluir , cuyo valor es siempre la unidad y que corresponde a la primera columna de X

3.- LOS ESTIMADORES MINIMOS CUADRÁTICOS .-Tomando:

E (u) = 0X tiene de rango k<n

Aplicamos ahora el principio de los mínimos cuadrados para estimar los parámetros de sea:

Un vector columna de las estimaciones de . Podemos entonces escribir

En donde e representa al vector columna de los n residuos . Obsérvese

cuidadosamente la distinción entre y . En la primera aparecen los

coeficientes desconocidos y las perturbaciones desconocidas u, mientras que en la ultima

tenemos un conjunto de estimaciones y el correspondiente conjunto de residuos e. De

la suma de los cuadrados de los residuos es:

DEBE SER MINIMO

81

Page 82: ECONOMETRÍA(Bolos del 1 al 10)

Que se deduce de observar que es un escalar y, por tanto, igual a su transpuesta .

Para hallar el valor de que minimiza la suma de los cuadrados de los residuos, derivamos:

Igualando a cero resulta

Y teniendo en cuenta la hipótesis: X tiene de rango k<n

Este es el resultado fundamental para los estimadores mínimos cuadráticos.La característica fundamental del ESTIMADOR DE MÍNIMOS CUADRADOS , es que el

lineal e insesgado; de hecho es el mejor estimador Lineal Insesgado de ; en el sentido de

que tiene la Varianza mínima de todos los estimadores insesgados.Como ilustración de este resultado consideremos el caso de dos variables.Aquí:

y

Por lo que escribiendo en forma alternativa:

Y sustituyendo, se obtiene:

Que son las dos ecuaciones normales obtenidas. Para el caso de tres variables es el siguiente:

Y por simetría es evidente la forma de construir estas ecuaciones para casos de mas variables.

82

yXXX ,1,^

)(

Page 83: ECONOMETRÍA(Bolos del 1 al 10)

La ecuación proporciona como un vector columna. Alternativamente, podría

haberse escrito:

Que nos daría:

Trasponiendo ambos miembros de este último resultado obtenemos directamente

4.- MEDIA Y VARIANZA DE .-

Para obtener la media y la varianza de sustituimos en lo que nos

da:

Puesto que . Esto expresa a como una función lineal de la verdadera

pero desconocida y de las perturbaciones . Si consideramos que se repite el proceso de muestreo, entonces los valores de X permanecen fijos de muestra a muestra conforme a la hipótesis (X es un conjunto de números fijos), pero cada muestra dará un

conjunto diferente de las U y, por tanto, un vector diferente. Tomando las esperanzas

matemáticas de ambos miembros de:

resulta.

Puesto que X permanece fijo. Por tanto

ES INSESGADO

Ya que en virtud de la hipótesis . En consecuencia, los estimadores mínimos cuadráticos son insesgados.Consideremos ahora:

83

Page 84: ECONOMETRÍA(Bolos del 1 al 10)

Teniendo presente que para i = 1,2,…..k, podemos deducir que es la

varianza de y es la covarianza de y . Por lo tanto, la matriz

simétrica dada contiene varianzas en su diagonal principal y las covarianzas en los restantes

lugares. A esta matriz la denominaremos matriz de varianzas y covarianzas de las y la

designaremos por .

De tenemos:

Por tanto:

Aplicando la regla de que y observado que es una matriz simétrica,

porque también lo es. Por tanto:

Ya que es un escalar, se puede trasladar colocándolo delante o detrás de una matriz, según

convenga, y puede suprimirse y obtendríamos:

con lo que es posible obtener la varianza de cualquier coeficiente con solo tomar el i-ésimo

termino de la diagonal principal de y multiplicarlo por que es la varianza de ,

mientras que la covarianza de cualquier pareja de estimaciones, y , se halla

multiplicando por el termino i,j-ésimo de .Hemos demostrado que los estimadores mínimo cuadráticos son lineales e insesgados; por lineales se entiende que los estimadores son funciones lineales de y. se puede también demostrar que tales estimadores poseen una varianza menor que cualquier otro estimador insesgado lineal y por tanto que son estimadores insesgados lineales óptimos.Lo probaremos de un modo más general, del cual es este un caso especial. El resultado más general tiene, asimismo, aplicaciones en problemas de predicción. Consideremos una función lineal parametrica en donde c es un vector columna kx1 de constantes conocidas. Un

estimador posible de es , en donde:

Este estimador es insesgado, ya que

Y su varianza es:

84

Page 85: ECONOMETRÍA(Bolos del 1 al 10)

Sea: Cualquier otro estimador lineal insesgado de

Siempre y cuando

Como se verifica

Así pues,

Mediante podemos escribir también

Así pues:

En donde:

M es una matriz simétrica idempotente. Es además semidefinida positiva, y por tanto.

Esto es, el estimador mínimo cuadrático de tiene una varianza muestral al menos tan pequeña como cualquier otro estimador lineal insesgado.Considerando los vectores

Con la unidad en la posición i-esima y ceros en los demás lugares, se obtiene

Por lo que los estimadores mínimos cuadráticos

son estimadores lineales insesgados óptimos de los parámetros desconocidos

Volviendo ahora a la suma de los cuadrados de los residuos nos da

85

Page 86: ECONOMETRÍA(Bolos del 1 al 10)

Que expresa los residuos observados como una función lineal de las perturbaciones desconocidas.Por tanto, la suma de los cuadrados de los residuos es:

Tomando esperanzas matemáticas de ambos miembros

Puesto que es de orden k de modo que luego

Nos proporciona un estimador insesgado de la varianza de la perturbación.El calculo de se realiza fácilmente aplicando

Puesto que conforme a la derivación mínimo cuadrática de . Utilizando letras

minúsculas para representar las desviaciones con respecto a las medias aritméticas:

Obsérvese que una propiedad del ajuste por mínimos cuadrados es que = 0. particionando la

suma total de los cuadrados de Y, debida a la influencia lineal de las variables explicativas, y en la suma de cuadrados de los residuos, tenemos

Suma “explicativa”

5.- EL ESTIMADOR DE .-

En el modelo de dos variables

86

Page 87: ECONOMETRÍA(Bolos del 1 al 10)

En el modelo lineal general

Pero:

Entonces:

Pero:

6.- EL COEFICIENTE DE DETERMINACION.-

STC=SRC+SECSTC=

STC= Pero:

Entonces;

Finalmente obtenemos:

87

12^

)()( XXCovVar

kn

yXyy

ˆ

ˆ 2

STC

SRCR 2

Page 88: ECONOMETRÍA(Bolos del 1 al 10)

O también el coeficiente de correlación múltiple queda entonces definido por:

Es costumbre calcular el coeficiente de correlación solamente para las variables aleatorias que poseen una distribución conjunta. Lo hemos incluido aquí por dos razones:

- PRIMERO; Porque incluso en el caso de X filas, es útil para las tablas del análisis de la varianza.

1.- puede verse esto, derivando la suma de los cuadrados con respecto a e igualando a 0.

Es decir:

- SEGUNDO; Porque el supuesto X filas se puede suprimir más adelante. Es cualquier caso, una medida de la proporción de la varianza total explicada por la relación lineal ajustada resulta práctica para fines descriptivos.

COEFICIENTE DE DETERMINACION AJUSTADO :A veces es útil calcular una corregida de grados de libertad, particularmente cuando se va a comparar el poder explicativo de diferentes conjuntos de variables explicativas. La razón de corrección esta en advertir que se puede expresar así:

Para el Modelo Lineal General:

O también puede ser así:

88

Page 89: ECONOMETRÍA(Bolos del 1 al 10)

En donde y es decir, que ambas sumas de cuadrados, la inexplicada y

la total, aparecen divididas por n. Sin embargo, los estimadores insesgados de estas varianzas

vienen dados, respectivamente por y . El corregido se define así:

y la relación entre ambos coeficientes se puede expresar de este modo.

O bien :

El coeficiente sin corregir no disminuirá nunca cuando se añadan a la regresión variables explicativas adicionales, pero es posible que el coeficiente corregido disminuya si una variable adicional produce en (1- ) una reducción demasiado pequeña para compensar el aumento de (n-1)(n-k).Reuniendo los resultados conseguidos hasta ahora tenemos:

Estas formulas han sido todas desarrolladas a partir de la relación inicial , en que las variables se miden desde el

origen cero. Promediando y

para las n observaciones muéstrales tenemos:

Puesto que , en general, no se anulara, pero, como se demostró anteriormente, una

consecuencia del ajuste de los mínimos cuadrados es que

Restando de las relaciones originales y utilizando letras minúsculas para representar las desviaciones respecto a las medias aritméticas, tenemos:

89

Page 90: ECONOMETRÍA(Bolos del 1 al 10)

O en notación matricial:

En donde ahora:

Se deduce claramente que podríamos proceder exactamente igual que en el anterior desarrollo para obtener la formula:

Los residuos e son exactamente los mismos de antes, de modo que y

. El único cambio que se produce es en la formula de , que se convierte

ahora en

Y la suma de los cuadrados debida a la influencia lineal de las variables explicativas es

En el modelo lineal general el estadístico Fisher es mucho más adecuado

ESTADISTICO “F” : Dócima de no relación :1.- Dócima

2.- Nivel de significancia: Por razones pedagógicas se grafica de la siguiente manera:.

90

1

Page 91: ECONOMETRÍA(Bolos del 1 al 10)

R.A. R.C. 3.- Estadístico a prueba

4.- REGLA DE DECISIÓNSi:“F” calculada > “F” tablasEntonces:SE RECHAZA , es decir existe relación entre variables.EJEMPLO: En el diseño de un modelo de simulación se precisaba disponer de una función de consumo de bienes de origen industrial para ello se dispone los siguientes datos: (FALTA EL EJERCICIO DEL CUADERNO DEL LIC. CABALLERO)

AÑOCONSUMO(Bienes Industriales)

INGRESO DISPONIBLE

IMPORTACIONES DE BIENES DE CONSUMO

199519961997199819992000

454248555365

525858606570

101310141618

Se pide: Con el siguiente modelo:

91

Page 92: ECONOMETRÍA(Bolos del 1 al 10)

a) Determinar la varianza maestral del término estocástico y su desviación típica maestral.

b) Determinar la varianza de .

c) Determinar el coeficientes de determinación ( )

SOLUCION:a)

b)

c)

92

kn

yXyy

ˆ

ˆ 2

12^

)()(

XXVar

STC

SRCR 2

Page 93: ECONOMETRÍA(Bolos del 1 al 10)

Bolo nº 8

IMPLICACIONES IMPORTANTES DEL MODELO DE REGRESION LINEAL DE DOS VARIABLES

1.- INTERVALOS CONFIDENCIALES

El verdadero parámetro poblacional es infinitesimalmente pequeño.

Donde:Es un valor Es el error de tipo 1 (nivel de significancia). La probabilidad de rechazar una hipótesis

cuando es verdadero.Nivel de confianza.

Si:

Por tanto:

Si 0,05 0,95. En la distribución normal es exactamente z = 1,96 . Se reemplaza con un indicador de precisión.

93

Page 94: ECONOMETRÍA(Bolos del 1 al 10)

2.- INTERVALO CONFIDENCIAL PARA

Intervalo confidencial

3.- INTERVALO CONFIDENCIAL PARA

a). Cuando se conoce

PARA

Por tanto:

PERO:

Intervalo probabilístico

94

Page 95: ECONOMETRÍA(Bolos del 1 al 10)

a). Cuando no se conoce

En términos de MRLNC.

Pero:

Utilizando un artificio matemático obtenemos:

Pero:

=

TEOREMA.-

95

Page 96: ECONOMETRÍA(Bolos del 1 al 10)

El cociente de una distribución normal con media cero y varianza unitaria, entre un denominador con distribución da como resultado una distribución “t” de Student, independiente.Pero:

Independiente

Entonces:

Realizando algunas operaciones obtenemos:

Finalizando tenemos:

Students solo para muestras pequeñas.

-“t” +”t”

Intervalo confidencial

4.- INTERVALO CONFIDENCIAL PARA

Mejor estimador insesgado.Pero:

96

Page 97: ECONOMETRÍA(Bolos del 1 al 10)

5.- INTERVALO CONFIDENCIAL DE LA F.R.P. Partiendo de:

Entonces:

Realizando operaciones obtenemos:

Es insesgadoVARIANZAS

Pero:

Entonces:

97

Page 98: ECONOMETRÍA(Bolos del 1 al 10)

)

Finalmente

Estandarizamos:

N (0,1)

a). Si se conoce

b). Si no se conoce

Llamado también intervalo de confianza o banda de confianza.

6.- DESCOMPOSICION DE LA VARIACION MUESTRAL DE Y (ANALISIS DE LA VARIANZA)

Y FRM;

98

Page 99: ECONOMETRÍA(Bolos del 1 al 10)

FRP;

X

STC= SUMA TOTAL DE CUADRADOSSTC=

Pero:

Finalmente:

Es decir: STC = SRC + SECTambién: SRC = SUMA DE REGRESION DE CUADRADOS

Finalmente:

Entonces:

Es decir: STC = SRC + SEC

6.- COEFICIENTE DE DETERMINACION Y COEFICIENTE DE CORRELACION r

Coeficiente de determinación

Pero:

99

Page 100: ECONOMETRÍA(Bolos del 1 al 10)

Entonces:

Finalmente:

R = Coeficiente de correlación

Es una expresión indeterminada comprobando también que es indeterminado.

GRAFICOS DE BALLENTINE

Y Y

MODELO DE MAS DE 2 VARIABLES

AJUSTADO

100

Y Y

Y X X

X

X

X

Page 101: ECONOMETRÍA(Bolos del 1 al 10)

A medida que aumenta el número de variables también aumenta ( ) y la forma mas

conveniente es hallando .

Calculo de

Donde:K = Numero de parámetros incluido la ordenada al origen o el parámetro independiente.

Relación entre ( ) y

Finalmente:

7.- DOCIMAS DE HIPOTESIS

a). Docima de no relación entre variables Si

Docima de no relación 1.- Docima

2.- nivel de significancia:

-“t” +”t”

3.- Estadístico a prueba

Pero por hipótesis

101

Page 102: ECONOMETRÍA(Bolos del 1 al 10)

4.- Regla de decisiónSi:

Calculada > tablasEntonces:SE RECHAZA , es decir existe relación entre variables.

b). Docima sobre la ordenada al origen

1.- Docima

2.- nivel de significancia:

-“t” +”t”

3.- Estadístico a prueba

Pero por hipótesis

4.- Regla de decisiónSi:

Calculada > tablasEntonces:SE RECHAZA , es decir existe relación entre variables.

DOCIMA PARA

- Docima 1.- Docima

2.- nivel de significancia:

102

Page 103: ECONOMETRÍA(Bolos del 1 al 10)

3.- Estadístico a prueba

=

4.- Regla de decisiónSi:

Calculada <

Calculada >

Entonces:

SE RECHAZA

DOCIMA DE NO RELACION ENTRE VARIABLES- Docima “F” de Fisher

Teorema- Si U y V son variables aleatorias con n y m grados de libertad respectivamente y con

distribución el cociente: da como resultado una distribución “F” en n grados de

libertad en el numerador y m grados de libertad en el denominador.

Es decir:

En el MRLNC de dos variables:

1.- Docima

2.- nivel de significancia: Por razones pedagógicas se grafica de la siguiente manera:

103

Page 104: ECONOMETRÍA(Bolos del 1 al 10)

R.A. R.C. “F”3.- Estadístico a prueba

4.- Regla de decisiónSi:“F” calculada > “F” tablasEntonces:SE RECHAZA , es decir existe relación entre variables.

104

Page 105: ECONOMETRÍA(Bolos del 1 al 10)

BOLO Nº 9

EL MODELO LINEAL DE DOS VARIABLES

1.- MEJOR ESTIMACION LINEAL E INSESGADO (MELI)

Dados los supuestos del modelo de regresión lineal clásico, los estimativos de mínimos cuadrados poseen propiedades ideales u optimas, las cuales se encuentran resumidas en el teorema de Gauss – Markov. Para comprender este teorema es necesario tener en cuenta la propiedad por la cual un estimador se considera el mejor estimador lineal insesgado.

Un estimador, digamos el estimador , MCO, es el mejor estimador lineal insesgado MELI de

si:- Es lineal, es decir una función lineal de una variable aleatoria tal como la variable

dependiente Y en el modelo de regresión.

- Es insesgado, es decir, su valor promedio o esperado , es igual al valor verdadero

.- Tiene varianza mínima entre la clase de todos los estimadores lineales insesgados; a un

estimador insesgado con varianza mínima se le conoce como un estimador eficiente.En el contexto del análisis de regresión se puede demostrar que los estimadores de MCO son MELI. Esta es la clave del famoso teorema de Gauss- Markov, el cual se puede enunciar de la siguiente forma:

- TEOREMA DE GAUSS - MARKOVDados los supuestos del modelo clásico de regresión lineal, los estimadores de mínimos cuadrados, en la clase de estimadores lineales insesgados, tienen varianza mínima, es decir, son MELI.

a) Propiedad de linealidad

105

Page 106: ECONOMETRÍA(Bolos del 1 al 10)

2 ES LINEAL

CONVENIO

1

3

4

5

6

7 ES LINEAL

b) Propiedad de insesgamiento

El análisis es mediante :

Pero

Reemplazando tenemos:

8

Aplicando esperanzas

9 ES INSESGADO

El análisis es mediante :

Pero

Reemplazando tenemos:

106

Page 107: ECONOMETRÍA(Bolos del 1 al 10)

10

Aplicando esperanzas

11 ES INSESGADO

c) Propiedad de mínima varianza

Varianza

Utilizando 8 tenemos

Pero:

E ( ) =

Entonces:

Pero:

12

Desarrollamos

13

O más brevemente:

107

Page 108: ECONOMETRÍA(Bolos del 1 al 10)

Por tanto:

También sigue una distribución normal estandarizada.

0

Estandarizamos:

Por tanto:

También sigue una distribución normal estandarizada.

0

Relacionándonos con: 14

Obtenemos:

108

Page 109: ECONOMETRÍA(Bolos del 1 al 10)

Varianza

Pero:

E ( ) =

Entonces:

Pero:

15

Desarrollando tenemos:

16

d) Propiedad de eficiencia

Donde:

109

Page 110: ECONOMETRÍA(Bolos del 1 al 10)

Pero:

Reemplazando tenemos:

CONDICIONSi:

Entonces:

17Aplicando esperanzas

ES INSESGADOVarianza

De tenemos:

Pero:

E ( ) =

Entonces:

Pero:

Reemplazando en tenemos:

PERO:

110

Page 111: ECONOMETRÍA(Bolos del 1 al 10)

Entonces:

FINALMENTE

ES UN ESTIMADOR EFICIENTE

2.- ESTIMACION MAXIMO VEROSIMIL (EMV)Un método de estimación puntual, con algunas propiedades teóricas más fuertes que las del método de MCO, es el método de máxima verosimilitud.

El estimador de máxima verosimilitud EMV para . Este estimador es sesgado,

mientras el estimador de MCO para es insesgado.

Estandarizamos:

- DISTRIBUCION NORMAL GENERAL

- DISTRIBUCION CONJUNTA

- FUNCIÓN DE VEROSIMILITUD

Aplicando logaritmos obtenemos

Derivadas

111

Page 112: ECONOMETRÍA(Bolos del 1 al 10)

- Estimadores de mínimos cuadrados

1

2

SISTEMA DE ECUACIONES NORMALES

1

2

Pero:

112

Page 113: ECONOMETRÍA(Bolos del 1 al 10)

ES SESGADO

ES INSESGADO

PERO:

RESIDUALES

PERO:

Y REEMPLAZANDO TENEMOS:

PERO:

ENTONCES:

REEMPLAZANDO EN OBTENEMOS:

113

Page 114: ECONOMETRÍA(Bolos del 1 al 10)

Y TAMBIEN:

En conclusión , y

nos llevan al mismo resultado

3.- PROPIEDADES DE LOS ESTIMADORES (DISTRIBUCION DE Y )

Partiendo de modelo de dos variables obtenemos:

TEOREMA:Es propio de la estadística. “Si X, Y, Z,…..son variables aleatorias con distribución normal a, b, c, …… son coeficientes entonces la combinación lineal ; aX; bY; cZ;…. También tienen distribución normal”.

CARACTERISTICAS: PARA

Estandarizamos:

Por tanto:

También sigue una distribución normal estandarizada.

0

114

Page 115: ECONOMETRÍA(Bolos del 1 al 10)

PARA

Por tanto:

También sigue una distribución normal estandarizada.

0

4.- COVARIANZA DE Y

Es un indicador que cuantifica el grado de variación conjunta, es decir si varían juntos dos o mas variables.

Existe variación conjunta de los estimadores de una sola muestra y .

Pero:

Entonces:

Pero: E ( ) =

Entonces:

115

Page 116: ECONOMETRÍA(Bolos del 1 al 10)

Pero:

Entonces:

Existe una relación inversa

5.- ESTIMACION DE LAS VARIANZAS DE Y

Las formulas son las siguientes:

Pero:

,

MATRIZ DE VAR - COV

116

Page 117: ECONOMETRÍA(Bolos del 1 al 10)

Bolo nº 10EL MODELO LINEAL DE DOS VARIABLES

1.- INTRODUCCIONEl significado de linealidad es que la expectativa condicional de Y es una función lineal de X. geométricamente, la curva de regresión es en este caso una línea recta.

2.- EL MODELO DE REGRESION LINEAL SIMPLE

Donde: es una variable aleatoria

Esta ecuación podemos ver que es:- modelo uniecuacional- modelo de dos variables- modelo lineal

3.- SUPUESTOS E HIPOTESIS DEL MODELO DE REGRESION LINEAL

El modelo de regresión, conocido también como el modelo de Gauss, o modelo clásico, estándar o lineal general, en el cual se basa la mayor parte de la teoría econometrica, plantea los siguientes supuestos

1.- Y = 12.- N 2

MRLNC 3.- E ( ) = 0 3

4.- E ( ) = 4

5.- 56.- “ ” es un regresor fijo 6

Comprobación de los supuestos: Y

FRP=Y =

+

-

X

Supuesto 1

117

Page 118: ECONOMETRÍA(Bolos del 1 al 10)

Varianza

Pero:

F.R.P.

Entonces:

Supuesto 3E ( ) = 0Porque las distancias de los puntos localizados por encima y debajo de los valores medios no son otra cosa que los , dicho de otro modo, los valores positivos de se cancelan con los valores negativos de tal manera que su efecto promedio sobre Y es cero.

Supuesto 4Esta situación se conoce con el nombre de heterocedasticidad o dispersión o desigual varianza

E ( ) =

Supuesto 5En este supuesto podemos observar que no existe ninguna relación de dependencia, es decir no existe ninguna relación.

4.- PROPIEDADES DE, y

Supuesto 6“ ” es un regresor fijo

- FUNCION DE REGRESION POBLACIONAL (FRP)Se deduce claramente que cada media condicional esta en función de . Simbólicamente, se tiene que:

En donde denota una función de la variable explicativa

118

Page 119: ECONOMETRÍA(Bolos del 1 al 10)

La ecuación se conoce como la función de regresión poblacional FRP. Dicha

función denota únicamente que la media poblacional de la distribución de Y dado esta

funcionalmente relacionada con . En otras palabra, nos muestra como el valor promedio poblacional de Y varia con las X. Dicho de otra forma, nos dice como la respuesta media o promedio de Y varia con X.

- FUNCION DE REGRESION MUESTRAL (FRM)Es simplemente una regla, formula o método que nos dice como estimar el parámetro poblacional a partir de la información proporcionada por la muestra que se tiene a mano. El valor particular que se obtiene para el estimador después de efectuada una aplicación se conoce con el nombre de estimativo.

FRM en su forma estocástica es de la siguiente manera:

Conceptualmente es análogo a .

Resumiendo, el objetivo fundamental del análisis de regresión consiste en estimar la FRP

con base en la FRM , en razón de que en la mayoría de los

casos el análisis se debe llevar a cabo con base en una muestra tomada de la población. Sin embargo debido a fluctuaciones entre una muestra y otra, nuestra estimación de la FRP con base en la FRM es, en el mejor de los casos, una aproximación.Para tenemos una observación muestral . En términos de la FRM, el observado puede expresarse como:

y en términos de FRP, como:

LINEAS DE REGRESION POBLACIONAL Y MUESTRAL

Y FRM;

FRP;

X

- CARACTERISTICAS FUNDAMENTALES

119

Page 120: ECONOMETRÍA(Bolos del 1 al 10)

5.- ESTIMACION DE LOS PARAMETROS DE LA FUNCION DE REGRESION POBLACIONAL F.R.P.

Existen en la actualidad varios métodos para construir la FRM, pero en concerniente al análisis de regresión el más usado es el método de mínimos cuadrados ordinarios MCO,

- METODO DE LOS MINIMOS CUADRADOS ORDINARIOS

El método de mínimos cuadrados ordinarios se ha atribuido al matemático alemán Carl Friedrich Gauss. Bajo ciertos supuestos, el método de MCO ofrece algunas propiedades estadísticas muy atractivas, por lo cual se ha constituido en uno de los más eficaces y populares métodos de análisis de regresión.

- El criterio de mínimos cuadrados

Y FRM;

-

-

X

- El principio de los mínimos cuadrados Recordando la FRP en dos variablesY = Sin embargo no se puede observar directamente, la estimamos a partir de la FRM.

Donde es el valor estimado (media condicional) de

Los residuos son simplemente las diferencias entre los valores reales y los estimados de Y.

120

Page 121: ECONOMETRÍA(Bolos del 1 al 10)

Ahora bien, dados N pares de observaciones de Y y X estamos interesados en determinar la FRM de tal forma que este tan cerca como sea posible del Y real. Con este fin podemos adoptar el siguiente criterio: eligase la FRM, de tal manera que la suma de los residuos resulte ser tan pequeña como sea posible:

Debe ser mínimo

En otras palabras, a todos los residuos se les da la misma importancia o peso sin importar que tan cerca o que tan dispersas estén las observaciones individuales de la FRM. Como consecuencia, es bastante factible que la suma algebraica de los sea muy pequeña aun cero, a

pesar de que los estén muy dispersos alrededor de la FRM. Para verificar lo anterior,

supongamos que , , y asumen valores de 10, -2, + 2 y -10 respectivamente; la suma

algebraica de estos residuos es cero, a pesar de que y estén mas dispersos alrededor de la

FRM que y . Este problema puede evitarse adoptando el criterio de los mínimos cuadrados según el cual la FRM puede plantearse en forma tal que:

Resulte ser tan pequeña como sea posible y en donde representan los residuos al

cuadrado.- Estimadores de mínimos cuadrados

1

2

SISTEMA DE ECUACIONES NORMALES

121

Page 122: ECONOMETRÍA(Bolos del 1 al 10)

Para estimar puede expresarse en forma alterna como:

BIBLIOGRAFIA

ECONOMETRIA(Modelos y Pronósticos) Robert S. Pindyck

ECONOMETRIA Damodar Gujarati

ECONOMETRIA Apuntes Lic. Raul Arias Lic. Benigno Caballero

122