IntroDucciOn

41
INTRODUCCION 1. ALGEBRA MATRICIAL, ESTADISTICA MATEMATICA Y TEORIA ASINTÓTICA 2. EL MODELO CLÁSICO DE REGRESIÓN LINEAL SIMPLE

description

mco

Transcript of IntroDucciOn

Page 1: IntroDucciOn

INTRODUCCION1. ALGEBRA MATRICIAL, ESTADISTICA MATEMATICA Y

TEORIA ASINTÓTICA

2. EL MODELO CLÁSICO DE REGRESIÓN LINEAL SIMPLE

Page 2: IntroDucciOn

Notas de Clase Econometría I – Introducción

1. ALGEBRA MATRICIAL, ESTADISTICA MATEMATICA Y TEORIA ASINTÓTICA

1.1 CONCEPTOS BÁSICOS DE ALGEBRA MATRICIAL

DEFINICIONESDefinición 1 (Matriz)Una matriz es un ordenamiento rectangular de números en filas y columnas.

Específicamente, una matriz de dimensión es un conjunto de números

ordenados en m filas y n columnas. Se puede expresar una matriz como:

Definición 2 (Escalar)Un escalar es un número real. En términos de matrices un escalar es una

matriz 1 × 1.

Definición 3 (Vector Columna)Es una matriz que consta de m filas y 1 columna.

Definición 4 (Vector Fila)Es una matriz que consta de 1 fila y n columnas.

Definición 5 (Matriz Cuadrada)

Jhon Alexis Diaz Contreras 2

Page 3: IntroDucciOn

Notas de Clase Econometría I – Introducción

Es una matriz que consta que posee el mismo número de filas y columnas m

= n.

Definición 6 (Matriz Diagonal)Es una matriz cuadrada que tiene al menos un elemento diferente de cero

sobre la diagonal principal, siendo cero los valores restantes.

Definición 7 (Matriz Escalar)Es una matriz diagonal cuyos elementos diagonales son todos iguales.

Definición 8 (Matriz Identidad)Es una matriz diagonal cuyos elementos diagonales son todos 1.

Generalmente, la matriz identidad se denota como Im×n.

Definición 9 (Matriz Simétrica)Es una matriz cuadrada cuyos elementos por encima de la diagonal son

imagen de los elementos por debajo de la diagonal.

Definición 10 (Matrices y Vectores Nulos)

Jhon Alexis Diaz Contreras3

Page 4: IntroDucciOn

Notas de Clase Econometría I – Introducción

Son matrices y vectores cuyos elementos son cero.

CARACTERISTICAS DE LAS MATRICESDefinición 11 (Independencia Lineal)Una matriz tiene independencia lineal si ninguna fila y ninguna columna

dependen de otra fila u otra columna. La afirmación de que una matriz es

linealmente dependiente equivale a decir que una fila (columna) es una

transformación lineal de otra fila (columna).

Definición 12 (No Singular)Una matriz se dice No Singular si es cuadrada, tiene independencia lineal y

su determinante es diferente de cero.

Definición 13 (Rango)El rango de una matriz es el orden de la submatriz cuadrada más grande

cuyo determinante es diferente de cero.

La matriz A que es de orden 3 y cuyo determinante es cero, tiene una

submatriz B cuadrada de orden 2 con determinante -6. Por lo tanto el rango

de A es 2.

Definición 14 (Traza)La traza de una matriz es la suma de los elementos diagonales.

Tr (A) =

OPERACIONES CON MATRICES Transposición Definición 15 (La Matriz Transpuesta)

Jhon Alexis Diaz Contreras 4

Page 5: IntroDucciOn

Notas de Clase Econometría I – Introducción

Sea una matriz m × n. La transpuesta de A, denotada como es la

matriz n × m que se obtiene al intercambiar las filas y las columnas de A. Es

decir .

Suma de MatricesSea y . Si A y B son del mismo orden se define la suma de

matrices como:

A + B = C

donde es del mismo orden de A y B y se obtiene como . Si

la suma puede realizarse se dice que A y B son conformables con la suma.

Dado que A y B son del mismo orden son conformables con la suma; de ahí,

que A + B = C donde C es igual a:

Multiplicación por un escalarPara multiplicar una matriz por un escalar , se multiplica cada elemento de

la matriz por .

Si = 2 y , entonces

Multiplicación de Matrices

Jhon Alexis Diaz Contreras5

Page 6: IntroDucciOn

Notas de Clase Econometría I – Introducción

Sean y . Para poder efectuar la multiplicación el número de

columnas de A deben ser igual al número de filas de B. Entonces, el

producto AB es igual a una matriz que se define como:

Ejemplo 1:

Propiedades de la Multiplicación de Matrices:1. La multiplicación de Matrices no es conmutativa.

2.

3.

4.

5.

6.

7.

8.

9.

10.

Determinante de una MatrizPara cada matriz cuadrada A, existe un número conocido como

determinante que se denota como .

Jhon Alexis Diaz Contreras 6

Page 7: IntroDucciOn

Notas de Clase Econometría I – Introducción

Evaluación de un Determinante para una Matriz 2 × 2

Si entonces el determinante se calcula como

Ejemplo 2:

Evaluación de un Determinante para una Matriz 3 × 3

Si entonces el determinante se puede calcular utilizando el

Cálculo de Laplace (Matriz de Cofactores). Para realizar este calculo, se

procede de la siguiente manera:

Para cada fila i:

Para cada columna j:

Ejemplo 3:

Si el determinante puede calcularse como:

Si se utiliza la fila 1 Si se utiliza la

columna 1

Jhon Alexis Diaz Contreras7

Page 8: IntroDucciOn

Notas de Clase Econometría I – Introducción

Propiedades de los Determinantes1. Si todos los elementos de una fila o una columna son cero .

2. Si

3. El intercambio de dos filas o columnas cualquiera de una matriz A,

cambian el signo de .

4. Si cada elemento de una fila o de una columna de A se multiplica

por un escalar , entonces es multiplicado por .

5. Si dos filas o columnas de una matriz son idénticas, su

determinante es cero.

6. Si una fila o una columna de una matriz depende linealmente de

otra fila o columna =0.

7.

Inversa de una MatrizSi A es cuadrada y no singular ( ) su inversa puede encontrarse así:

Los pasos comprendidos en el cálculo son:

1. Encontrar .

2. Remplazar cada elemento de de A por su cofactor para obtener la

matriz de cofactores.

3. Transponer la matriz de cofactores para obtener la matriz adjunta de

A.

4. Dividir cada elemento de la matriz adjunta por .

Ejemplo 4:

Para su se calcula así:

Jhon Alexis Diaz Contreras 8

Page 9: IntroDucciOn

Notas de Clase Econometría I – Introducción

El determinante de A es:

Matriz de Cofactores:

Matriz Adjunta (Transpuesta de la Matriz de Cofactores):

Matriz Inversa

1.2 NOCIONES BÁSICAS DE ESTADÍSTICA MATEMÁTICA

VARIBALES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDADDefinición 1 (Variable Aleatoria)Una variable aleatoria es aquella que toma valores numéricos y que tiene un

resultado determinado por un experimento.

Al lanzar una moneda (experimento), el número de caras que aparecerán en,

por ejemplo 10 lanzamientos, es una variable aleatoria, por que antes de

realizarse el experimento no se sabe cuantas caras van a salir en los 10

Jhon Alexis Diaz Contreras9

Page 10: IntroDucciOn

Notas de Clase Econometría I – Introducción

lanzamientos. De ahora en adelante, notaremos a las variables aleatorias

con mayúsculas W, X, Y y Z y los resultados que toma la variable con sus

respectivas minúsculas w, x, y, y z. Las variables aleatorias pueden ser

discretas o continuas.

Definición 2 (Variable Aleatoria Discreta)Una variable aleatoria discreta es aquella que puede tomar un número de

valores finito o infinito contable. Donde infinito contable hace referencia a

que una variable puede tomar un infinito número de valores y es posible

hacer corresponder estos con números enteros positivos.

Por ejemplo, si se define a la variable aleatoria X como la suma de los

números que parecen en los dados, entonces X tomará uno de los siguientes

valores: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 o 12.

Definición 3 (Variable Aleatoria Continua)Una variable aleatoria continua es aquella que puede tomar cualquier valor

dentro de un intervalo de valores.

Por ejemplo, la estatura de una persona es una variable aleatoria continua

por que para el rango comprendido entre 150.0 y 185.5 centímetros la

estatura puede tomar cualquier valor, dependiendo de la precisión de la

medición.

Definición 4 (Función de Densidad de Probabilidad de una VAD)Sea X una variable aleatoria discreta que toma valores diferentes x1, x2,… xn.

Entonces, la función

Se denomina la función de densidad de probabilidad discreta (FDP) de

X. donde la P(X=xi) significa la probabilidad de que la va discreta X tome el

valor de xi.

Ejemplo 1:

Jhon Alexis Diaz Contreras 10

Page 11: IntroDucciOn

Notas de Clase Econometría I – Introducción

La variable aleatoria discreta X (la suma de los números que aparecen en

dos dados) puede tomar uno de los siguientes resultados:

Definición 5 (Función de Densidad de Probabilidad de una VAC)Sea X una variable aleatoria continua. Entonces, se dice que es la FDP

de X si se satisfacen las siguientes condiciones:

Donde significa la probabilidad de que X se encuentre en el

intervalo a a b. Para una variable continua la probabilidad de que X tome un

valor específico es cero; la probabilidad para tal variable puede medirse

solamente sobre un rango o intervalo dado, tal como (a, b).

CARACTERISTICAS DE LAS DISTRIBUCIONES DE PROBABILIDADEs común describir una distribución de probabilidad de acuerdo a algunas

de sus características. Estas, pueden clasificarse en medidas de tendencia

central, medidas de variabilidad y medidas de asociación entre dos variables

aleatorias.

Medida de Tendencia Central: El Valor EsperadoSi X es una variable aleatoria, el valor esperado (o esperanza) de X, es un

promedio ponderado de todos los posibles valores de X. Las ponderaciones

están determinadas por la FDP de la variable.

Entonces, sea X es una variable aleatoria discreta, el valor esperado,

denotado como , se define de la siguiente manera.

Jhon Alexis Diaz Contreras11

Page 12: IntroDucciOn

Notas de Clase Econometría I – Introducción

Ejemplo 2:

Si se toman los datos del Ejemplo 1, el valor esperado de la suma de los

números que aparecen en el lanzamiento de dos dados, se calcula como

sigue:

Propiedades del Valor Esperado1. El valor esperado de una constante es la constante misma. Así, sí c

es una constante .

2. Si a y b son constantes el . Este resultado se

puede generalizar para N variables.

3. Si son constantes y son variables

aleatorias, entonces

. O bien, en

notación de sumatoria .

Medidas de Variabilidad (Varianza y Desviación Estándar)VarianzaSea X una variable aleatoria y sea . La distribución o dispersión de

los valores de X alrededor de su valor esperado puede ser medida por la

varianza, la cual se define como

En otras palabras la varianza indica la distancia esperada de X a su valor

esperado (media), ó cuanto se aleja X en promedio de µ.

Propiedades de la Varianza1. La varianza de una constante es cero.

Jhon Alexis Diaz Contreras 12

Page 13: IntroDucciOn

Notas de Clase Econometría I – Introducción

2. Si a y b son constantes, entonces .

Desviación Estándar La desviación estándar de una variable aleatoria, denotada por , es la raíz

cuadrada positiva de la varianza .

Propiedades de la Desviación Estándar1. La desviación estándar de una constante es cero.

2. Si a y b son constantes, entonces .

Medidas de AsociaciónCovarianzaSea y y consideremos la variable aleatoria .

Entonces la covarianza entre dos variables aleatorias X y Y se define como

el valor esperado del producto :

La covarianza también se denota por . Si >0, entonces, en promedio,

cuando X está sobre su media, Y también lo está. Si <0, entonces, en

promedio cuando X está sobre su media, Y está por debajo de la suya. Dado

que la covarianza mide al grado de dependencia lineal entre dos variables

aleatorias, una covarianza positiva indica que las dos variables van en la

misma dirección, en tanto que una covarianza negativa señala que lo hacen

en direcciones contrarias. Para calcular la covarianza se puede proceder

como sigue:

Propiedades de la Covarianza:1. Si X y Y son independientes, entonces la Cov(X, Y) = 0.

2. Para cualquier constantes a1, b1, a2 y b2.

3.

Jhon Alexis Diaz Contreras13

Page 14: IntroDucciOn

Notas de Clase Econometría I – Introducción

Coeficiente de CorrelaciónAl igual que la covarianza el coeficiente de correlación mide el grado de

asociación lineal entre dos variables. Sin embargo, a diferencia de la

covarianza, no depende de las unidades de medida. El coeficiente de

correlación entre X y Y se define como:

El coeficiente de correlación que se denota por siempre tiene el mismo

signo que la covarianza dado que las desviaciones estándar siempre son

positivas.

Propiedades del Coeficiente de Correlación1. Si la no hay una relación lineal entre

las variables. Si = 1 implica una relación lineal positiva y

perfecta; si la correlación es cercana a 1 indica un fuerte grado de

asociación lineal positiva. De la misma forma si = – 1

implica una relación lineal negativa perfecta; si la correlación es

cercana a – 1 indica un fuerte grado de asociación lineal negativa.

2. Para constantes a1, b1, a2 y b2 con a1 a2 > 0

. Sí a1 a2 < 0

.

ALGUNAS DISTRIBUCIONES DE PROBABILIDAD

La distribución Normal y las que se derivan de ella son las más empleadas

en estadística y econometría. A partir de estas distribuciones es que se

realiza la inferencia estadística en econometría.

Distribución NormalSe dice que una variable aleatoria esta normalmente distribuida si su FDP

tiene la forma:

Jhon Alexis Diaz Contreras 14

Page 15: IntroDucciOn

Notas de Clase Econometría I – Introducción

Propiedades de la Distribución Normal1. Es simétrica alrededor de su valor medio.

2. A una desviación estándar se encuentra el 68% de los datos, a dos

desviaciones estándar se encuentra el 95% y a tres desviaciones

estándar el 99.7% de los datos.

3. Dados los parámetros y se puede encontrar la probabilidad de

que x se encuentre dentro de cierto intervalo. Para esto, la variable

x normalmente distribuida con media y se convierte en una

variable Z normal estandarizada mediante:

Sí X ~ N(µ, σ2) entonces ahora X ~ N(0, 1).

4. Sí X1 ~ y X2 ~ entonces se tiene que

Y ~

Distribución (Ji – Cuadarado)Sean Z1, Z2,…, Zk variables normales estándar independientes, entonces

sigue la distribución con k grados de libertad.

Propiedades de la Distribución Ji- Cuadrado1. La media de es k y su varianza es 2k.

2. Si Z1 y Z2 son dos variables que se distribuyen con k1 y k2 grados

de libertad. Entonces Z1 + Z2 es también una variable con k1 + k2

grados de libertad.

3. La distribución es asimétrica y el grado de asimetría depende de

los grados de libertad.

Jhon Alexis Diaz Contreras15

Page 16: IntroDucciOn

Notas de Clase Econometría I – Introducción

Distribución t de StudentSi Z1 es una variable normal estandarizada y otra variable Z2 sigue la

distribución con k grados de libertad, entonces sigue una

distribución t de student con k grados de libertad.

Propiedades de la Distribución t de Student1. Es simétrica pero más plana que la distribución normal.

2. La media de la distribución t es cero y su varianza es

Distribución F de FischerSi Z1 y Z2 son variables distribuidas independientemente con k1 y k2

grados de libertad, entonces sigue la distribución F con k1 y k2

grados de libertad.

Propiedades de la Distribución F de Fischer1. Esta sesgada a la derecha, a medida que k1 y k2 aumentan se

acerca a una normal.

2. La media de una distribución F es y su varianza es

3. El cuadrado de una variable aleatoria con distribución t con k

grados de libertad es una distribución F con 1 y k grados de

libertad

INFERENCIA ESTADÍSTICAEstimación PuntualSe establece un estadístico que toma un valor numérico particular llamado

estimación. Por ejemplo, si queremos conocer la media de una población,

representada por , podemos tomar una muestra aleatoria de la población y

Jhon Alexis Diaz Contreras 16

Page 17: IntroDucciOn

Notas de Clase Econometría I – Introducción

estimar el parámetro poblacional por medio de un estimador muestral

llamado .

Estimación por IntervalosSe establece un rango de posibles valores dentro de los cuales se puede

encontrar el parámetro. Por ejemplo, si se supone que una variable está

distribuida normalmente la media muestral también está normalmente

distribuida; así, el verdadero valor de se encuentra dentro de un Intervalo

de Confianza de la forma

PUEBAS DE HIPÓTESISUna de las herramientas estadísticas más utilizadas en la econometría son

las Pruebas de Hipótesis. El problema de una prueba de hipótesis puede

plantearse así:

Supóngase que se tiene una variable aleatoria X con una FDP conocida

, donde es el parámetro de la distribución. Después de obtener una

muestra aleatoria de tamaño n, se obtiene el estimador puntual . Puesto

que el verdadero casi nunca se conoce, se plantea la pregunta: ¿Es el

estimador compatible con algún valor de bajo hipótesis, por ejemplo,

, donde es un valor numérico específico de ? En el lenguaje de las

pruebas de hipótesis, se denomina hipótesis nula y generalmente se

denota por . Esta hipótesis nula se contrasta con una hipótesis

alternativa denotada por , la cual, por ejemplo, puede plantear que .

Existen dos enfoques para abordar el problema de la prueba de hipótesis, el

del intervalo de confianza y el de la prueba de significancia. Se asume que

el estudiante está en capacidad de abordar y comprender por si solo el

Jhon Alexis Diaz Contreras17

Page 18: IntroDucciOn

Notas de Clase Econometría I – Introducción

enfoque del intervalo de confianza. Por ser el más usado en econometría se

presentará el enfoque de la prueba de significancia.

Hay que recordar que:

Para cualquier muestra dada se conocen los valores de y . Si se supone

que , entonces puede ser directamente calculado y se puede

utilizar la distribución normal para encontrar la probabilidad de obtener el

valor de calculado. Si esta probabilidad es baja, por ejemplo menor que

5%, se puede rechazar la hipótesis nula.

Específicamente, la decisión de rechazar o no rechazar una hipótesis nula

depende del nivel de significancia “ ” que se plantee. Si la probabilidad del

estadístico calculado es menor que se rechaza la hipótesis nula; por el

contrario si la probabilidad del estadístico calculado es mayor que no se

rechaza la hipótesis nula.

1.3 INTRODUCCION A LA TEORIA ASINTOTICAPara realizar análisis empírico con cierto rigor, se deben tener muestras

grandes. La teoría asintótica estudia el comportamiento de los estimadores

cuando la muestra es grande (tiende a infinito). De la teoría asintótica solo

estudiaremos la consistencia y la normalidad asintótica.

ConsistenciaSea un estimador de , basado en una muestra de tamaño n.

Entonces, es un estimador consistente de , si para cada

cuando

Jhon Alexis Diaz Contreras 18

Page 19: IntroDucciOn

Notas de Clase Econometría I – Introducción

Cuando es consistente, decimos también que es el límite de la

probabilidad de y se escribe como

A pesar de que no todo estimador pueda ser en principio consistente se

puede llegar a este resultado si se cumple lo siguiente: Si es un

estimador insesgado de y cuando , entonces .

Lo que permite estos resultados de consistencia es la Ley de los grandes

números.

Ley de Los Grandes Números Sea variables aleatorias independientes e idénticamente

distribuidas con media . Entonces, .

NormalidadLa consistencia y la ley de los grandes números nos dicen que la

distribución del estimador se colapsa alrededor del verdadero parámetro a

medida que aumenta el tamaño de la muestra, pero no nos dice nada acerca

de la forma de tal distribución. En econometría para que las pruebas de

hipótesis y los intervalos de confianza tengan validez necesitamos una forma

de aproximar esta distribución.

Sea una sucesión de variables aleatorias, tal que para toda z,

cuando ; entonces tiene una distribución normal

estándar asintótica. Este resultado es posible gracias al teorema del límite

central.

Teorema del Límite CentralSea una muestra aleatoria con media y varianza . Entonces,

tiene una distribución normal estándar asintótica. En otras

Jhon Alexis Diaz Contreras19

Page 20: IntroDucciOn

Notas de Clase Econometría I – Introducción

palabras la distribución completa de se acerca arbitrariamente a la

distribución normal estándar a medida que n crece.

2. EL MODELO CLÁSICO DE REGRESIÓN LINEAL SIMPLE

2.1 CONCEPTOS BÁSICOS

Análisis de Regresión PoblacionalEs la estimación de la media o valor promedio de la variable dependiente

con base en los valores conocidos o fijos de las variables independientes.

Para el caso de la regresión lineal simple, lo que interesa es “explicar y en

términos de x”. La notación que expresa este problema es:

Jhon Alexis Diaz Contreras 20

Page 21: IntroDucciOn

Notas de Clase Econometría I – Introducción

Función de Regresión Poblacional

Función de Regresión Lineal Poblacional FRLP

La linealidad de la función esta dada en los parámetros y las variables. A la

variable y se le conoce como variable dependiente, explicada, de respuesta

o regresando; y la variable x se llama variable independiente, explicativa,

control o regresor.

Especificación Estocástica de la FRLPSin embargo, la FRLP es una expresión determinística y el análisis de

regresión es esencialmente estocástico. Se considera así, ya que no es

posible, por diferentes motivos, encontrar todas las variables explicativas

que inciden directamente sobre la variable dependiente. De esta forma, la

especificación estocástica de la FRLP es:

La variable ui es el término de error ó de perturbación de la función y

representa todos aquellos factores que influyen sobre y aparte de x. El

término de error, puede ser generado por diferentes motivos:

No hay disponibilidad de la información: Usualmente, es característico

de los modelos econométricos requerir de información que en muchas

ocasiones no es fácil de encontrar. Por ejemplo, a veces se definen

variables para las cuales no existe información disponible; otras veces,

la información que se requiere para el modelo no es pública y llevar a

cabo encuestas para recolectar la información puede resultar costoso.

Variables centrales vs. Variables periféricas: Pueden ser numerosas

las variables explicativas que permiten determinar el comportamiento

de una variable endógena; sin embargo, por claridad en la expocisión

y explicación del problema, se recurre a aquellas variables que son

más relevantes.

Jhon Alexis Diaz Contreras21

Page 22: IntroDucciOn

Notas de Clase Econometría I – Introducción

Principio de Parsimonia: Un modelo debe conseguir el mayor grado de

explicación haciendo uso del menor número de variables posible

De la misma forma el término ui es esencial en la interpretación de una

FRLP. Si los factores de u se mantienen fijos tal que , x tiene un efecto

lineal sobre y:

Así, el cambio en y es multiplicado por el cambio en x. De aquí se obtiene

una conclusión fundamental en la economía aplicada: mide la relación

entre y y x si se mantienen fijos los otros factores medidos por u.

Ahora si suponemos que es lineal entonces se puede escribir que:

Si se toma el valor esperado de se obtiene que:

El anterior resultado nos dice que el valor promedio de u no depende de x y

esto implica además que . Estos resultados serán fundamentales a la

hora de estimar los valores muestrales de los parámetros.

2.2 ESTIMACIÓN POR EL MÉTODO DE MÍNIMOS CUADRADOS ORDINARIOSLo más importante en el análisis de regresión es la estimación de los

parámetros. Para esto se puede hacer uso del Método de Mínimos

Jhon Alexis Diaz Contreras 22

Page 23: IntroDucciOn

Notas de Clase Econometría I – Introducción

Cuadrados Ordinarios (MCO). Primero, necesitamos una muestra de la

población; por lo tanto la FRLM es:

Ahora utilicemos las conclusiones que se derivaron de la sección anterior,

en términos de la población con respecto al error. El y la

. De esta forma podemos escribir que:

En términos muestrales, para estimar y las ecuaciones anteriores se

puede expresar como:

Dado que por propiedades de la sumatoria tenemos que la

primera ecuación se puede escribir como . De lo anterior se

deduce que .

La segunda ecuación puede utilizarse para obtener el . Si se elimina n-1 y

se incluye el resultado de en esta ecuación tenemos:

Que al reordenar da

De las propiedades del operador sumatoria se tiene que

y . En últimas, se concluye

que:

Jhon Alexis Diaz Contreras23

Page 24: IntroDucciOn

Notas de Clase Econometría I – Introducción

Las estimaciones de los parámetros que se acaban de deducir se conocen

como estimadores de mínimos cuadrados ordinarios. Las conclusiones

anteriores se pueden obtener a partir de . El residuo puede

expresarse como . Ahora si lo que se busca es elegir los

coeficientes que minimicen la suma de los residuales al cuadrado se tiene

que:

Las ecuaciones de las cuales se obtuvieron los estimadores son las

condiciones de primer orden del problema de minimización anterior y si se

realizan los cálculos correctos se llegan a los mismos resultados.

Propiedades de los Estimadores de Mínimos Cuadrados Ordinarios1. Se dice que los estimadores MCO son lineales si provienen de una función

lineal de una variable aleatoria.

2. Se dice que los estimadores de MCO son insesgados si su valor promedio

o esperado es igual a su valor verdadero .

3. Se dice que los estimadores MCO son eficientes si dentro de la clase de

todos los estimadores lineales insesgados son los de mínima varianza.

Teorema de Gauss – Markov: Dados los supuestos del modelo de regresión lineal, los estimadores de

mínimos cuadrados ordinarios, dentro de la clase de estimadores lineales

insesgados, tienen varianza mínima; es decir, son MELI.

2.3 VALORES ESPERADOS Y VARIANZAS DE LOS ESTIMADORES

Jhon Alexis Diaz Contreras 24

Page 25: IntroDucciOn

Notas de Clase Econometría I – Introducción

Para comprobar las propiedades de los estimadores de MCO se plantean

unos supuestos que permiten mostrar el insesgamiento y la varianza de de

los mismos. Los supuestos son:

SRLS 1. Lineal en los ParámetrosEn el modelo poblacional, la variable dependiente y se relaciona con la

variable independiente x y el error u así:

SRLS 2. Muestreo AleatorioDel modelo poblacional se puede tomar una muestra aleatoria de tamaño n

SRLS 3. Media Condicional Cero

SRLS 4. Variación Muestral en la Variable IndependienteEn la muestra, las variables independientes no son todas

iguales a una misma constante. Se requiere cierta variación de x en la

población.

Teorema Insesgamiento de los Estimadores MCOBajo las suposiciones RLS1 a RLS4 se tiene que .

SRLS 5. HomoscedasticidadLa varianza del error es constante; es decir, . En otras palabras

se supone que la varianza del error no depende de las variables

independientes. Cuando la depende de x se dice que el término de

error presenta Heteroscedasticidad.

Teorema Varianza Muestrales de los Estimadores de MCO

Jhon Alexis Diaz Contreras25

Page 26: IntroDucciOn

Notas de Clase Econometría I – Introducción

Bajo los supuestos RLS1 a RLS5 se tiene que y

.

Estimación de la Varianza del ErrorComo se puede observar en las ecuaciones anteriores, las varianzas de los

estimadores dependen de la varianza del modelo; es decir de . Sin

embargo, esta casi nunca se conoce y por lo tanto hay que estimarla. Antes

de pasar a la estimación de , resulta útil aclarar la diferencia entre los

errores y los residuos.

La ecuación muestra cómo escribir el modelo poblacional en

términos de una observación elegida al azar, donde es el error de la

observación i. Estos errores no son observables y aparecen solo en las

ecuaciones que contengan los parámetros poblacionales y . También se

puede expresar en términos de su valor ajustado y de su residuo, como en

la ecuación , donde son los residuos de la estimación y

pueden calcularse de los datos.

Ya que se ha hecho la distinción entre los errores y el residuo ya se puede

calcular el estimador de la varianza del modelo. Esta se puede calcular

como . En otras palabras el estimador de la varianza del

modelo es la Suma de Residuales al Cuadrado sobre los grados de libertad.

Para calcular el error estándar de la regresión se procede de la forma usual;

es decir se obtiene la raíz cuadrada de la varianza.

Jhon Alexis Diaz Contreras 26

Page 27: IntroDucciOn

Notas de Clase Econometría I – Introducción

2.4 UNIDADES DE MEDIDA Y FORMA FUNCIONAL

Unidades de medidaSupongamos que se tiene la siguiente regresión:

donde la fonación bruta de capital fijo FBKF, es una función lineal del PIB.

Ambas variables están expresadas en miles de millones de pesos. ¿Cómo

cambian los resultados de la regresión sí en lugar de que las variables estén

medidas en miles de millones de pesos, se miden en millones de pesos?

Para contestar a esta pregunta, definamos entonces a:

donde yi = FBKF y xi = PIB. Ahora, definamos a y donde y

son factores de escala. Por lo tanto se puede estimar la regresión:

Y de esta regresión los nuevos estimadores se definen como y

. Los demás estimadores que se han obtenido hasta ahora se

puede redefinir así:

EjemploPara la regresión , con las variables en miles de

millones; expresar la regresión con FBKF en miles de millones y PIB en

millones.

Los factores de escala son y . Por lo tanto, utilizando los

resultados anteriores tenemos que la nueva regresión es

Jhon Alexis Diaz Contreras27

Page 28: IntroDucciOn

Notas de Clase Econometría I – Introducción

Forma FuncionalEn econometría no siempre las variables se expresan en niveles y además en

algunas ocasiones en economía aplicada son muy útiles las elasticidades.

Por esto, es muy común emplear modelos logarítmicos y combinaciones de

modelos lineales con logarítmicos. Para cada forma funcional, las relaciones

entre la variable dependiente y la variable independiente, expresadas en los

coeficientes, se interpretan de manera diferente. La interpretación de la

relación para cada uno de los modelos es la siguiente:

Modelo

Variable

Independi

ente

Variable

Dependient

e

Cambio en x

en:

Cambio en y

en:

Nivel -

Nively x 1 unidad unidades

Nivel –

Logy Log (x) 1 %

( /100)

unidades

Log –

NivelLog (y) x 1 unidad ( *100)%

Log – Log Log (y) Log (x) 1 % %

Ejemplo Supongamos que se tiene un modelo de la forma el cual

puede ser expresado en forma lineal como donde

. La importancia de modelos de este tipo en Economía Aplicada

radica en que el parámetro mide la elasticidad de y con respecto x;

es decir, el cambio porcentual en y ante un cambio porcentual en x. El

siguiente modelo relaciona el consumo del café con su precio:

De este modelo se puede decir que si el precio del café se incrementa

en 1%, el consumo de café disminuye en 0.25%.

Jhon Alexis Diaz Contreras 28

Page 29: IntroDucciOn

Notas de Clase Econometría I – Introducción

Asumamos que se tiene el siguiente modelo donde

PIB en el tiempo t; PIB inicial; tasa de crecimiento del

PIB. Un modelo como el anterior puede expresarse como

donde y ; de esta forma el

modelo es . Se estimó el modelo anterior y se

obtuvieron los siguientes resultados

De este modelo se concluye que el PIB real crece a una tasa de

2.469% por año.

Se tiene una relación del PIB con los cambios porcentuales en la

Oferta Monetaria expresada en el siguiente modelo

. Se realizaron los cálculos y se obtuvo el

siguiente modelo:

El PIB aumenta 25.848 mil millones de pesos por cada aumento del

1% en la oferta monetaria.

Para relacionar la Formación Bruta de Capital Fijo con el PIB se

plantea el siguiente modelo que arrojó los siguientes

resultados:

Si el PIB aumenta en 1000 millones la Formación Bruta de Capital Fijo

se incrementa en 0.17395 miles de millones.

2.5 MEDIDA DE BONDAD DE AJUSTE: EL r2

Para encontrar una medida de que tan bien explica la variable

independiente a la variable dependiente, es necesario utilizar algunas

propiedades algebraicas de los estimadores de MCO.

Jhon Alexis Diaz Contreras29

Page 30: IntroDucciOn

Notas de Clase Econometría I – Introducción

La suma y el promedio muestral de los residuos suman cero.

Matemáticamente, De esta propiedad se deduce que los

estimadores de MCO se eligen para que los residuos sumen cero.

El promedio muestral de los residuos de los MCO es cero.

Con estas propiedades es posible escribir una regresión para cada i como

y se nota como se puede descomponer cada i es dos partes; los

valores ajustados y los residuos. En función de lo anterior, se define a la

Suma Total de Cuadrados (STC) como:

La STC mide la variación muestral de ; es decir que tan disperso esta en

la muestra. Así mismo se define la Suma Explicada de Cuadrados (SEC)

como la variación muestral de , matemáticamente se puede expresar

como:

Por último se tiene a la Suma de Residuales al Cuadrado (SRC) que mide la

variación muestral de :

De las definiciones anteriores se puede mostrar que STC = SEC + SRC. Con

este resultado se puede obtener el coeficiente de determinación o R2. Si se

divide todo sobre la STC se obtiene que:

El coeficiente de determinación es la proporción de la variación explicada

en la variación total y por lo tanto se interpreta como el porcentaje en la

variación de y que es explicado por la variación en x.

Jhon Alexis Diaz Contreras 30

Page 31: IntroDucciOn

Notas de Clase Econometría I – Introducción

2.6 INTERPRETACIÓN E INFERENCIA ESTADÍSTICA EN EL MCRLPara realizar Test de Hipótesis con el modelo de regresión lineal se debe

suponer que cada está normalmente distribuido. Lo anterior se puede

notar como:

Es decir, los errores se encuentran distribuidos como ~ . Bajo

este supuesto se puede construir intervalos de confianza y pruebas de

hipótesis.

Intervalos de ConfianzaSi suponemos que están normalmente distribuidos los coeficientes del

modelo y también están normalmente distribuidos; por ejemplo:

Pero dado que no se conoce se estima a partir de y entonces se puede

escribir como:

En general un IC se puede construir como y a un nivel de

significancia dado se lee como la probabilidad de que el verdadero beta

poblacional se encuentre entre los límites del intervalo.

Pruebas de HipótesisLa idea del análisis de regresión lineal es encontrar los coeficientes que

capten la relación entre las variables. Por esto es necesario realizar un test

de hipótesis para probar que los betas estimados no son, estadísticamente,

iguales a cero.

Jhon Alexis Diaz Contreras31

Page 32: IntroDucciOn

Notas de Clase Econometría I – Introducción

A un nivel de significancia (α) dado y con n – 2 grados de libertad se calcula

un t estadístico de la forma y se concluye como sigue: Bajo la

hipótesis nula si el t calculado es menor (en valor absoluto) que el t

crítico No se rechaza la hipótesis y existe evidencia estadística de que el

beta sea igual a cero. Por el contrario si el t calculado es mayor (en valor

absoluto) que el t crítico se rechaza la hipótesis y existe evidencia

estadística de que el beta sea igual no es igual cero.

Una manera muy sencilla de realizar una evaluar una hipótesis es utilizando

el valor p del estadístico calculado. A un nivel de significancia dado si se

rechaza la hipótesis nula; y si no se rechaza la hipótesis nula.

Análisis de VarianzaEl análisis de varianza es útil cuando se quiere establecer si los betas de

manera conjunta son estadísticamente iguales a cero o no. Para el caso del

análisis de regresión lineal, esta prueba no es de mucha importancia ya que

existe solo un coeficiente para evaluar (el que acompaña la x); sin embargo

cuando se tiene más de una variable explicativa esta prueba arroja

resultados robustos.

Bajo la hipótesis nula de se utiliza la información del

análisis de varianza para realizar un test de Fischer.

Fuente de Variación Grados de Libertad Estadístico

F

SEC 1 SEC/SRC

SRC n – 2

STC n – 1

Jhon Alexis Diaz Contreras 32

Page 33: IntroDucciOn

Notas de Clase Econometría I – Introducción

El estadístico F se compara con un Fcritico con α nivel de significancia y 1 y n

– 2 grados de libertad en el numerados y en el denominador

respectivamente. Sí el estadístico F es mayor que Fcritico se rechaza la

hipótesis nula; de lo contrario no se rechaza.

Jhon Alexis Diaz Contreras33