Econometria Salida Stata

15
Salidas de STATA Gabriel Moraga [email protected]

description

manual stata

Transcript of Econometria Salida Stata

Page 1: Econometria Salida Stata

Salidas de STATA

Gabriel [email protected]

Page 2: Econometria Salida Stata

Regresión Lineal

2

• La regresión lineal es una técnica estadística que permite determinar larelación existente entre una variable dependiente con una o más variablesindependientes.

• Permite: 1) Describir y cuantificar las relaciones entre las variables y 2)Predecir valores para la variable independiente.

• La regresión lineal se basa en la ecuación de la recta: Y = n + mX

Y

X

Y = n + mX

n

m =(𝑌2−𝑌1)

(𝑋2−𝑋1)

Y2

Y1

X2X1

Page 3: Econometria Salida Stata

Regresión Lineal

3

• La mejor forma de aproximar esta recta es reduciendo el error deestimación entre los valores predichos y los valores observados. Por locual, la recta que vamos a elegir es aquella que minimice las distanciasverticales entre las observaciones y el valor predicho.

• La forma utilizada para determinar la posición de la recta es reduciendo lasiguiente función:

𝑴𝒊𝒏𝒊𝒎𝒊𝒛𝒂𝒓

𝒊=𝟏

𝒏

(𝒚𝒊 − 𝒚𝒊 )𝟐

• Este método se denomina Mínimos Cuadrados Ordinarios (MCO)

Page 4: Econometria Salida Stata

4

10

12

14

16

0 5 10 15 20escolaridad

lnyopraj Fitted values

Ingresos y años escolaridad jefes de hogar en santiago

+ 𝜺𝒊 = 𝒚𝒊 − 𝒚𝒊

𝜺𝒊 = 𝒚𝒊 − 𝒚𝒊 (−)

Page 5: Econometria Salida Stata

Regresión Lineal: Interpretación de los estimadores MCO

5

• En el análisis de regresión podemos utilizar una variable explicativa, lo cualse conoce como una regresión simple o podemos utilizar un modelo conmás variables lo cual denominaremos regresión múltiple.

• Regresión simple: 𝑌 = 𝛼 + 𝛽𝑋

• Regresión múltiple:

𝑌 = 𝛼 + 𝛽1𝑋1 + 𝛽2𝑋2 + ⋯ + 𝛽𝑘𝑋𝑘

Page 6: Econometria Salida Stata

Ejemplo de regresión lineal en STATA

6

• En Stata utilizamos el comando “regress”

_cons 11.29522 .2107556 53.59 0.000 10.87859 11.71184

esc .1271122 .0159522 7.97 0.000 .0955777 .1586468

lnyopraj Coef. Std. Err. t P>|t| [95% Conf. Interval]

Total 96.9154433 143 .677730373 Root MSE = .68675

Adj R-squared = 0.3041

Residual 66.9702781 142 .471621676 R-squared = 0.3090

Model 29.9451652 1 29.9451652 Prob > F = 0.0000

F( 1, 142) = 63.49

Source SS df MS Number of obs = 144

. reg lnyopraj esc if comuna==13101 & pco1==1

(160916 missing values generated)

. gen lnyopraj=ln(yopraj)

Page 7: Econometria Salida Stata

Ejemplo de regresión lineal en STATA

7

• En Stata utilizamos el comando “regress”

_cons 11.29522 .2107556 53.59 0.000 10.87859 11.71184

esc .1271122 .0159522 7.97 0.000 .0955777 .1586468

lnyopraj Coef. Std. Err. t P>|t| [95% Conf. Interval]

Total 96.9154433 143 .677730373 Root MSE = .68675

Adj R-squared = 0.3041

Residual 66.9702781 142 .471621676 R-squared = 0.3090

Model 29.9451652 1 29.9451652 Prob > F = 0.0000

F( 1, 142) = 63.49

Source SS df MS Number of obs = 144

. reg lnyopraj esc if comuna==13101 & pco1==1

(160916 missing values generated)

. gen lnyopraj=ln(yopraj)

TABLA ANOVA AJUSTE DEL MODELO

ESTIMACIÓN DE PARÁMETROS

Page 8: Econometria Salida Stata

Descripción de los componentes de la salida en STATA

8

• Análisis de Varianza (ANOVA)

• Source (Fuente): Corresponde a las fuentes en que se descompone la varianzatotal del modelo para la variable dependiente. La varianza total se divide en lavarianza que puede ser explicada por las variables independientes (Modelo) y lavarianza no explicada, atribuible al termino de error o residuo.

_cons 11.29522 .2107556 53.59 0.000 10.87859 11.71184

esc .1271122 .0159522 7.97 0.000 .0955777 .1586468

lnyopraj Coef. Std. Err. t P>|t| [95% Conf. Interval]

Total 96.9154433 143 .677730373 Root MSE = .68675

Adj R-squared = 0.3041

Residual 66.9702781 142 .471621676 R-squared = 0.3090

Model 29.9451652 1 29.9451652 Prob > F = 0.0000

F( 1, 142) = 63.49

Source SS df MS Number of obs = 144

. reg lnyopraj esc if comuna==13101 & pco1==1

Page 9: Econometria Salida Stata

Descripción de los componentes de la salida en STATA

9

• Análisis de Varianza (ANOVA)

• SS (SC): son las sumas de cuadrados de cada fuente que explica la varianza total:

SS-Total = SS-Modelo + SS-Residual

𝒊=𝟏𝒏 (𝒚𝒊 − 𝒚)𝟐 = 𝒊=𝟏

𝒏 ( 𝒚𝒊 − 𝒚)𝟐+ 𝒊=𝟏𝒏 (𝒚𝒊 − 𝒚𝒊 )𝟐

_cons 11.29522 .2107556 53.59 0.000 10.87859 11.71184

esc .1271122 .0159522 7.97 0.000 .0955777 .1586468

lnyopraj Coef. Std. Err. t P>|t| [95% Conf. Interval]

Total 96.9154433 143 .677730373 Root MSE = .68675

Adj R-squared = 0.3041

Residual 66.9702781 142 .471621676 R-squared = 0.3090

Model 29.9451652 1 29.9451652 Prob > F = 0.0000

F( 1, 142) = 63.49

Source SS df MS Number of obs = 144

. reg lnyopraj esc if comuna==13101 & pco1==1

Page 10: Econometria Salida Stata

Descripción de los componentes de la salida en STATA

10

• Análisis de Varianza (ANOVA)

• df (gl): son los grados de libertad. Para la varianza total los grados de libertad sonN-1. Para el caso de la varianza del modelo los grados de libertad son iguales elnúmero de parámetros estimados 2 (incluido el intercepto) menos 1 (k-1).Finalmente los grados de libertad de la varianza del residuo se obtiene restandolos gl totales menos gl del modelo (N-1)-(k-1)= (N-k)-2

• Donde “N” es el número de observaciones y “k” el número de parámetrosestimado.

_cons 11.29522 .2107556 53.59 0.000 10.87859 11.71184

esc .1271122 .0159522 7.97 0.000 .0955777 .1586468

lnyopraj Coef. Std. Err. t P>|t| [95% Conf. Interval]

Total 96.9154433 143 .677730373 Root MSE = .68675

Adj R-squared = 0.3041

Residual 66.9702781 142 .471621676 R-squared = 0.3090

Model 29.9451652 1 29.9451652 Prob > F = 0.0000

F( 1, 142) = 63.49

Source SS df MS Number of obs = 144

. reg lnyopraj esc if comuna==13101 & pco1==1

Page 11: Econometria Salida Stata

Descripción de los componentes de la salida en STATA

11

• Análisis de Varianza (ANOVA)

• MS: Es la desviación media, y se obtiene dividiendo La suma de los cuadrados porsus grados de libertad (SS/df).

– MS-Modelo: SS-Modelo/(k-1)

– MS-Residual: SS-Residual/(N-k-2)

– MS-Total: SS-Total/(N-1)

_cons 11.29522 .2107556 53.59 0.000 10.87859 11.71184

esc .1271122 .0159522 7.97 0.000 .0955777 .1586468

lnyopraj Coef. Std. Err. t P>|t| [95% Conf. Interval]

Total 96.9154433 143 .677730373 Root MSE = .68675

Adj R-squared = 0.3041

Residual 66.9702781 142 .471621676 R-squared = 0.3090

Model 29.9451652 1 29.9451652 Prob > F = 0.0000

F( 1, 142) = 63.49

Source SS df MS Number of obs = 144

. reg lnyopraj esc if comuna==13101 & pco1==1

Page 12: Econometria Salida Stata

Ejemplo de regresión lineal en STATA

12

• Medidas de ajuste del modelo

• F(1, 142): Este es el estadístico F de Fisher y corresponde al MS explicado divididopor el MS del residuo (MS-modelo/MS-Residual). En paréntesis aparecen los gl delANOVA asociados a la varianza del modelo y la varianza del residuo. Esteestadístico permite testear la significancia conjunta del modelo. Cuando unmodelo está muy mal especificado el modelo podría resultar no significativo.

• Prob > F: Este es el valor “p” asociado al estadístico F. Sirve para testear lahipótesis nula de que todos los parámetros del modelo (coeficientes) son iguales acero.

_cons 11.29522 .2107556 53.59 0.000 10.87859 11.71184

esc .1271122 .0159522 7.97 0.000 .0955777 .1586468

lnyopraj Coef. Std. Err. t P>|t| [95% Conf. Interval]

Total 96.9154433 143 .677730373 Root MSE = .68675

Adj R-squared = 0.3041

Residual 66.9702781 142 .471621676 R-squared = 0.3090

Model 29.9451652 1 29.9451652 Prob > F = 0.0000

F( 1, 142) = 63.49

Source SS df MS Number of obs = 144

. reg lnyopraj esc if comuna==13101 & pco1==1

Page 13: Econometria Salida Stata

Ejemplo de regresión lineal en STATA

13

• Medidas de ajuste del modelo

• R-squared (R cuadrado): Mide la bondad de ajuste del modelo, varia entre 0 y 1.Donde cero es la ausencia de ajuste y 1 ajuste perfecto de la recta estimada. Secomputa como la proporción de la varianza explicada por el modelo sobre lavarianza total. La formula es la siguiente: (SS-Modelo/SS-Total)

• Este valor aumenta a medida que se incluyen más variables en el modelo.

_cons 11.29522 .2107556 53.59 0.000 10.87859 11.71184

esc .1271122 .0159522 7.97 0.000 .0955777 .1586468

lnyopraj Coef. Std. Err. t P>|t| [95% Conf. Interval]

Total 96.9154433 143 .677730373 Root MSE = .68675

Adj R-squared = 0.3041

Residual 66.9702781 142 .471621676 R-squared = 0.3090

Model 29.9451652 1 29.9451652 Prob > F = 0.0000

F( 1, 142) = 63.49

Source SS df MS Number of obs = 144

. reg lnyopraj esc if comuna==13101 & pco1==1

Page 14: Econometria Salida Stata

Ejemplo de regresión lineal en STATA

14

• Medidas de ajuste del modelo

• Adj R-squared (R cuadrado ajustado): Este estimador es un estimador del ajustedel modelo que penaliza la inclusion de nuevos regresores, es decir, no aumentanecesariamente e incluso podría disminuir. De este modo este R cuadradoajustado busca dar una medida de la bondad de ajuste para obtener comoresultado un modelo parsimonioso. La forma en que se computa este estadísticoes como el cuociente entre la variación media del modelo y la variación mediatotal: (MS-Modelo/Ms-Total)

• Root MSE (Raíz del ECM): Es la raíz del Error Cuadrático Medio, representa ladesviación estándar del término de erro o residuo, y se obtiene como la raizcuadrada del MS-Residual.

_cons 11.29522 .2107556 53.59 0.000 10.87859 11.71184

esc .1271122 .0159522 7.97 0.000 .0955777 .1586468

lnyopraj Coef. Std. Err. t P>|t| [95% Conf. Interval]

Total 96.9154433 143 .677730373 Root MSE = .68675

Adj R-squared = 0.3041

Residual 66.9702781 142 .471621676 R-squared = 0.3090

Model 29.9451652 1 29.9451652 Prob > F = 0.0000

F( 1, 142) = 63.49

Source SS df MS Number of obs = 144

. reg lnyopraj esc if comuna==13101 & pco1==1

Page 15: Econometria Salida Stata

Ejemplo de regresión lineal en STATA

15

• Estimación de parámetros

• La primera fila/columna aparece la variable dependiente.

• Coef: corresponde a los coeficientes estimados beta para la variable años deeducación y alpha para la constante.

• Std. Err.: Corresponde al Error Estándar del Coeficiente.

• T: Estadístico t para la hipótesis nula de coeficiente igual a cero.

• P>|t|: el p-value asociado al test

_cons 11.29522 .2107556 53.59 0.000 10.87859 11.71184

esc .1271122 .0159522 7.97 0.000 .0955777 .1586468

lnyopraj Coef. Std. Err. t P>|t| [95% Conf. Interval]

Total 96.9154433 143 .677730373 Root MSE = .68675

Adj R-squared = 0.3041

Residual 66.9702781 142 .471621676 R-squared = 0.3090

Model 29.9451652 1 29.9451652 Prob > F = 0.0000

F( 1, 142) = 63.49

Source SS df MS Number of obs = 144

. reg lnyopraj esc if comuna==13101 & pco1==1