El análisis de correlación en la regresión múltiple
description
Transcript of El análisis de correlación en la regresión múltiple
![Page 1: El análisis de correlación en la regresión múltiple](https://reader034.fdocumento.com/reader034/viewer/2022052322/5571f18549795947648b5853/html5/thumbnails/1.jpg)
Análisis de correlación en regresión múltiple
![Page 2: El análisis de correlación en la regresión múltiple](https://reader034.fdocumento.com/reader034/viewer/2022052322/5571f18549795947648b5853/html5/thumbnails/2.jpg)
• Si el modelo de ajuste será perfecto.
• Si el modelo de ajuste no será perfecto. El vector de los residuos no será nulo y, en consecuencia, los valores observados y estimados serán diferentes entre sí.
YY0eee' ˆ00 SCR
Calidad del modelo de ajuste
0SCR
0SCR
![Page 3: El análisis de correlación en la regresión múltiple](https://reader034.fdocumento.com/reader034/viewer/2022052322/5571f18549795947648b5853/html5/thumbnails/3.jpg)
Calidad del modelo de ajuste (II)
• Si es pequeña, la calidad del modelo de ajuste será buena pero ¿cómo sabremos si es grande o pequeña?
• Tendremos que comparar con otra “suma de cuadrados”. Para obtener esa otra suma llevaremos a cabo un análisis de la desviación de cada observación respecto a la media.
SCR
SCR
SCR
![Page 4: El análisis de correlación en la regresión múltiple](https://reader034.fdocumento.com/reader034/viewer/2022052322/5571f18549795947648b5853/html5/thumbnails/4.jpg)
Análisis de la desviación de cada observación
• Dada una observación cualquiera podemos expresar la desviación de la variable dependiente respecto a la media del siguiente modo:
• Esta desviación la podemos descomponer en dos partes:
yyi
iiii yyyyyy ˆˆ
![Page 5: El análisis de correlación en la regresión múltiple](https://reader034.fdocumento.com/reader034/viewer/2022052322/5571f18549795947648b5853/html5/thumbnails/5.jpg)
Análisis de la desviación de cada observación (II)
• es la desviación respecto a la media• es la desviación que es explicada por las
variables explicativas• es el residuo o la desviación que no
explican las variables explicativas
yyi yyi ˆ
ii yy ˆ
![Page 6: El análisis de correlación en la regresión múltiple](https://reader034.fdocumento.com/reader034/viewer/2022052322/5571f18549795947648b5853/html5/thumbnails/6.jpg)
Cuadrados de las desviaciones
• Si calculamos los cuadrados de las desviaciones:
• Esta expresión se cumple para todos los individuos. Por tanto, si las sumamos para todos ellos:
iiiiiii yyyyyyyyyy ˆˆ2ˆˆ 222
n
iiii
n
iii
n
ii
n
ii yyyyyyyyyy
11
2
1
2
1
2 ˆˆ2ˆˆ
![Page 7: El análisis de correlación en la regresión múltiple](https://reader034.fdocumento.com/reader034/viewer/2022052322/5571f18549795947648b5853/html5/thumbnails/7.jpg)
Sumas de cuadrados de las desviaciones
• Pero, como se puede comprobar fácilmente,
• Y en consecuencia:
n
iii
n
ii
n
ii yyyyyy
1
2
1
2
1
2 ˆˆ
0ˆˆ1
n
iiii yyyy
![Page 8: El análisis de correlación en la regresión múltiple](https://reader034.fdocumento.com/reader034/viewer/2022052322/5571f18549795947648b5853/html5/thumbnails/8.jpg)
Sumas de cuadrados de las desviaciones (II)
• Suma total de cuadrados (STC): es una medida de la variabilidad de la variable dependiente cuando no tomamos en consideración la información que nos proporcionan las variables explicativas.
• Suma de cuadrados de los residuos (SCR): es una medida de la variabilidad de la variable dependiente cuando tomamos en consideración la información que nos proporcionan las variables explicativas.
• Suma de cuadrados explicada (SCE): es la parte de la variabilidad de la variable dependiente que es explicada por las variables independientes.
n
ii yy
1
2ˆ
n
ii yy
1
2
n
iii yy
1
2ˆ
![Page 9: El análisis de correlación en la regresión múltiple](https://reader034.fdocumento.com/reader034/viewer/2022052322/5571f18549795947648b5853/html5/thumbnails/9.jpg)
Sumas de cuadrados de las desviaciones (III)
n
ii yy
1
2
n
iii yy
1
2ˆ
n
ii yy
1
2ˆ
![Page 10: El análisis de correlación en la regresión múltiple](https://reader034.fdocumento.com/reader034/viewer/2022052322/5571f18549795947648b5853/html5/thumbnails/10.jpg)
Coeficiente de determinación
• Es la proporción de la variabilidad de la variable dependiente que queda explicada por las variables independientes:
n
ii
n
iii
yy
yy
STC
SCR
STC
SCER
1
2
1
2
2
ˆ
11
10 2 R
![Page 11: El análisis de correlación en la regresión múltiple](https://reader034.fdocumento.com/reader034/viewer/2022052322/5571f18549795947648b5853/html5/thumbnails/11.jpg)
Coeficiente de determinación (II)
• Es una medida de la calidad del ajuste:– Si la calidad del ajuste no es buena y,
en principio, las variables explicativas no explican la variabilidad de la variable dependiente.
– Si la calidad del ajuste es buena y, en principio, las variables explicativas explican la variabilidad de la variable dependiente.
02 R
12 R
![Page 12: El análisis de correlación en la regresión múltiple](https://reader034.fdocumento.com/reader034/viewer/2022052322/5571f18549795947648b5853/html5/thumbnails/12.jpg)
Coeficiente de determinación (III)
• Cuando añadimos una nueva variable explicativa al modelo de ajuste R2 siempre aumenta (¿por qué?):
• Para poder comparar modelos con un número diferente de variables explicativas utilizaremos otro coeficiente al que llamaremos coeficiente de determinación corregido (o ajustado).
112
12 ,,...,,..., jjj XXXRXXR
![Page 13: El análisis de correlación en la regresión múltiple](https://reader034.fdocumento.com/reader034/viewer/2022052322/5571f18549795947648b5853/html5/thumbnails/13.jpg)
Coeficiente de determinación corregido
2
2
1
2
1
2
2 1
1
1
ˆ
1y
n
ii
n
iii
s
s
n
yy
kn
yy
R
• : varianza estimada de la variable dependiente cuando tomamos en cuenta la información de las variable explicativas.
• : varianza estimada de la variable dependiente cuando no tomamos en cuenta la información de las variables explicativas.
2s
2ys
![Page 14: El análisis de correlación en la regresión múltiple](https://reader034.fdocumento.com/reader034/viewer/2022052322/5571f18549795947648b5853/html5/thumbnails/14.jpg)
Coeficiente de correlación parcial(k=2)
• : Porcentaje de variación explicado por X1
• : Porcentaje de variación no explicado por X1
• : Porcentaje de variación explicado por el conjunto {X1, X2}
• : Diferencia entre los porcentajes de variación explicados por X1 y por el conjunto {X1, X2}
2/
2/
2,/
2/
2,/2
/
1
121
1
21
12 11
11
XY
XYXXY
XY
XXYXYX R
RR
R
RR
2/
2,/ 121 XYXXY RR
2/ 1XYR
2/ 1
1 XYR
2,/ 21 XXYR
![Page 15: El análisis de correlación en la regresión múltiple](https://reader034.fdocumento.com/reader034/viewer/2022052322/5571f18549795947648b5853/html5/thumbnails/15.jpg)
2/ 1XYR
2/ 1
1 XYR
2,/ 21 XXYR
2,/ 21
1 XXYR
2/
2/
2,/
2/
2,/2
/
1
121
1
21
12 11
11
XY
XYXXY
XY
XXYXYX R
RR
R
RR
Coeficiente de correlación parcial(II)(k=2)
![Page 16: El análisis de correlación en la regresión múltiple](https://reader034.fdocumento.com/reader034/viewer/2022052322/5571f18549795947648b5853/html5/thumbnails/16.jpg)
2/ 1
1 XYR
2,/ 21
1 XXYR
2/
2/
2,/
2/
2,/2
/
1
121
1
21
12 11
11
XY
XYXXY
XY
XXYXYX R
RR
R
RR
Coeficiente de correlación parcial(III)(k=2)
2/
2,/ 121 XYXXY RR
![Page 17: El análisis de correlación en la regresión múltiple](https://reader034.fdocumento.com/reader034/viewer/2022052322/5571f18549795947648b5853/html5/thumbnails/17.jpg)
Coeficiente de correlación parcial (caso general)
• : Porcentaje de variación explicado por el conjunto {X1,..., Xj-1}
• : Porcentaje de variación no explicado por {X1,..., Xj-1}
• : Porcentaje de variación explicado por {X1,..., Xj-1 , Xj}
• : Diferencia entre los porcentajes de variación explicados por {X1,..., Xj-1 , Xj} y por {X1,..., Xj-1}
2,...,/
2,...,/ 111
jj XXYXXY RR
2,...,/ 11 jXXYR
2,...,/ 11
1
jXXYR
2,...,/ 1 jXXYR
2,...,/
2,...,/
2,...,/
2,...,/
2,...,/2
,...,/
11
111
11
1
11 11
11
j
jj
j
j
jj
XXY
XXYXXY
XXY
XXY
XXYX R
RR
R
RR
![Page 18: El análisis de correlación en la regresión múltiple](https://reader034.fdocumento.com/reader034/viewer/2022052322/5571f18549795947648b5853/html5/thumbnails/18.jpg)
2,...,/ 11 jXXYR
2,...,/ 11
1
jXXYR
2,...,/ 1 jXXYR
2,...,/ 1
1jXXYR
Coeficiente de correlación parcial (II)(caso general)
2,...,/
2,...,/
2,...,/
2,...,/
2,...,/2
,...,/
11
111
11
1
11 11
11
j
jj
j
j
jj
XXY
XXYXXY
XXY
XXY
XXYX R
RR
R
RR
![Page 19: El análisis de correlación en la regresión múltiple](https://reader034.fdocumento.com/reader034/viewer/2022052322/5571f18549795947648b5853/html5/thumbnails/19.jpg)
2,...,/ 11
1
jXXYR
2,...,/
2,...,/ 111
jj XXYXXY RR
2,...,/ 1
1jXXYR
2,...,/
2,...,/
2,...,/
2,...,/
2,...,/2
,...,/
11
111
11
1
11 11
11
j
jj
j
j
jj
XXY
XXYXXY
XXY
XXY
XXYX R
RR
R
RR
Coeficiente de correlación parcial (III)(caso general)
![Page 20: El análisis de correlación en la regresión múltiple](https://reader034.fdocumento.com/reader034/viewer/2022052322/5571f18549795947648b5853/html5/thumbnails/20.jpg)
Coeficiente de correlación parcial (IV) (caso general)
2,...,/
2,...,/
2,...,/
2,...,/
2,...,/2
,...,/
11
111
11
1
11 11
11
j
jj
j
j
jj
XXY
XXYXXY
XXY
XXY
XXYXYj R
RR
R
RRr
![Page 21: El análisis de correlación en la regresión múltiple](https://reader034.fdocumento.com/reader034/viewer/2022052322/5571f18549795947648b5853/html5/thumbnails/21.jpg)
Ejercicio
En el ejemplo de los alquileres, calcular los coeficientes de correlación parcial de las variables explicativas.