Regresion Y Coeficiente de Correlacion Multiple
-
Upload
victor-levi-cruz-gonzales -
Category
Documents
-
view
7.770 -
download
2
Transcript of Regresion Y Coeficiente de Correlacion Multiple
El análisis de regresión múltiple es una técnica estadística que consiste en la extensión del análisis de regresión simple a una forma donde se aplican dos o mas variables independientes; X1, X2,…, Xk.; siendo: K>=2, para pronosticar el valor de la variable dependiente Y.
La estimación de la ecuación de regresión poblacional es la ecuación de regresión lineal múltiple muestral.
y=a+b1X1+b2X 2
Donde:
a, b1, b2,…, bk. : Son Coeficientes de Correlación Muestral
Para b1:
b1=[∑ x2
2−n(X 2)2 ] [∑ X1Y−n ( X1 )(Y )]−[∑ X1 X2−n (X 1) ( X2 ) ] [∑ X2Y−n ( X2 )(Y )]
[∑ x12−n(X1)
2 ] [∑ x22−n(X2)
2 ]−[∑ X1 X2−n ( X1 ) ( X2 ) ]2
Para b2:
b2=[∑ x1
2−n(X 1)2 ] [∑ X2Y−n ( X2 )(Y )]−[∑ X1 X2−n ( X1) ( X2 ) ] [∑ X1Y−n ( X1 )(Y )]
[∑ x12−n(X1)
2 ] [∑ x22−n(X2)
2 ]−[∑ X1 X2−n ( X1 ) ( X2 ) ]2
Para a:
a=Y−b1 X1−b2 X2
El Coeficiente de Correlación Múltiple indica la correlación entre una de las variables independientes y la variable dependiente, manteniendo la otra u otras variables independientes estadísticamente constante.
r=√ a∑Y +b1∑ X1Y +b2∑ X2Y−nY 2
∑ Y 2−nY 2
Ejemplo 1.
Se realiza un estudio de asociación entre las variables:
Y: Gastos mensuales expresados en cientos de dólares
X1: Ingreso mensual familiar en miles de dólares
X2: Tamaño de la familia.En una encuesta de 10 familias escogidas al azar se han encontrado los datos que se presentan en la tabla:
45 10 9 100 81 90 450 405 202540 9 8 81 64 72 360 320 160038 8 6 64 36 48 304 228 144435 7 6 49 36 42 245 210 122532 7 5 49 25 35 224 160 102430 6 4 36 16 24 180 120 90028 6 3 36 9 18 168 84 78427 4 2 16 4 8 108 54 72925 3 2 9 4 6 75 50 625
∑Y=322
Y=32.2
∑ X1=62
X1=6.2
∑ X2=46
X2=4.6
∑ X12=444∑ X2
2=276∑ X1 X2=345∑ X1Y=2158∑ X2Y=1653∑Y 2=10840
Determinar:
La ecuación de regresión múltiple muestral El coeficiente de Correlación múltiple
Solución:
Determinando la ecuación de regresión múltiple muestral
Y=a+b1X1+b2X 2
De los datos tenemos
n=10 ;∑ Y=322 ;∑ X1=62;∑ X2=46 ;∑ X12=444 ;∑ X2
2=276 ;∑ X1 X2=345 ;
∑ X1Y=2158 ;∑ X2Y=1653 ;∑Y 2=10840 ;Y=54.5; X1=49 ; X 2=14.83
Empleando la formula de regresión múltiple
b1=[∑ x2
2−n(X 2)2 ] [∑ X1Y−n ( X1 )(Y )]−[∑ X1 X2−n (X 1) ( X2 ) ] [∑ X2Y−n ( X2 )(Y )]
[∑ x12−n(X1)
2 ] [∑ x22−n(X2)
2 ]−[∑ X1 X2−n ( X1 ) ( X2 ) ]2
b1=64.4∗161.6−59.8∗171.8
59.6∗64.4−3576=133.4
262.2
b1=0.509
b2=[∑ x1
2−n(X 1)2 ] [∑ X2Y−n ( X2 )(Y )]−[∑ X1 X2−n ( X1) ( X2 ) ] [∑ X1Y−n ( X1 )(Y )]
[∑ x12−n(X1)
2 ] [∑ x22−n(X2)
2 ]−[∑ X1 X2−n ( X1 ) ( X2 ) ]2
b2=59.6∗171.8−59.8∗161.6
59.6∗64.4−3576=575.6
262.2
b2=2.195
a=Y−b1 X1−b2 X2
a=32.2−0.509∗6.2−2.195∗4.6
a=18.947
Reemplazando en la formula de Regresión Y.
Y=18.947+0.509 X1+2.195 X2
Determinando el coeficiente de correlación
r=√ a∑Y +b1∑ X1Y +b2∑ X2Y−nY 2
∑ Y 2−nY 2
r=√ 18.947∗322+0.509∗2158+2.195∗1653−10∗32.22
10840−10∗32.22
r=√ 6100.934+1098.42+3628.34−10368.410840−10368.4
⇒ r=0.986
Ejercicio desarrollado por sistema de ecuaciones de mínimo cuadrado
Formulas:
n∗a+∑ X1b1+∑ X2b2=∑Y
∑ X1a+∑ X12b1+∑ X 1X2b2=∑ X1Y
∑ X2a+∑ X1 X2b1+∑ X 22b2=∑ X2Y
10a+64 b1+46 b2=322
62a+444b1+345b2=2158
46 a+345b1+276b2=1653
Método Práctico para convertir el sistema de ecuaciones de 3 a 2 ecuaciones
Formulas:
∑ X12b1+∑ X1 X2b2=∑ X1Y
∑ X2 X1b1+∑ X22b2=∑ X2Y
Donde:
S x12=∑ X1
2−n(X1)2
S X22=∑ X2
2−n (X2)2
S X1 X2=∑ X1X 2−n(¿ X1)(X2)¿ S X1Y=∑ X1Y−n(¿ X1)(Y )¿ S X2Y=∑ X2Y−n(¿ X 2)(Y )¿
Reemplazando Los valores: 444−10∗6.22=59.6 276−10∗4.62=64.4 345−10∗6.2∗4.6=59.8 2158−10∗6.2∗32.2=161.6 1653−10∗4.6∗32.2=171.8
Sistema de 2 ecuaciones:
59.6b1+59.8b2=161.6 …. (1)
59.8b1+64.4 b2=171.8…. (2)
−59.8b1+60.001b2=−162.14
59.8b1+64.4 b2=171.8
4.399b2=9.66
b2=2.195
Reemplazando en (1)
59.6b1+131.26=161.6
59.6b1=30.34
b1=0.509
Para Obtener (a)
a=Y−b1 X1−b2 X2
a=32.2−0.509∗6.2−2.195∗4.6
a=18.947
Sistema de Regresión Múltiple Muestral
∴Y=18.947+0.509 X1+2.195 X 2
-59.8/59.6
Ejemplo 2
El departamento de producción de una fábrica de confecciones textiles desea explorar la relación entre el número de operadores (X ¿¿2)¿ que hacen pantalones, la edad promedio de ellos (X ¿¿1)¿, y la cantidad producida por semana (Y ); una muestra aleatoria para realizar el estudio reveló los siguientes datos:
30 28 10 784 100 280 840 300 90045 43 12 1849 144 516 1935 540 202552 48 14 2304 196 672 2496 728 270455 52 15 2704 225 780 2860 825 302570 60 17 3600 289 1020 4200 1190 490075 63 21 3969 441 1323 4725 1575 5625
a) Determinar la ecuación de regresión múltiple muestralb) Determine el coeficiente de correlación múltiple
Solución
Determinando la ecuación de regresión múltiple muestral
Y=a+b1X1+b2X 2
De los datos tenemos
n=6 ;∑Y=327 ;∑ X1=294 ;∑ X2=89 ;∑ X 12=15210 ;∑ X2
2=1395 ;
∑ X1 X2=4591 ;∑ X1Y=17056 ;∑ X2Y=5158 ;∑ Y 2=19179 ;Y=54.5 ; X1=49 ; X2=14.83
Empleando la formula de regresión múltiple
b1=[∑ x2
2−n(X 2)2 ] [∑ X1Y−n ( X1 )(Y )]−[∑ X1 X2−n (X 1) ( X2 ) ] [∑ X2Y−n ( X2 )(Y )]
[∑ x12−n(X1)
2 ] [∑ x22−n(X2)
2 ]−[∑ X1 X2−n ( X1 ) ( X2 ) ]2
b1=[1395−6 (14.83 )2 ] [17056−6∗49∗5435 ]−[ 4591−6∗49∗14.83 ] [ 5158−6∗14.83∗54.5 ]
[15210−6 (49 )2 ] [1395−6 (14.83 )2 ]− [ 4591−6∗49∗14.83 ]2
b1=6637.97
7291.548
b1=0.9
b2=[∑ x1
2−n(X 1)2 ] [∑ X2Y−n ( X2 )(Y )]−[∑ X1 X2−n ( X1) ( X2 ) ] [∑ X1Y−n ( X1 )(Y )]
[∑ x12−n(X1)
2 ] [∑ x22−n(X2)
2 ]−[∑ X1 X2−n ( X1 ) ( X2 ) ]2
Y X1 X2 X12 X2
2 X1 X2 X1Y X2Y Y 2
∑ X2=89
X2=14.83∑ X1
2=15210∑ X22=1395∑ X1 X2=4591∑ X1Y=17056∑ X2Y=5158∑Y 2=19179∑Y=327
Y=54.5∑ X1=294
X1=49
b2=[15210−6∗492 ] [ 5158−6∗14.83∗54.5 ]−[ 4591−6∗49∗14.83 ] [17056−6∗49∗54.5 ]
[15210−6 (49 )2 ] [1395−6 (14.83 )2 ]−[ 4591−6∗49∗14.83 ]2
b2=[804∗308.59 ]−[ 230.98∗1033 ]
804∗75.427−53351.76⟹b2= 9504.02
7291.548
b2=1.30
a=Y−b1 X1−b2 X2
a=54.5−0.9∗49−1.30∗1498
a=−8.879
Reemplazando en la formula de Regresión Y.
Y=−8.879+0.9 X1+1.30 X2
Determinando el coeficiente de correlación
r=√ a∑Y +b1∑ X1Y +b2∑ X2Y−nY 2
∑ Y 2−nY 2
r=√−8.879∗327+0.9∗17056+1.30∗5158−6∗54.52
19179−6∗54.52
r=√−2903.43+15350.4+6705.4−17821.519179−17821.5
r=√ 1330.871357.5
⟹ r=√0.98=0.99
Desarrollando por ecuaciones de mínimo cuadrado
n∗a+∑ X1b1+∑ X2b2=∑Y
∑ X1a+∑ X12b1+∑ X 1X2b2=∑ X1Y
∑ X2a+∑ X1 X2b1+∑ X 22b2=∑ X2Y
6a+294b1+89b2=327
294 a+15210b1+4591b2=17056
89a+4591b1+1395b2=5158
Método practico para convertir el sistema de ecuaciones de 3 a 2 ecuaciones
∑ X12b1+∑ X1 X2b2=∑ X1Y
∑ X2 X1b1+∑ X22b2=∑ X2Y
Donde:
S x12=∑ X1
2−n(X1)2
S X22=∑ X2
2−n (X2)2
S X1 X2=∑ X1X 2−n(¿ X1)(X2)¿ S X1Y=∑ X1Y−n(¿ X1)(Y )¿ S X2Y=∑ X2Y−n(¿ X 2)(Y )¿
Reemplazando Los valores: 15210−6∗4 92=804 1395−6∗14.832=75.426 4591−6∗49∗14.83=230.98 17056−6∗49∗54.5=1033 5158−6∗14.83∗54.5=308.59
Sistema de 2 ecuaciones:
804 b1+230.98b2=1033 …. (1)
230.98b1+75.426b2=308.59…. (2)
−230.98b1−66.357b2=−296.769
230.98b1+75.426b2=308.59
9.068b2=11.821
b2=1.30
Reemplazando en (1)
804 b1+230.98b2=1033
804 b1=230.98 (1.30 )=1033
b1=0. 9
Para Obtener (a)
a=Y−b1 X1−b2 X2
a=54.5−0.9∗49−1.30∗14.83=−8.879
Sistema de Regresión Múltiple Muestral
∴Y=−8.879+0.9 X 1+1.30 X 2
-230.98/804
1. El gerente de ventas de las llantas “GOOD BYE” que se venden en todo el país realiza un estudio para determinar la relación entre el numero de llantas vendidas por mes(Y en cientos) y los gastos de publicidad mensuales(en cientos de dólares), X1:Radio, X2: Periódicos . Los datos obtenidos en una muestra de 5 provincias se dan en la tabla que sigue.
4 13 15 169 225 195 52 60 165 12 16 144 256 192 60 80 255 15 18 225 324 270 75 90 256 14 17 196 289 238 84 102 367 16 17 256 289 272 112 119 49
a) Determinar la ecuación de regresión muestral de Y en X1, X2.
b) Hallar el coeficiente de Correlación
Solución
Determinando la ecuación de regresión múltiple muestral
Y=a+b1X1+b2X 2
De los datos tenemos
n=5 ;∑ Y=27 ;∑ X1=70 ;∑ X2=83;∑ X12=990 ;∑ X2
2=1383 ;
∑ X1 X2=1167;∑ X1Y=383 ;∑ X2Y=451 ;∑Y 2=151 ;Y=5.4 ; X1=14 ; X2=16.6
Empleando la formula de regresión múltiple
b1=[∑ x2
2−n(X 2)2 ] [∑ X1Y−n ( X1 )(Y )]−[∑ X1 X2−n (X 1) ( X2 ) ] [∑ X2Y−n ( X2 )(Y )]
[∑ x12−n(X1)
2 ] [∑ x22−n(X2)
2 ]−[∑ X1 X2−n ( X1 ) ( X2 ) ]2
b1=[1383−5 (16.6 )2 ] [383−5∗14∗5.4 ]− [1167−5∗14∗16.6 ] [ 451−5∗16.6∗5.4 ]
[990−5 (14 )2 ] [1383−5 (16.6 )2 ]− [1167−5∗14∗16.6 ]2
b1=5.2∗5−5∗2.8
10∗5.2−25=26−14
27=b1=0.44
Y X1 X2 X12 X2
2 X1 X2 X1Y X2Y Y 2
∑Y=27
Y=5.4∑ X1=70
X1=14∑ X2=83
X2=16.6∑ X1
2=990∑ X22=1383∑ X1 X2=1167∑ X1Y=383∑ X2Y=451∑Y 2=151
b2=[∑ x1
2−n(X 1)2 ] [∑ X2Y−n ( X2 )(Y )]−[∑ X1 X2−n ( X1) ( X2 ) ] [∑ X1Y−n ( X1 )(Y )]
[∑ x12−n(X1)
2 ] [∑ x22−n(X2)
2 ]−[∑ X1 X2−n ( X1 ) ( X2 ) ]2
b2=[ 990−5∗142 ] [ 451−5∗16.6∗5.4 ]−[1167−5∗14∗16.6 ] [ 383−5∗14∗5.4 ]
[990−5 (14 )2 ] [1383−5 (16.6 )2 ]−[ 1167−5∗14∗16.6 ]2
b2=[10∗2.8 ]−[ 5∗5 ]
10∗5.2−25⟹b2=28−25
27
b2=0.11
a=Y−b1 X1−b2 X2
a=5.4−0.44∗14−0.11∗16.6
a=−2.586
Reemplazando en la formula de Regresión Y.
Y=−2.586+0. X1+0.11X 2
Determinando el coeficiente de correlación
r=√ a∑Y +b1∑ X1Y +b2∑ X2Y−nY 2
∑ Y 2−nY 2
r=√−2.586∗27+0.44∗383+0.11∗451−5∗5.42
151−5∗5.42
r=√ 2.5085.2
⟹ r=0.69
2.