Regresion Y Coeficiente de Correlacion Multiple

12
El análisis de regresión múltiple es una técnica estadística que consiste en la extensión del análisis de regresión simple a una forma donde se aplican dos o mas variables independientes; X 1 , X 2 ,…, X k.; siendo: K>=2, para pronosticar el valor de la variable dependiente Y. La estimación de la ecuación de regresión poblacional es la ecuación de regresión lineal múltiple muestral. y=a+ b 1 X 1 +b 2 X 2 Donde: a, b 1 , b 2,…, b k. : Son Coeficientes de Correlación Muestral Para b 1 : b 1 = [ x 2 2 n( X 2 ) 2 ] [ X 1 Yn ( X 1 ) ( Y) ] [ X 1 X 2 n ( X 1 )( X 2 ) ][ X 2 Yn ( X 2 ) ( Y ) ] [ x 1 2 n ( X 1 ) 2 ][ x 2 2 n ( X 2 ) 2 ] [ X 1 X 2 n ( X 1 )( X 2 ) ] 2 Para b 2 :

Transcript of Regresion Y Coeficiente de Correlacion Multiple

Page 1: Regresion Y Coeficiente de Correlacion Multiple

El análisis de regresión múltiple es una técnica estadística que consiste en la extensión del análisis de regresión simple a una forma donde se aplican dos o mas variables independientes; X1, X2,…, Xk.; siendo: K>=2, para pronosticar el valor de la variable dependiente Y.

La estimación de la ecuación de regresión poblacional es la ecuación de regresión lineal múltiple muestral.

y=a+b1X1+b2X 2

Donde:

a, b1, b2,…, bk. : Son Coeficientes de Correlación Muestral

Para b1:

b1=[∑ x2

2−n(X 2)2 ] [∑ X1Y−n ( X1 )(Y )]−[∑ X1 X2−n (X 1) ( X2 ) ] [∑ X2Y−n ( X2 )(Y )]

[∑ x12−n(X1)

2 ] [∑ x22−n(X2)

2 ]−[∑ X1 X2−n ( X1 ) ( X2 ) ]2

Para b2:

b2=[∑ x1

2−n(X 1)2 ] [∑ X2Y−n ( X2 )(Y )]−[∑ X1 X2−n ( X1) ( X2 ) ] [∑ X1Y−n ( X1 )(Y )]

[∑ x12−n(X1)

2 ] [∑ x22−n(X2)

2 ]−[∑ X1 X2−n ( X1 ) ( X2 ) ]2

Para a:

a=Y−b1 X1−b2 X2

Page 2: Regresion Y Coeficiente de Correlacion Multiple

El Coeficiente de Correlación Múltiple indica la correlación entre una de las variables independientes y la variable dependiente, manteniendo la otra u otras variables independientes estadísticamente constante.

r=√ a∑Y +b1∑ X1Y +b2∑ X2Y−nY 2

∑ Y 2−nY 2

Ejemplo 1.

Se realiza un estudio de asociación entre las variables:

Y: Gastos mensuales expresados en cientos de dólares

X1: Ingreso mensual familiar en miles de dólares

X2: Tamaño de la familia.En una encuesta de 10 familias escogidas al azar se han encontrado los datos que se presentan en la tabla:

45 10 9 100 81 90 450 405 202540 9 8 81 64 72 360 320 160038 8 6 64 36 48 304 228 144435 7 6 49 36 42 245 210 122532 7 5 49 25 35 224 160 102430 6 4 36 16 24 180 120 90028 6 3 36 9 18 168 84 78427 4 2 16 4 8 108 54 72925 3 2 9 4 6 75 50 625

∑Y=322

Y=32.2

∑ X1=62

X1=6.2

∑ X2=46

X2=4.6

∑ X12=444∑ X2

2=276∑ X1 X2=345∑ X1Y=2158∑ X2Y=1653∑Y 2=10840

Page 3: Regresion Y Coeficiente de Correlacion Multiple

Determinar:

La ecuación de regresión múltiple muestral El coeficiente de Correlación múltiple

Solución:

Determinando la ecuación de regresión múltiple muestral

Y=a+b1X1+b2X 2

De los datos tenemos

n=10 ;∑ Y=322 ;∑ X1=62;∑ X2=46 ;∑ X12=444 ;∑ X2

2=276 ;∑ X1 X2=345 ;

∑ X1Y=2158 ;∑ X2Y=1653 ;∑Y 2=10840 ;Y=54.5; X1=49 ; X 2=14.83

Empleando la formula de regresión múltiple

b1=[∑ x2

2−n(X 2)2 ] [∑ X1Y−n ( X1 )(Y )]−[∑ X1 X2−n (X 1) ( X2 ) ] [∑ X2Y−n ( X2 )(Y )]

[∑ x12−n(X1)

2 ] [∑ x22−n(X2)

2 ]−[∑ X1 X2−n ( X1 ) ( X2 ) ]2

b1=64.4∗161.6−59.8∗171.8

59.6∗64.4−3576=133.4

262.2

b1=0.509

b2=[∑ x1

2−n(X 1)2 ] [∑ X2Y−n ( X2 )(Y )]−[∑ X1 X2−n ( X1) ( X2 ) ] [∑ X1Y−n ( X1 )(Y )]

[∑ x12−n(X1)

2 ] [∑ x22−n(X2)

2 ]−[∑ X1 X2−n ( X1 ) ( X2 ) ]2

b2=59.6∗171.8−59.8∗161.6

59.6∗64.4−3576=575.6

262.2

b2=2.195

a=Y−b1 X1−b2 X2

a=32.2−0.509∗6.2−2.195∗4.6

a=18.947

Reemplazando en la formula de Regresión Y.

Y=18.947+0.509 X1+2.195 X2

Page 4: Regresion Y Coeficiente de Correlacion Multiple

Determinando el coeficiente de correlación

r=√ a∑Y +b1∑ X1Y +b2∑ X2Y−nY 2

∑ Y 2−nY 2

r=√ 18.947∗322+0.509∗2158+2.195∗1653−10∗32.22

10840−10∗32.22

r=√ 6100.934+1098.42+3628.34−10368.410840−10368.4

⇒ r=0.986

Ejercicio desarrollado por sistema de ecuaciones de mínimo cuadrado

Formulas:

n∗a+∑ X1b1+∑ X2b2=∑Y

∑ X1a+∑ X12b1+∑ X 1X2b2=∑ X1Y

∑ X2a+∑ X1 X2b1+∑ X 22b2=∑ X2Y

10a+64 b1+46 b2=322

62a+444b1+345b2=2158

46 a+345b1+276b2=1653

Método Práctico para convertir el sistema de ecuaciones de 3 a 2 ecuaciones

Formulas:

∑ X12b1+∑ X1 X2b2=∑ X1Y

∑ X2 X1b1+∑ X22b2=∑ X2Y

Donde:

S x12=∑ X1

2−n(X1)2

Page 5: Regresion Y Coeficiente de Correlacion Multiple

S X22=∑ X2

2−n (X2)2

S X1 X2=∑ X1X 2−n(¿ X1)(X2)¿ S X1Y=∑ X1Y−n(¿ X1)(Y )¿ S X2Y=∑ X2Y−n(¿ X 2)(Y )¿

Reemplazando Los valores: 444−10∗6.22=59.6 276−10∗4.62=64.4 345−10∗6.2∗4.6=59.8 2158−10∗6.2∗32.2=161.6 1653−10∗4.6∗32.2=171.8

Sistema de 2 ecuaciones:

59.6b1+59.8b2=161.6 …. (1)

59.8b1+64.4 b2=171.8…. (2)

−59.8b1+60.001b2=−162.14

59.8b1+64.4 b2=171.8

4.399b2=9.66

b2=2.195

Reemplazando en (1)

59.6b1+131.26=161.6

59.6b1=30.34

b1=0.509

Para Obtener (a)

a=Y−b1 X1−b2 X2

a=32.2−0.509∗6.2−2.195∗4.6

a=18.947

Sistema de Regresión Múltiple Muestral

∴Y=18.947+0.509 X1+2.195 X 2

-59.8/59.6

Page 6: Regresion Y Coeficiente de Correlacion Multiple

Ejemplo 2

El departamento de producción de una fábrica de confecciones textiles desea explorar la relación entre el número de operadores (X ¿¿2)¿ que hacen pantalones, la edad promedio de ellos (X ¿¿1)¿, y la cantidad producida por semana (Y ); una muestra aleatoria para realizar el estudio reveló los siguientes datos:

30 28 10 784 100 280 840 300 90045 43 12 1849 144 516 1935 540 202552 48 14 2304 196 672 2496 728 270455 52 15 2704 225 780 2860 825 302570 60 17 3600 289 1020 4200 1190 490075 63 21 3969 441 1323 4725 1575 5625

a) Determinar la ecuación de regresión múltiple muestralb) Determine el coeficiente de correlación múltiple

Solución

Determinando la ecuación de regresión múltiple muestral

Y=a+b1X1+b2X 2

De los datos tenemos

n=6 ;∑Y=327 ;∑ X1=294 ;∑ X2=89 ;∑ X 12=15210 ;∑ X2

2=1395 ;

∑ X1 X2=4591 ;∑ X1Y=17056 ;∑ X2Y=5158 ;∑ Y 2=19179 ;Y=54.5 ; X1=49 ; X2=14.83

Empleando la formula de regresión múltiple

b1=[∑ x2

2−n(X 2)2 ] [∑ X1Y−n ( X1 )(Y )]−[∑ X1 X2−n (X 1) ( X2 ) ] [∑ X2Y−n ( X2 )(Y )]

[∑ x12−n(X1)

2 ] [∑ x22−n(X2)

2 ]−[∑ X1 X2−n ( X1 ) ( X2 ) ]2

b1=[1395−6 (14.83 )2 ] [17056−6∗49∗5435 ]−[ 4591−6∗49∗14.83 ] [ 5158−6∗14.83∗54.5 ]

[15210−6 (49 )2 ] [1395−6 (14.83 )2 ]− [ 4591−6∗49∗14.83 ]2

b1=6637.97

7291.548

b1=0.9

b2=[∑ x1

2−n(X 1)2 ] [∑ X2Y−n ( X2 )(Y )]−[∑ X1 X2−n ( X1) ( X2 ) ] [∑ X1Y−n ( X1 )(Y )]

[∑ x12−n(X1)

2 ] [∑ x22−n(X2)

2 ]−[∑ X1 X2−n ( X1 ) ( X2 ) ]2

Y X1 X2 X12 X2

2 X1 X2 X1Y X2Y Y 2

∑ X2=89

X2=14.83∑ X1

2=15210∑ X22=1395∑ X1 X2=4591∑ X1Y=17056∑ X2Y=5158∑Y 2=19179∑Y=327

Y=54.5∑ X1=294

X1=49

Page 7: Regresion Y Coeficiente de Correlacion Multiple

b2=[15210−6∗492 ] [ 5158−6∗14.83∗54.5 ]−[ 4591−6∗49∗14.83 ] [17056−6∗49∗54.5 ]

[15210−6 (49 )2 ] [1395−6 (14.83 )2 ]−[ 4591−6∗49∗14.83 ]2

b2=[804∗308.59 ]−[ 230.98∗1033 ]

804∗75.427−53351.76⟹b2= 9504.02

7291.548

b2=1.30

a=Y−b1 X1−b2 X2

a=54.5−0.9∗49−1.30∗1498

a=−8.879

Reemplazando en la formula de Regresión Y.

Y=−8.879+0.9 X1+1.30 X2

Determinando el coeficiente de correlación

r=√ a∑Y +b1∑ X1Y +b2∑ X2Y−nY 2

∑ Y 2−nY 2

r=√−8.879∗327+0.9∗17056+1.30∗5158−6∗54.52

19179−6∗54.52

r=√−2903.43+15350.4+6705.4−17821.519179−17821.5

r=√ 1330.871357.5

⟹ r=√0.98=0.99

Desarrollando por ecuaciones de mínimo cuadrado

n∗a+∑ X1b1+∑ X2b2=∑Y

∑ X1a+∑ X12b1+∑ X 1X2b2=∑ X1Y

∑ X2a+∑ X1 X2b1+∑ X 22b2=∑ X2Y

6a+294b1+89b2=327

294 a+15210b1+4591b2=17056

89a+4591b1+1395b2=5158

Método practico para convertir el sistema de ecuaciones de 3 a 2 ecuaciones

∑ X12b1+∑ X1 X2b2=∑ X1Y

∑ X2 X1b1+∑ X22b2=∑ X2Y

Page 8: Regresion Y Coeficiente de Correlacion Multiple

Donde:

S x12=∑ X1

2−n(X1)2

S X22=∑ X2

2−n (X2)2

S X1 X2=∑ X1X 2−n(¿ X1)(X2)¿ S X1Y=∑ X1Y−n(¿ X1)(Y )¿ S X2Y=∑ X2Y−n(¿ X 2)(Y )¿

Reemplazando Los valores: 15210−6∗4 92=804 1395−6∗14.832=75.426 4591−6∗49∗14.83=230.98 17056−6∗49∗54.5=1033 5158−6∗14.83∗54.5=308.59

Sistema de 2 ecuaciones:

804 b1+230.98b2=1033 …. (1)

230.98b1+75.426b2=308.59…. (2)

−230.98b1−66.357b2=−296.769

230.98b1+75.426b2=308.59

9.068b2=11.821

b2=1.30

Reemplazando en (1)

804 b1+230.98b2=1033

804 b1=230.98 (1.30 )=1033

b1=0. 9

Para Obtener (a)

a=Y−b1 X1−b2 X2

a=54.5−0.9∗49−1.30∗14.83=−8.879

Sistema de Regresión Múltiple Muestral

∴Y=−8.879+0.9 X 1+1.30 X 2

-230.98/804

Page 9: Regresion Y Coeficiente de Correlacion Multiple

1. El gerente de ventas de las llantas “GOOD BYE” que se venden en todo el país realiza un estudio para determinar la relación entre el numero de llantas vendidas por mes(Y en cientos) y los gastos de publicidad mensuales(en cientos de dólares), X1:Radio, X2: Periódicos . Los datos obtenidos en una muestra de 5 provincias se dan en la tabla que sigue.

4 13 15 169 225 195 52 60 165 12 16 144 256 192 60 80 255 15 18 225 324 270 75 90 256 14 17 196 289 238 84 102 367 16 17 256 289 272 112 119 49

a) Determinar la ecuación de regresión muestral de Y en X1, X2.

b) Hallar el coeficiente de Correlación

Solución

Determinando la ecuación de regresión múltiple muestral

Y=a+b1X1+b2X 2

De los datos tenemos

n=5 ;∑ Y=27 ;∑ X1=70 ;∑ X2=83;∑ X12=990 ;∑ X2

2=1383 ;

∑ X1 X2=1167;∑ X1Y=383 ;∑ X2Y=451 ;∑Y 2=151 ;Y=5.4 ; X1=14 ; X2=16.6

Empleando la formula de regresión múltiple

b1=[∑ x2

2−n(X 2)2 ] [∑ X1Y−n ( X1 )(Y )]−[∑ X1 X2−n (X 1) ( X2 ) ] [∑ X2Y−n ( X2 )(Y )]

[∑ x12−n(X1)

2 ] [∑ x22−n(X2)

2 ]−[∑ X1 X2−n ( X1 ) ( X2 ) ]2

b1=[1383−5 (16.6 )2 ] [383−5∗14∗5.4 ]− [1167−5∗14∗16.6 ] [ 451−5∗16.6∗5.4 ]

[990−5 (14 )2 ] [1383−5 (16.6 )2 ]− [1167−5∗14∗16.6 ]2

b1=5.2∗5−5∗2.8

10∗5.2−25=26−14

27=b1=0.44

Y X1 X2 X12 X2

2 X1 X2 X1Y X2Y Y 2

∑Y=27

Y=5.4∑ X1=70

X1=14∑ X2=83

X2=16.6∑ X1

2=990∑ X22=1383∑ X1 X2=1167∑ X1Y=383∑ X2Y=451∑Y 2=151

Page 10: Regresion Y Coeficiente de Correlacion Multiple

b2=[∑ x1

2−n(X 1)2 ] [∑ X2Y−n ( X2 )(Y )]−[∑ X1 X2−n ( X1) ( X2 ) ] [∑ X1Y−n ( X1 )(Y )]

[∑ x12−n(X1)

2 ] [∑ x22−n(X2)

2 ]−[∑ X1 X2−n ( X1 ) ( X2 ) ]2

b2=[ 990−5∗142 ] [ 451−5∗16.6∗5.4 ]−[1167−5∗14∗16.6 ] [ 383−5∗14∗5.4 ]

[990−5 (14 )2 ] [1383−5 (16.6 )2 ]−[ 1167−5∗14∗16.6 ]2

b2=[10∗2.8 ]−[ 5∗5 ]

10∗5.2−25⟹b2=28−25

27

b2=0.11

a=Y−b1 X1−b2 X2

a=5.4−0.44∗14−0.11∗16.6

a=−2.586

Reemplazando en la formula de Regresión Y.

Y=−2.586+0. X1+0.11X 2

Determinando el coeficiente de correlación

r=√ a∑Y +b1∑ X1Y +b2∑ X2Y−nY 2

∑ Y 2−nY 2

r=√−2.586∗27+0.44∗383+0.11∗451−5∗5.42

151−5∗5.42

r=√ 2.5085.2

⟹ r=0.69

2.