Post on 26-Jul-2015
2
REGRESIÓN LINEAL
)( iii xfy
FORMULACIÓN DEL PROBLEMA DE LA REGRESIÓN
Dados n puntos (x1, y1), (x2, y2), … , (xn, yn) hallar la función y= f(x), que se ajuste mejor a ellos. El criterio que normalmente se usa para establecer el mejor ajuste es el de mínimos cuadrados que consiste en minimizar la suma de los cuadrados de los errores residuales. El error residual para el punto i, se define como:
La suma de los cuadrados de los errores residuales se expresa como:
2
1
10
1
2
n
i
ii
n
i
ir xaayS
3
REGRESIÓN LINEAL
Dados n puntos (x1, y1), (x2, y2), … , (xn, yn) hallar la función que se ajuste mejor a ellos. Para este caso el error residual para el dato i se puede expresar como: La suma de los cuadrados de los errores residuales, en este caso, sería:
xaay 10
i10ii xaayε
2
1
10
1
2
n
i
ii
n
i
ir xaayS
REGRESIÓN LINEAL
Las constantes a0 y a1, del modelo lineal serán aquellas que minimicen a Sr, lo cual requieres derivar Sr con respecto a cada uno de los coeficientes:
0121
10
0
n
i
iir xaay
a
S
021
10
1
n
i
iiir xxaay
a
S
Lo cual puede escribirse como:
i
n
i
ii
n
i
i
n
i
xyxaxa
1
2
1
1
1
0
n
i
ii
n
i
n
i
yxaa11
1
1
0
5
REGRESIÓN LINEAL
i
n
1i
i
n
1i
i
1
0
n
1i
2
i
n
1i
i
n
1i
i
xy
y
a
a
xx
xn
n
1i
ii
n
1i
10 yxana
i
n
i
ii
n
i
i
n
i
xyxaxa
1
2
1
1
1
0
Teniendo en cuenta se obtiene: 0
n
1i
0 naa
Que se puede expresar matricialmente como;
6
REGRESIÓN LINEAL
2
11
2
1111
2
0
n
i
i
n
i
i
n
i
ii
n
i
i
n
i
i
n
i
i
xxn
yxxyx
a
n
1i
n
1i
ii
n
1i
2
i
n
1i
ii
n
1i
i
n
1i
2
i
n
1i
i
n
1i
2
i
n
1i
i
n
1i
i
n
1i
2
ii
n
1i
i
n
1i
i
n
1i
i
0
xxxn
xxyxy
xx
xn
xxy
xy
a
Aplicando la regla de Crámer, para resolver este sistema, se ontiene
7
REGRESIÓN LINEAL
2
11
2
1111
2
0
n
i
i
n
i
i
n
i
ii
n
i
i
n
i
i
n
i
i
xxn
yxxyx
a
n
1i
n
1i
ii
n
1i
2
i
n
1i
ii
n
1i
i
n
1i
2
i
n
1i
i
n
1i
2
i
n
1i
i
n
1i
i
n
1i
2
ii
n
1i
i
n
1i
i
n
1i
i
0
xxxn
xxyxy
xx
xn
xxy
xy
a
REGRESIÓN LINEAL
1 1 11 2
2
1 1
n n n
i i i i
i i i
n n
i i
i i
n x y x y
a
n x x
n
1i
n
1i
ii
n
1i
2
i
n
1i
n
1i
iii
n
1i
i
n
1i
2
i
n
1i
i
n
1i
i
i
n
1i
i
n
1i
i
n
1i
i
1
xxxn
yxxy
xx
xn
xyx
y
a
n
n
EJEMPLO
Se sabe que el esfuerzo a la tensión de un plástico se incrementa como función del tiempo que recibe tratamiento a base de calor. Se obtuvieron los datos que se muestran en la tabla.
Ajuste una línea recta a estos datos y utilice una ecuación para determinar el esfuerzo a la tensión en un tiempo de 32 minutos
Contador Tiempo (min)
Esfuerzo a la tensión(N/cm2)
i xi yi
1 10 5
2 15 20
3 20 18
4 25 40
5 40 33
6 50 54
7 55 70
8 60 60
9 75 78
Tomado del texto: Chapra, Steven C y Canale, Raymond. Métodos Numéricos para ingeniero. Quinta edición
EJEMPLO
0
10
20
30
40
50
60
70
80
90
0 10 20 30 40 50 60 70 80
esfuerzo a la tensión(N/cm2)
Tiempo(min)
Esfu
erzo
a la
tens
ión(
N/c
m2
GRÁFICO DE DISPERSIÓN PARA: Esfuerzo a la tensión vs. Tiempo
EJEMPLO
La solución básicamente consiste en hallar los coeficientes de la ecuación de la recta de mejor ajuste. Para el problema planteado, la forma de la ecuación de la recta sería:
Donde y= esfuerzo a la tensión(N/cm2)
x= tiempo(min)
1
n
i i
i
x y
0 1y a a x
Para determinar los coeficientes a0 y a1, del modelo lineal, se utiliza el procedimiento de regresión lineal, para lo cual se deben calcular las siguientes cantidades:
2
1
n
i
i
x
1
n
i
i
x
1
n
i
i
y
EJEMPLO
Teniendo en cuenta que para este problema, n=9 datos, entonces:
9
1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9
1
i i
i
x y x y x y x y x y x y x y x y x y x y
9
1
10 5 15 20 20 18 25 40 40 33 50 54 55 70 60 60 75 78i i
i
x y
9
1
19030i i
i
x y
9
1 2 3 4 5 6 7 8 9
1
i
i
x x x x x x x x x x
9
1
10 15 20 25 40 50 55 60 75i
i
x
9
1
350i
i
x
EJEMPLO
9
1 2 3 4 5 6 7 8 9
1
i
i
y y y y y y y y y y
9
1
5 20 18 40 33 54 70 60 78i
i
y
9
1
378i
i
x
92 2 2 2 2 2 2 2 2 2
1 2 3 4 5 6 7 8 9
1
i
i
x x x x x x x x x x
92 2 2 2 2 2 2 2 2 2
1
10 15 20 25 40 50 55 60 75i
i
x
92
1
17700i
i
x
EJEMPLO
Con estas cantidades calculadas, se pueden utilizar las fórmulas para los coeficientes, obtenidas anteriormente:
2
11
2
1111
2
0
n
i
i
n
i
i
n
i
ii
n
i
i
n
i
i
n
i
i
xxn
yxxyx
a
1 1 11 2
2
1 1
n n n
i i i i
i i i
n n
i i
i i
n x y x y
a
n x x
EJEMPLO
Reemplazando:
0 2
17700 378 350 190300.81793478
9 17700 350a
1 2
9 19030 350 3781.05896739
9 17700 350a
9
1
19030i i
i
x y
9
1
350i
i
x
9
1
378i
i
x
9
2
1
17700i
i
x
Se obtiene:
EJEMPLO
Reemplazando estos valores en el modelo lineal, se obtiene la ecuación de la recta de mejor ajuste:
0.81793478+1.05896739y x
0 1y a a x
2( / ) 0.81793478+1.05896739 minEsfuerzo a la tensión N cm tiempo
Remplazando y, x por los nombre reales de las variables, quedaría:
En la siguiente diapositiva se presenta una gráfica de los datos iniciales con la recta de regresión
EJEMPLO
Datos originales con la recta de regresión obtenida
y = 1,059x + 0,8179
0
10
20
30
40
50
60
70
80
90
0 10 20 30 40 50 60 70 80
esfuerzo a la tensión(N/cm2)
Tiempo(min)
Esfu
erzo
a la
tens
ión(
N/c
m2
EJEMPLO
En la siguiente figura se ilustra gráficamente la obtención del esfuerzo para tiempo=32 minutos
Para estimar el valor del esfuerzo a la tensión para un tiempo igual a 32 minutos, se utiliza la ecuación
obtenida:
( ) 0.813 793478+1.058967392 32Esfuerzo a la tensión
( ) 34.7048932 13Esfuerzo a la tensión