Entrega Siete Compendio

45
Capitulo VIII. Las regresiones En la mayoría de las investigaciones –sin importar el campo del conocimiento en las que se desarrollen– en las cuales se realicen mediciones, observaciones o experimentos de donde se obtengan datos de diferentes variables; es fundamental determinar algún tipo de relación de dependencia entre las variables con el fin de hacer predicciones o pronósticos de eventos futuros de acuerdo con el comportamiento de ellas. (Cardona, et. Al (2013)). Los análisis de regresiones parten del hecho de analizar dos variables que encuentran en el contexto algún tipo de relación. El objeto de un análisis de regresión es investigar la relación estadística que existe entre una variable dependiente (Y) y una o más variables independientes X 1 ,X 2 ,X 3 ,... Para poder realizar esta investigación, se debe postular una relación funcional entre las variables. De esta manera las regresiones sean cual sean su naturaleza tiene como objetivo estudiar y predecir el valor promedio de una variable sobre la base de valores fijos de otras variables. 8.1 Objetivos de la Unidad 1. Encontrar mediante cálculos algebraicos las ecuaciones matemáticas que permiten hacer regresión

description

Siete

Transcript of Entrega Siete Compendio

Capitulo VIII. Las regresiones

En la mayora de las investigaciones sin importar el campo del conocimiento en las que se desarrollen en las cuales se realicen mediciones, observaciones o experimentos de donde se obtengan datos de diferentes variables; es fundamental determinar algn tipo de relacin de dependencia entre las variables con el fin de hacer predicciones o pronsticos de eventos futuros de acuerdo con el comportamiento de ellas. (Cardona, et. Al (2013)). Los anlisis de regresiones parten del hecho de analizar dos variables que encuentran en el contexto algn tipo de relacin.

El objeto de un anlisis de regresin es investigar la relacin estadstica que existe entre una variable dependiente (Y) y una o ms variables independientes ,... Para poder realizar esta investigacin, se debe postular una relacin funcional entre las variables.

De esta manera las regresiones sean cual sean su naturaleza tiene como objetivo estudiar y predecir el valor promedio de una variable sobre la base de valores fijos de otras variables.

8.1 Objetivos de la Unidad

1. Encontrar mediante clculos algebraicos las ecuaciones matemticas que permiten hacer regresin de datos. 2. Encontrar mediante el R-Estadstico las ecuaciones matemticas que permiten hacer regresin de datos y su significancia 3. Determinar de acuerdo a los datos una regresin especfica y adecuada.

8.2 Anlisis de regresin

Hasta ahora se ha realizado anlisis de variables solas (en una dimensin), sin ninguna incidencia sobre otras variables. Mediante el anlisis de regresin se trata de establecer mediante una expresin matemtica una relacin entre dos o ms variables, una relacin que permitir:

1. Pronosticar lo que pasara en el tiempo con las variables que intervienen en la relacin, ya que regresin significa regresar en el tiempos o en una medida, matemticamente implicara que podemos avanzar en el tiempo o en alguna medida.

2. Obtener una grfica promedio representativa de una nube de puntos resultantes de un estudio o anlisis en un problema planteado.

Ejemplo

En el ambiente escolar mediante el estudio de regresiones se puede hacer predicciones en cuanto al rendimiento acadmico, mortalidades acadmicas, crecimiento poblacional, clculo de ecuaciones en prcticas de laboratorio.

Las variables relacionadas son parejas que en la vida real tienen en verdad una estrecha relacin guardada por su forma, por su estructura, porque la una sin la otra no podran existir.

En un anlisis de regresin siempre existir una variable dependiente y una o ms varias variables independientes

EjemploOferta y DemandaPeso y estaturaEspacio recorrido y tiempoTiempo y explosin demogrfica

En las regresiones siempre intervienen por lo menos dos variables por lo que se hace necesario hacer una pequea introduccin a lo que se llama estadstica bidimensional.

Dispersin o nube de puntos

En estadstica se entiende como dispersin a un conjunto (nube) de puntos dispuestos en forma indiscriminada sobre el plano cartesiano. Los puntos en el plano son parejas ordenadas que cumplen algn tipo de relacin. La forma ms intuitiva de formarse una primera impresin sobre el tipo de relacin que existe entre dos variables es a travs del Diagrama de Dispersin.

Figura 7.1: Nube de puntos en la relacin Edad-Disposicin a pagar(DAP)

La figura 7.1, muestra en la nube de puntos la relacin de la variable independiente representada por la edad de 27 personas encuestadas y que estn dispuestas a pagar por la entrada al humedal el Coroncoro, cuya entrada servir para implementar propuestas de cultura y educacin que propenda por el cuidado de los recursos naturales de este humedal. De acuerdo al problema analizado y a la forma como se distribuyan los puntos en el plano las regresiones se clasifican en:

Regresiones LinealesRegresiones CuadrticasRegresiones potenciales Regresiones ExponencialesRegresiones Logartmicas

8.3 Regresiones lineales

Mediante las regresiones lineales intentaremos ajustar una recta promedio a una nube de puntos dispersos en el plano. Consideremos en la siguiente tabla en forma general una serie de puntos

XYX2XY

X1X2X3...XnY1Y2Y3...Yn X12X22X32...Xn2X1Y1X2Y2X3Y3...XnYn

Partimos de la expresin general de una rectaY = m X + bEn el anlisis de regresin simple consideraremos la variable X siempre como la variable independiente, Y la variable dependiente.

Para el caso de obtener una expresin matemtica partimos del hecho de conocer los valores de X, Y; por tanto las variables que se pretende encontrar sern m y b que son en forma respectiva la pendiente y el intercepto de una recta. Como son simples datos dispuestos en el plano se pueden sumar:

Ecuacin 1

n hace referencia al conjunto de puntos que forman la nube en el plano cartesiano

Multiplicando toda la expresin Y = m X + b por X nos queda:XY = mX2 + Xb

Sumando estos valores obtenemos la expresin:

Ecuacin 2

Reuniendo las ecuaciones 1 y 2 obtenemos el sistema de ecuaciones

Si resolvemos el sistema por mtodos algebraicos conocidos (igualacin, sustitucin, reduccin, determinante) obtendremos el valor de m y b para formar la ecuacin que se est buscando.

Ejemplo

Un profesor est estudiando la correlacin entre obesidad y la respuesta individual al dolor con una muestra conformada por estudiantes, docentes, administrativos y algunos padres de familia que han querido ser parte del estudio. La obesidad se mide como porcentaje sobre el peso ideal (X). La respuesta al dolor se mide utilizando una medida de sensacin de punzada. Se obtienen los siguientes datos:

PunzadasfMuestraXif*Xi

428

7321

8216

919

12224

1078

PunzadasfMuestraXif*Xi

4312

7214

10220

12224

212

1072

Promedio de punzadas para 90Kg Promedio de punzadas para 80Kg

= 7,8 Punzadas = 7,2 PunzadasPunzadasfMuestraXif*Xi

5210

6212

8216

9218

12112

968

PunzadasfMuestraXif*Xi

326

414

6530

5420

212

1362

Promedio de punzadas para 70 KgPromedio de punzadas para 60 Kg

= 7,5 Punzadas = 4,76 Punzadas

PunzadasfMuestraXif*Xi

2510

326

5210

414

11010

2040

Promedio de punzadas para 50 Kilos

= 2 Punzadas

Estdiese la relacin lineal entre ambas variables, obteniendo su ecuacin. Recogemos los datos anteriores en una tabla para empezar a armar las sumatorias que nos llevaran a encontrar la ecuacin de regresin lineal

Tabla de kilogramos y punzadas promediosPesosXPunzadasYX2XY

5022500100

604.83600288

707.54900525

807.26400576

907.88100702

35029,3255002191

El grafico de nube de datos dispersos se realiza en R bajo las siguientes instrucciones Nube de puntos para los pesos vs punzadas en R

Pesos=read.table("DatosEjer8.3.txt",header=T)attach(Pesos)plot(Pesos)

Nube de puntos

La figura en apariencia muestra una nube de puntos que se puede aproximar a una funcin lineal, que es al cual para el desarrollo de estos ejercicios se estn ajustando.

Para encontrar los valores de m y b de una forma algbricas se har uso del mtodo de la regla de Cramer. Para ellos se forma el sistema a partir de los ltimos resultados obtenidos en la tabla de kilogramos y punzadas.

Obtenemos el siguiente sistema de ecuaciones:

29,3 = 350 m + 5 b2191 = 25500 m + 350 b

Usemos el mtodo de la regla de Cramer, se construyen las matrices y encontrar el valor de los respectivos determinantes. Para darle una solucin en R, formamos primero el determinante del sistema, corresponde a la matriz formada por los coeficientes de las variables.

Determinante de la variable m

m = Determinante de la variable b

b =

La solucin en RSolucin del Sistema en R

Formemos las matrices del determinante y de cada una de las variablesDelta= matrix(c(350,25500,5,350),nrow=2,ncol=2)

[,1] [,2][1,] 350 5[2,] 25500 350

Delta_m=matrix(c(29.3,2191,5,350),nrow=2,ncol=2)

[,1] [,2][1,] 29.3 5[2,] 2191.0 350

Delta_b=matrix(c(350,25500,29.3,2191),nrow=2,ncol=2)

[,1] [,2][1,] 350 29.3[2,] 25500 2191

Se calcula ahora los determinantes del sistemaS=det(Delta)mx=det(Delta_m)bx=det(Delta_b)cbind(S,m,b) S mx bx[1,] -5000 -700 19700

Ahora se obtienen las soluciones dese las definiciones de los determinantesm=mx/Sb=bx/Scbind(m,b) m b[1,] 0.14 -3.94

De los ltimos resultados obtenidos en R podemos obtener la recta de regresin y la expresin matemtica que se est buscando.

m = 0.14b = -3.9

Y = 0.14X - 3.9

Para visualizar la recta en R se realizan las siguientes instrucciones.

plot(Pesos,Punzadas)abline(lm(Punzadas~Pesos))

De esta expresin matemtica podemos predecir que la persona entre ms obesa es menos sensible a las punzadas y viceversa; las persona con poco peso son ms sensibles a los dolores de las punzadas.

Una vez obtenido la expresin matemtica se pueden hacer predicciones generando valores indiscriminadamente sobre las variables independientes. Veamos algunos ejemplos.

1. A las cuantas punzadas siente estimulo de dolor una persona de 95 kilosAqu X = 95 Kilos

Y = 0.14 (95) 3.94 = 9.36 Aproximadamente 9 pulsaciones

2. A las cuantas punzadas siente estimulo de dolor una persona de 30 kilosAqu X = 30 Kilos Y = 0.14 (30) -3.94 = 0.26 Aproximadamente 1 pulsaciones

Un anlisis que brinda ms precisin y significancia para los procesos de regresin se puede realizar en R. se trata de mostrar mejores evidencias para determinar por ejemplo si la regresin lineal es factible de usar o no.

Anlisis de regresin en R

Se realiza el llamado de la funcin Punzadas=read.table("DatosEjer8.3.txt",header=T)attach(Punzadas) Punzadas Pesos Punzadas1 50 2.02 60 4.83 70 7.54 80 7.25 90 7.8

regresion |t|) (Intercept) -3.94000 2.81823 -1.398 0.2565 Pesos 0.14000 0.03946 3.548 0.0382 *---Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

Residual standard error: 1.248 on 3 degrees of freedomMultiple R-squared: 0.8075, Adjusted R-squared: 0.7434 F-statistic: 12.59 on 1 and 3 DF, p-value: 0.03816

Se observa el intercepto=-3.94 y el valor del peso=0.14 valores que ya se haban corroborado, adems de que entrega el valor de R=0.8075, valor que garantiza en cierta forma el uso del modelo lineal para el problema, y el P-valor=0.03816|t|) (Intercept) 1.23529 0.25559 4.833 0.01689 * cuadros 0.16043 0.01827 8.783 0.00311 **---Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

Residual standard error: 0.3532 on 3 degrees of freedomMultiple R-squared: 0.9626, Adjusted R-squared: 0.9501 F-statistic: 77.14 on 1 and 3 DF, p-value: 0.003109

plot(Cuadros) abline(lm(centimetros~cuadros))

Ejercicio 3

A partir de las siguientes observaciones para 5 aos de las variables X e Y, ajstese el modelo de regresin de Y en funcin de X ms idneo. Donde:

Y: produccin nacional de un subsector industrial, en millones de toneladas.X: tiempo

Ejercicio 4

Cinco nias de 2,4, 6,7 y 8 aos pesan respectivamente 15, 19, 25, 38, y 34 kilogramos respectivamente, entonces una nia de 12 aos pesara aproximadamente:

A. 45B. 55C. 15D. 51E. 61 Nias=read.table("Nias.txt",header=T)attach(Nias)Nias nias pesos1 2 152 4 193 6 254 7 385 8 34regresion=lm(pesos~nias,data=Nias)summary(regresion)

Call:lm(formula = pesos ~ nias, data = Nias)

Residuals: 1 2 3 4 5 1.491 -1.974 -3.440 5.828 -1.905

Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 6.0431 5.1936 1.164 0.329 nias 3.7328 0.8933 4.178 0.025 *---Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

Residual standard error: 4.303 on 3 degrees of freedomMultiple R-squared: 0.8534, Adjusted R-squared: 0.8045 F-statistic: 17.46 on 1 and 3 DF, p-value: 0.02497

Y = 3,7328X + 6,0431Y = 3,7328 (12) + 6,0431Y = 50,8367

Ejercicio 5

En el anlisis de Regresin lineal se puede afirmar todo lo siguiente excepto:

A. Ajusta los datos a una lnea rectaB. Predice valores de una variable si se conoce el valor de la otra C. Establece una relacin cuantitativa entre dos variables relacionadasD. El mtodo grfico para determinar la relacin entre dos variables es ms concreto que el mtodo matemtico o de mnimos cuadradosE. Una relacin lineal entre dos variables queda representada por una lnea recta llamada ecuacin de regresin

Ejercicio 6

Dado Los siguientes datos expuestos en la tablaEdad12345

Estatura6080100110112

La frmula de regresin para los datos propuestos est dada por:A. y = 11,5x + 67,5 B. y = 7,5x + 85,5 C. y = 13,4x + 52,2 D. y = 14,4x + 47 E. y = 14x + 48,8

Estatura=read.table("estatura.txt",header=T)attach(Estatura)Estatura edad estatura1 1 602 2 803 3 1004 4 1105 5 112regresion=lm(estatura~edad,data=Estatura)summary(regresion)

Call:lm(formula = estatura ~ edad, data = Estatura)

Residuals: 1 2 3 4 5 -5.6 1.0 7.6 4.2 -7.2

Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 52.200 7.650 6.824 0.00644 **edad 13.400 2.307 5.810 0.01015 * ---Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

Residual standard error: 7.294 on 3 degrees of freedomMultiple R-squared: 0.9184, Adjusted R-squared: 0.8912 F-statistic: 33.75 on 1 and 3 DF, p-value: 0.

Ejercicio 7

El Grafico para los puntos dispersos est dado por:ABCD

Estatura=read.table("estatura.txt",header=T)attach(Estatura)Estaturaplot(Estatura)

Ejercicio 8

El diagrama de dispersin para la regresin lineal esta dado porCDAB

Estatura=read.table("estatura.txt",header=T)attach(Estatura)Estaturaplot(Estatura) abline(lm(estatura~edad))

Grfico16080100110112

ESTATURA

Hoja1EDAD12345ESTATURA6080100110112

Hoja1

ESTATURA

Hoja2

Hoja3

Grfico15070100110112

ESTATURA

Hoja1EDAD12345ESTATURA5070100110112

Hoja1

ESTATURA

Hoja2

Hoja3

Grfico1507092100112

ESTATURA

Hoja1EDAD12345ESTATURA507092100112

Hoja1

ESTATURA

Hoja2

Hoja3

Grfico1606092100112

ESTATURA

Hoja1EDAD12345ESTATURA606092100112

Hoja1

ESTATURA

Hoja2

Hoja3

Grfico170100100110112

ESTATURA

Hoja1EDAD12345ESTATURA70100100110112EDAD12345ESTATURA6080100110112

Hoja1

ESTATURA

Hoja2

ESTATURA

Hoja3

Grfico170100105115120

ESTATURA

Hoja1EDAD12345ESTATURA70100105115120EDAD12345ESTATURA6080100110112

Hoja1

ESTATURA

Hoja2

ESTATURA

Hoja3

Grfico1606092100112

ESTATURA

Hoja1EDAD12345ESTATURA606092100112EDAD12345ESTATURA6080100110112

Hoja1

ESTATURA

Hoja2

ESTATURA

Hoja3

Grfico16080100110112

ESTATURA

Hoja1EDAD12345ESTATURA6080100110112EDAD12345ESTATURA6080100110112

Hoja1

ESTATURA

Hoja2

ESTATURA

Hoja3