Entrega Siete Compendio
-
Upload
andrescruz -
Category
Documents
-
view
35 -
download
0
description
Transcript of Entrega Siete Compendio
Capitulo VIII. Las regresiones
En la mayora de las investigaciones sin importar el campo del conocimiento en las que se desarrollen en las cuales se realicen mediciones, observaciones o experimentos de donde se obtengan datos de diferentes variables; es fundamental determinar algn tipo de relacin de dependencia entre las variables con el fin de hacer predicciones o pronsticos de eventos futuros de acuerdo con el comportamiento de ellas. (Cardona, et. Al (2013)). Los anlisis de regresiones parten del hecho de analizar dos variables que encuentran en el contexto algn tipo de relacin.
El objeto de un anlisis de regresin es investigar la relacin estadstica que existe entre una variable dependiente (Y) y una o ms variables independientes ,... Para poder realizar esta investigacin, se debe postular una relacin funcional entre las variables.
De esta manera las regresiones sean cual sean su naturaleza tiene como objetivo estudiar y predecir el valor promedio de una variable sobre la base de valores fijos de otras variables.
8.1 Objetivos de la Unidad
1. Encontrar mediante clculos algebraicos las ecuaciones matemticas que permiten hacer regresin de datos. 2. Encontrar mediante el R-Estadstico las ecuaciones matemticas que permiten hacer regresin de datos y su significancia 3. Determinar de acuerdo a los datos una regresin especfica y adecuada.
8.2 Anlisis de regresin
Hasta ahora se ha realizado anlisis de variables solas (en una dimensin), sin ninguna incidencia sobre otras variables. Mediante el anlisis de regresin se trata de establecer mediante una expresin matemtica una relacin entre dos o ms variables, una relacin que permitir:
1. Pronosticar lo que pasara en el tiempo con las variables que intervienen en la relacin, ya que regresin significa regresar en el tiempos o en una medida, matemticamente implicara que podemos avanzar en el tiempo o en alguna medida.
2. Obtener una grfica promedio representativa de una nube de puntos resultantes de un estudio o anlisis en un problema planteado.
Ejemplo
En el ambiente escolar mediante el estudio de regresiones se puede hacer predicciones en cuanto al rendimiento acadmico, mortalidades acadmicas, crecimiento poblacional, clculo de ecuaciones en prcticas de laboratorio.
Las variables relacionadas son parejas que en la vida real tienen en verdad una estrecha relacin guardada por su forma, por su estructura, porque la una sin la otra no podran existir.
En un anlisis de regresin siempre existir una variable dependiente y una o ms varias variables independientes
EjemploOferta y DemandaPeso y estaturaEspacio recorrido y tiempoTiempo y explosin demogrfica
En las regresiones siempre intervienen por lo menos dos variables por lo que se hace necesario hacer una pequea introduccin a lo que se llama estadstica bidimensional.
Dispersin o nube de puntos
En estadstica se entiende como dispersin a un conjunto (nube) de puntos dispuestos en forma indiscriminada sobre el plano cartesiano. Los puntos en el plano son parejas ordenadas que cumplen algn tipo de relacin. La forma ms intuitiva de formarse una primera impresin sobre el tipo de relacin que existe entre dos variables es a travs del Diagrama de Dispersin.
Figura 7.1: Nube de puntos en la relacin Edad-Disposicin a pagar(DAP)
La figura 7.1, muestra en la nube de puntos la relacin de la variable independiente representada por la edad de 27 personas encuestadas y que estn dispuestas a pagar por la entrada al humedal el Coroncoro, cuya entrada servir para implementar propuestas de cultura y educacin que propenda por el cuidado de los recursos naturales de este humedal. De acuerdo al problema analizado y a la forma como se distribuyan los puntos en el plano las regresiones se clasifican en:
Regresiones LinealesRegresiones CuadrticasRegresiones potenciales Regresiones ExponencialesRegresiones Logartmicas
8.3 Regresiones lineales
Mediante las regresiones lineales intentaremos ajustar una recta promedio a una nube de puntos dispersos en el plano. Consideremos en la siguiente tabla en forma general una serie de puntos
XYX2XY
X1X2X3...XnY1Y2Y3...Yn X12X22X32...Xn2X1Y1X2Y2X3Y3...XnYn
Partimos de la expresin general de una rectaY = m X + bEn el anlisis de regresin simple consideraremos la variable X siempre como la variable independiente, Y la variable dependiente.
Para el caso de obtener una expresin matemtica partimos del hecho de conocer los valores de X, Y; por tanto las variables que se pretende encontrar sern m y b que son en forma respectiva la pendiente y el intercepto de una recta. Como son simples datos dispuestos en el plano se pueden sumar:
Ecuacin 1
n hace referencia al conjunto de puntos que forman la nube en el plano cartesiano
Multiplicando toda la expresin Y = m X + b por X nos queda:XY = mX2 + Xb
Sumando estos valores obtenemos la expresin:
Ecuacin 2
Reuniendo las ecuaciones 1 y 2 obtenemos el sistema de ecuaciones
Si resolvemos el sistema por mtodos algebraicos conocidos (igualacin, sustitucin, reduccin, determinante) obtendremos el valor de m y b para formar la ecuacin que se est buscando.
Ejemplo
Un profesor est estudiando la correlacin entre obesidad y la respuesta individual al dolor con una muestra conformada por estudiantes, docentes, administrativos y algunos padres de familia que han querido ser parte del estudio. La obesidad se mide como porcentaje sobre el peso ideal (X). La respuesta al dolor se mide utilizando una medida de sensacin de punzada. Se obtienen los siguientes datos:
PunzadasfMuestraXif*Xi
428
7321
8216
919
12224
1078
PunzadasfMuestraXif*Xi
4312
7214
10220
12224
212
1072
Promedio de punzadas para 90Kg Promedio de punzadas para 80Kg
= 7,8 Punzadas = 7,2 PunzadasPunzadasfMuestraXif*Xi
5210
6212
8216
9218
12112
968
PunzadasfMuestraXif*Xi
326
414
6530
5420
212
1362
Promedio de punzadas para 70 KgPromedio de punzadas para 60 Kg
= 7,5 Punzadas = 4,76 Punzadas
PunzadasfMuestraXif*Xi
2510
326
5210
414
11010
2040
Promedio de punzadas para 50 Kilos
= 2 Punzadas
Estdiese la relacin lineal entre ambas variables, obteniendo su ecuacin. Recogemos los datos anteriores en una tabla para empezar a armar las sumatorias que nos llevaran a encontrar la ecuacin de regresin lineal
Tabla de kilogramos y punzadas promediosPesosXPunzadasYX2XY
5022500100
604.83600288
707.54900525
807.26400576
907.88100702
35029,3255002191
El grafico de nube de datos dispersos se realiza en R bajo las siguientes instrucciones Nube de puntos para los pesos vs punzadas en R
Pesos=read.table("DatosEjer8.3.txt",header=T)attach(Pesos)plot(Pesos)
Nube de puntos
La figura en apariencia muestra una nube de puntos que se puede aproximar a una funcin lineal, que es al cual para el desarrollo de estos ejercicios se estn ajustando.
Para encontrar los valores de m y b de una forma algbricas se har uso del mtodo de la regla de Cramer. Para ellos se forma el sistema a partir de los ltimos resultados obtenidos en la tabla de kilogramos y punzadas.
Obtenemos el siguiente sistema de ecuaciones:
29,3 = 350 m + 5 b2191 = 25500 m + 350 b
Usemos el mtodo de la regla de Cramer, se construyen las matrices y encontrar el valor de los respectivos determinantes. Para darle una solucin en R, formamos primero el determinante del sistema, corresponde a la matriz formada por los coeficientes de las variables.
Determinante de la variable m
m = Determinante de la variable b
b =
La solucin en RSolucin del Sistema en R
Formemos las matrices del determinante y de cada una de las variablesDelta= matrix(c(350,25500,5,350),nrow=2,ncol=2)
[,1] [,2][1,] 350 5[2,] 25500 350
Delta_m=matrix(c(29.3,2191,5,350),nrow=2,ncol=2)
[,1] [,2][1,] 29.3 5[2,] 2191.0 350
Delta_b=matrix(c(350,25500,29.3,2191),nrow=2,ncol=2)
[,1] [,2][1,] 350 29.3[2,] 25500 2191
Se calcula ahora los determinantes del sistemaS=det(Delta)mx=det(Delta_m)bx=det(Delta_b)cbind(S,m,b) S mx bx[1,] -5000 -700 19700
Ahora se obtienen las soluciones dese las definiciones de los determinantesm=mx/Sb=bx/Scbind(m,b) m b[1,] 0.14 -3.94
De los ltimos resultados obtenidos en R podemos obtener la recta de regresin y la expresin matemtica que se est buscando.
m = 0.14b = -3.9
Y = 0.14X - 3.9
Para visualizar la recta en R se realizan las siguientes instrucciones.
plot(Pesos,Punzadas)abline(lm(Punzadas~Pesos))
De esta expresin matemtica podemos predecir que la persona entre ms obesa es menos sensible a las punzadas y viceversa; las persona con poco peso son ms sensibles a los dolores de las punzadas.
Una vez obtenido la expresin matemtica se pueden hacer predicciones generando valores indiscriminadamente sobre las variables independientes. Veamos algunos ejemplos.
1. A las cuantas punzadas siente estimulo de dolor una persona de 95 kilosAqu X = 95 Kilos
Y = 0.14 (95) 3.94 = 9.36 Aproximadamente 9 pulsaciones
2. A las cuantas punzadas siente estimulo de dolor una persona de 30 kilosAqu X = 30 Kilos Y = 0.14 (30) -3.94 = 0.26 Aproximadamente 1 pulsaciones
Un anlisis que brinda ms precisin y significancia para los procesos de regresin se puede realizar en R. se trata de mostrar mejores evidencias para determinar por ejemplo si la regresin lineal es factible de usar o no.
Anlisis de regresin en R
Se realiza el llamado de la funcin Punzadas=read.table("DatosEjer8.3.txt",header=T)attach(Punzadas) Punzadas Pesos Punzadas1 50 2.02 60 4.83 70 7.54 80 7.25 90 7.8
regresion |t|) (Intercept) -3.94000 2.81823 -1.398 0.2565 Pesos 0.14000 0.03946 3.548 0.0382 *---Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 1.248 on 3 degrees of freedomMultiple R-squared: 0.8075, Adjusted R-squared: 0.7434 F-statistic: 12.59 on 1 and 3 DF, p-value: 0.03816
Se observa el intercepto=-3.94 y el valor del peso=0.14 valores que ya se haban corroborado, adems de que entrega el valor de R=0.8075, valor que garantiza en cierta forma el uso del modelo lineal para el problema, y el P-valor=0.03816|t|) (Intercept) 1.23529 0.25559 4.833 0.01689 * cuadros 0.16043 0.01827 8.783 0.00311 **---Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 0.3532 on 3 degrees of freedomMultiple R-squared: 0.9626, Adjusted R-squared: 0.9501 F-statistic: 77.14 on 1 and 3 DF, p-value: 0.003109
plot(Cuadros) abline(lm(centimetros~cuadros))
Ejercicio 3
A partir de las siguientes observaciones para 5 aos de las variables X e Y, ajstese el modelo de regresin de Y en funcin de X ms idneo. Donde:
Y: produccin nacional de un subsector industrial, en millones de toneladas.X: tiempo
Ejercicio 4
Cinco nias de 2,4, 6,7 y 8 aos pesan respectivamente 15, 19, 25, 38, y 34 kilogramos respectivamente, entonces una nia de 12 aos pesara aproximadamente:
A. 45B. 55C. 15D. 51E. 61 Nias=read.table("Nias.txt",header=T)attach(Nias)Nias nias pesos1 2 152 4 193 6 254 7 385 8 34regresion=lm(pesos~nias,data=Nias)summary(regresion)
Call:lm(formula = pesos ~ nias, data = Nias)
Residuals: 1 2 3 4 5 1.491 -1.974 -3.440 5.828 -1.905
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 6.0431 5.1936 1.164 0.329 nias 3.7328 0.8933 4.178 0.025 *---Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 4.303 on 3 degrees of freedomMultiple R-squared: 0.8534, Adjusted R-squared: 0.8045 F-statistic: 17.46 on 1 and 3 DF, p-value: 0.02497
Y = 3,7328X + 6,0431Y = 3,7328 (12) + 6,0431Y = 50,8367
Ejercicio 5
En el anlisis de Regresin lineal se puede afirmar todo lo siguiente excepto:
A. Ajusta los datos a una lnea rectaB. Predice valores de una variable si se conoce el valor de la otra C. Establece una relacin cuantitativa entre dos variables relacionadasD. El mtodo grfico para determinar la relacin entre dos variables es ms concreto que el mtodo matemtico o de mnimos cuadradosE. Una relacin lineal entre dos variables queda representada por una lnea recta llamada ecuacin de regresin
Ejercicio 6
Dado Los siguientes datos expuestos en la tablaEdad12345
Estatura6080100110112
La frmula de regresin para los datos propuestos est dada por:A. y = 11,5x + 67,5 B. y = 7,5x + 85,5 C. y = 13,4x + 52,2 D. y = 14,4x + 47 E. y = 14x + 48,8
Estatura=read.table("estatura.txt",header=T)attach(Estatura)Estatura edad estatura1 1 602 2 803 3 1004 4 1105 5 112regresion=lm(estatura~edad,data=Estatura)summary(regresion)
Call:lm(formula = estatura ~ edad, data = Estatura)
Residuals: 1 2 3 4 5 -5.6 1.0 7.6 4.2 -7.2
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 52.200 7.650 6.824 0.00644 **edad 13.400 2.307 5.810 0.01015 * ---Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 7.294 on 3 degrees of freedomMultiple R-squared: 0.9184, Adjusted R-squared: 0.8912 F-statistic: 33.75 on 1 and 3 DF, p-value: 0.
Ejercicio 7
El Grafico para los puntos dispersos est dado por:ABCD
Estatura=read.table("estatura.txt",header=T)attach(Estatura)Estaturaplot(Estatura)
Ejercicio 8
El diagrama de dispersin para la regresin lineal esta dado porCDAB
Estatura=read.table("estatura.txt",header=T)attach(Estatura)Estaturaplot(Estatura) abline(lm(estatura~edad))
Grfico16080100110112
ESTATURA
Hoja1EDAD12345ESTATURA6080100110112
Hoja1
ESTATURA
Hoja2
Hoja3
Grfico15070100110112
ESTATURA
Hoja1EDAD12345ESTATURA5070100110112
Hoja1
ESTATURA
Hoja2
Hoja3
Grfico1507092100112
ESTATURA
Hoja1EDAD12345ESTATURA507092100112
Hoja1
ESTATURA
Hoja2
Hoja3
Grfico1606092100112
ESTATURA
Hoja1EDAD12345ESTATURA606092100112
Hoja1
ESTATURA
Hoja2
Hoja3
Grfico170100100110112
ESTATURA
Hoja1EDAD12345ESTATURA70100100110112EDAD12345ESTATURA6080100110112
Hoja1
ESTATURA
Hoja2
ESTATURA
Hoja3
Grfico170100105115120
ESTATURA
Hoja1EDAD12345ESTATURA70100105115120EDAD12345ESTATURA6080100110112
Hoja1
ESTATURA
Hoja2
ESTATURA
Hoja3
Grfico1606092100112
ESTATURA
Hoja1EDAD12345ESTATURA606092100112EDAD12345ESTATURA6080100110112
Hoja1
ESTATURA
Hoja2
ESTATURA
Hoja3
Grfico16080100110112
ESTATURA
Hoja1EDAD12345ESTATURA6080100110112EDAD12345ESTATURA6080100110112
Hoja1
ESTATURA
Hoja2
ESTATURA
Hoja3