Momento 3 Grupo 106
description
Transcript of Momento 3 Grupo 106
1
Trabajo Colaborativo: Momento 3
Estudiantes:
Ximena Camacho
Leidy Delgado
Ricardo Jose Rodriguez
Eduar Dizzieth Calderón
Eduyer Rojas
Tutor
Alejandro Méndez Gonzales
Ingeniero Forestal
Universidad Nacional Abierta y a Distancia
Estadística Descriptiva
Grupo 204040_106
Florencia
2015
2
Introducción
Se ha realizado con anterioridad una encuesta en distintas instituciones educativas, los cuales han
dado como resultado una gran cantidad de datos o valores de tipo cualitativo y cuantitativo. La
investigación estadística es una actividad que apela a diversas técnicas con el propósito de llegar
a la esencia de la realidad. La regresión lineal simple y la regresión lineal múltiple son técnicas
de análisis de las variables de una investigación estadística, en este caso desde la encuesta
realizada. Si bien es cierto estas técnicas mencionadas se pueden utilizar para solucionar
problemas comunes en los negocios o para evaluar el comportamiento de su economía y en
general se utiliza con mayor frecuencia en las ciencias económicas, también es cierto que en
muchos casos se requiere conocer más que el comportamiento de una sola variable para entender
una investigación cualquiera sea su especia. Entonces, sin importar la situación presentada se
hace necesario que practiquemos estas técnicas de regresión por medio de ejercicios salientes de
la cotidianidad, a continuación veremos pues los resultados de dicha práctica.
3
Justificación
Partiendo de una base de datos de distintas instituciones educativas y unos datos primarios
(encuestas) nos proponemos encontrar datos secundarios (estadísticos) con la intención de
conocer las relaciones de las variables de estos datos. Para ello, en primer lugar aplicaremos el
proceso de regresión lineal simple para determinar tanto la naturaleza como la fuerza de una
relación entre dos variables y segundo lugar la regresión lineal múltiple con la cual describiremos
la relación entre dos o más variables independientes y una variable dependiente utilizando la
ecuación de regresión múltiple; estas ecuaciones de estimaciones nos permitirá realizar una
interpretación de correlación de la investigación realizada en estas instituciones educativas. El
trabajo de laboratorio constituye una de las mejores metodologías para la aplicación de modelos
estadísticos a las variables de los hechos, es por eso que se trabaja en este sentido y no otro para
la práctica de la unidad 3 de regresión y determinación.
4
Objetivos
Objetivos generales
Potencializar en el estudiante habilidades y destrezas para caracterizar un situación mediante el
análisis de las medidas estadísticas bivariantes.
Calcular e interpretar adecuadamente las medidas estadísticas bivariantes, asociadas a una
situación específica.
Determinar la relación entre dos o más variables inscritas en una situación específica a partir del
análisis de regresión lineal simple y múltiple.
Objetivos específicos
Interpretar correctamente los datos de cada tabla propuestos en cada uno de los ejercicios.
Realizar diagramas de dispersión en los ejercicios de laboratorio y actividades colaborativas que
permitan determinar el tipo de asociación entre las variables escogidas en cada ejercicio.
En los ejercicios propuestos de laboratorio y de regresión y correlación lineal simple crear
modelos matemáticos que permita predecir el efecto de una variable sobre la otra para determinar
su fiabilidad.
Determinar porcentajes que permitan una explicación de modelo y grado de relación de dos
variables de los ejercicios de laboratorio y de regresión y correlación lineal simple.
En la práctica de regresión y correlación lineal múltiple identificar una variable cuantitativa
dependiente y varias variables independientes del estudio de investigación, diagramarlas y
calcular la recta de regresión y el coeficiente de correlación para probar estadísticamente su
relación.
Relacionar o analizar la información obtenida en cada problema planteado en los ejercicios de
laboratorio y colaborativo.
5
Laboratorio de regresión y correlación lineal
1. El rendimiento del producto de un proceso químico está relacionado con la temperatura de
operación del proceso. Se desea establecer la relación que existe entre la pureza (y) del
oxígeno producido y el porcentaje de hidrocarburo (x) que está presente en el
condensador principal en un proceso de destilación, de acuerdo con los siguientes datos:
X
(% de Hidro
carburos)
Y
(Pureza)
0,99 90,01
1,02 89,05
1,15 91,43
1,29 93,74
1,46 96,73
1,36 94,45
0,87 87,59
1,23 91,77
1,55 99,42
1,4 93,65
1,19 93,54
1,15 92,52
0,98 90,56
1,01 89,54
1,11 89,85
1,2 90,39
1,26 93,25
1,32 93,41
1,43 94,98
0,95 87,33
6
a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.
Análisis:
La línea de tendencia central, se encuentra muy ligada a los diferentes puntos de dispersión.
b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la
otra. Es confiable?
El modelo matemático; el cual nos permite predecir una variable sobre la otra es la ecuación de la
tendencia de la línea, la cual corresponde a: y = 14,947x + 74,283. Según su coeficiente de
determinación; R2 = 0,8774, es confiable ya que se aproxima a 1. RTA: Por ende es confiable.
c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables.
El porcentaje de explicación del modelo: Está dado por la representación porcentual del
coeficiente de determinación, así: R2 x 100% = 0,8774 x 100% = 87,74 %.
El grado de relación de las dos variables: Está dado por la raíz cuadrada del coeficiente de
determinación, así: √R2
= √0,8774=0,9366, cuya representación porcentual seria: 0,9366 x
100%= 93,66%, lo cual señala que las dos variables de porcentaje, están relacionadas entre sí,
con un 93.66%. También se puede afirmar que como el coeficiente de correlación tiene un valor
que se encuentra entre 0.90 y 1 entonces su correlación es buena.
d. ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es igual a 91,3?
De acuerdo a lo arrojado en el diagrama de dispersión indica que
y = 14,947x + 74,283, se despeja x. y a y se le da el valor de 91.3
y = 14,947x + 74,283
R² = 0,8774
85
90
95
100
105
0 0,5 1 1,5 2
diagrama de dispersion
7
y = 14,947x + 74,283
91,3 = 14,947x + 74,283
1,13 = x
Conclusión: cuando la pureza del oxígeno es de 91.3 el porcentaje de hidrocarburo es
de 1.13.
2. El número de libras de vapor (y) consumidas mensualmente por una planta química, se
relaciona con la temperatura ambiental promedio (en o
F). Para el año 2014, se registraron
los siguientes valores de temperatura y consumo anual.
2014 Registros de temperatura y consumos de
vapor.
Mes
Temperatura
(oF)
Consumo de
vapor (Lb)
Ene. 21 185,79
Feb. 24 214,47
Mar. 32 288,03
Abr. 47 424,84
May. 50 455
Jun. 59 539
Jul. 68 621,55
Ago. 74 675,06
Sep. 62 562,03
Oct. 50 452,93
Nov. 41 369,95
Dic. 30 273,98
8
a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.
Análisis: los puntos de dispersión siguen la línea de tendencia central
b. Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la
otra. Es confiable?
El modelo matemático; el cual nos permite predecir una variable sobre la otra es la
ecuación de la tendencia de la línea, la cual corresponde a: y = 92,2087 x – 6,3184. Según
su coeficiente de determinación; R2 = 0, 9999 se analiza que por ser cercano a 1, se
afirma que el modelo matemático obtenido el cual relaciona las variables de porcentaje de
RTA: Temperatura y consumo a vapor es confiable.
c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos
variables.
R2 x 100% = 0,9999 x 100% = 99,99 %.
El grado de relación de las dos variables: Está dado por la raíz cuadrada del coeficiente de
determinación, así: √R2 = √0,9999 =0,9999499987, cuya representación porcentual seria:
0,9999 x 100%= 99,99%, lo cual señala que las dos variables de porcentaje de porcentaje
de temperatura y consumo a vapor, están relacionadas entre sí, con un 99,99%. Su
relación es muy buena.
y = 9,2087x - 6,3184 R² = 0,9999
0
200
400
600
800
0 20 40 60 80
Diagrama de dispersion
9
d. ¿Cuál es el de consumo de vapor cuando la temperatura es de 70 oF?
y = 9,2087 x - 6, 3184, la formula queda así:
y= 9,2087 x - 6, 3184
9,2087(70) – 6,3184
644,609 – 6,3184
638,2906 = y
Conclusión: el consumo de vapor cuando la temperatura es de 70 oF es de 638,2906
3. Los investigadores están estudiando la correlación entre la obesidad y la respuesta
individual al dolor. La obesidad se mide como porcentaje sobre el peso ideal (x). La
respuesta al dolor se mide utilizando el umbral de reflejo de reflexión nociceptiva (y) que
es una medida de sensación de punzada. Obsérvese que ambas, X e Y, son variables
aleatorias
x
(porcentaje
de
sobrepeso)
y (umbral de
reflejo de
flexión
nociceptiva)
89 2
90 3
75 4
30 4,5
51 5,5
75 7
62 9
45 13
90 15
20 14
10
a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.
Conclusión: el diagrama sigue la línea de tendencia central
b. Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la
otra. Es confiable?
y= - 0,062x + 11,642 y como el coeficiente de correlación es; R2 = 0,1115. RTA: Con
esto se puede concluir que el modelo no es confiable.
c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos
variables.
El porcentaje de explicación del modelo: así: R2 x 100% = 0,1115 x 100% = 11.15 %.
El grado de relación de las dos variables: Está dado por la raíz cuadrada del coeficiente de
determinación, así: √R2 = √0,1115= 0,3339161571 cuya representación porcentual seria:
0,3339 x 100%= 33,39%, lo cual señala que las dos variables de porcentaje de sobrepeso
y umbral de reflejo de flexión nociceptiva, están relacionadas entre sí, con un 33,39%. Su
correlación no buena.
d. ¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un porcentaje de
sobrepeso, de 40?
y = -0,0629x + 11, 642, donde x es 40
y= -2.516 + 11,642
y = -0,0629x + 11,642 R² = 0,1115
0
2
4
6
8
10
12
14
16
0 20 40 60 80 100
Diagrama de dispersion
11
9,126= y
Conclusión: el reflejo de flexión nociceptiva es de 9.126 cuando el porcentaje de
sobrepeso es de 40.
Regresión y Correlación lineal Simple
- Identificar dos variables cuantitativas de la situación estudiada que puedan estar relacionadas.
Variable: Edad
Variable: Peso
- Realizar el diagrama de dispersión de dichas variables y determinar el tipo de asociación entre
las variables.
Con los resultados obtenidos se puede asegurar según la gráfica del diagrama de dispersión que el
tipo de asociación entre las variables sigue una tendencia lineal y Creciente.
y = 4,4757x - 9,6849 R² = 0,7869
0,0
10,0
20,0
30,0
40,0
50,0
60,0
0 2 4 6 8 10 12
Pe
so
Edad
Diagrama de Dispersión
12
- Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la
otra. ¿Es confiable?
El modelo matemático; el cual nos permite predecir una variable sobre la otra es la ecuación de
la tendencia de la línea, la cual corresponde a: y = 4,4757 x – 9,6849. Según su coeficiente de
determinación; R2 = 0,7869 se analiza que por ser cercano a 1, se afirma que el modelo
matemático obtenido el cual relaciona las variables de porcentaje de edad y peso es confiable.
- Determine el porcentaje de explicación del modelo y el grado de relación de las dos
variables.
El porcentaje de explicación del modelo: Está dado por la representación porcentual del
coeficiente de determinación, así: R2 x 100% = 0,7869 x 100% = 78,69%
El grado de relación de las dos variables: Está dado por la raíz cuadrada del coeficiente
de determinación, así: √R2 = √0,7869 =0,8870, cuya representación porcentual seria:
0,8870 x 100%= 88,70%, lo cual señala que las dos variables de porcentaje de edad y
peso, están relacionadas entre sí, con un 88,70%. También se puede afirmar que como el
coeficiente de correlación tiene un valor que se encuentra entre 0.80 y 1 entonces su
correlación es aceptable.
- Relacionar la información obtenida con el problema.
Análisis:
Con los resultados obtenidos se puede asegurar que existe una correlación con las
variables edad y peso de los estudiantes de las instituciones públicas y privadas del
municipio de san Sebastián de Mariquita, con un porcentaje de 78,69%. Según el
coeficiente de correlación lineal se analiza que su correlación es aceptable.
13
Regresión y Correlación Lineal Múltiple
- Identificar una variable cuantitativa dependiente y varias variables independientes del estudio
de investigación.
Variable dependiente: Peso
Variables independientes: Edad y Estatura
- Realizar el diagrama de dispersión de dichas variables.
y = 4,4757x - 9,6849 R² = 0,7869
0,0
10,0
20,0
30,0
40,0
50,0
60,0
0 2 4 6 8 10 12
Pe
so
Edad
Diagrama de Dispersión
14
- Calcular la recta de regresión y el coeficiente de correlación para probar estadísticamente su
relación.
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,967400646
Coeficiente de determinación R^2 0,93586401
R^2 ajustado 0,934665207
Error típico 1,511415576
Observaciones 110
Coeficientes
Intercepción -78,937361
Variable x1 -0,496865439
Variable x2 86,5177139
y = 79,022x - 73,543 R² = 0,9346
0,0
10,0
20,0
30,0
40,0
50,0
60,0
0,0 0,2 0,4 0,6 0,8 1,0 1,2 1,4 1,6
Pe
so
Estatura
Diagrama de Dispersión
15
- Relacionar la información obtenida con el problema.
Análisis:
El coeficiente de correlación múltiple entre los variables peso, edad y estatura de los estudiantes
de las instituciones públicas y privadas del municipio de san Sebastián de mariquita es excelentes
porque da 0,96740065
El coeficiente de determinación es 0,93586401 por lo tanto se analiza que por ser cercano a 1, se
afirma que el modelo matemático obtenido el cual relaciona las variables de porcentaje peso,
edad y estatura de los estudiantes de las instituciones públicas y privadas del municipio de san
Sebastián de mariquita es confiable.
16
Conclusiones
La investigación es un proceso de indagación en el cual la estadística descriptiva corresponde a
metodologías de gran utilidad para la eficiencia en el que hacer investigativo, de ahí la
importancia de que como estudiantes y futuros investigadores aprendamos estas metodologías
que muy probablemente serán muy útiles en nuestro que hacer, en los procesos de investigación
que realicemos sobre situaciones específicas de realidad y en general en todo nuestro actuar.
La estadística se convierte en un área de estudio muy útil y por ello se realizó este proceso de
aprendizaje el cual ha generado diferentes aprendizajes y desarrollo de habilidades entorno a la
estadística descriptiva y su aplicación sobre realidades a las cuales nos enfrentamos.
El primer paso para determinar si existe o no una relación entre dos variables es observar la
gráfica llamada diagrama de dispersión.
El error estándar nos permite deducir la confiabilidad de la ecuación de regresión que hemos
desarrollado.
El análisis de correlación es la herramienta estadística que podemos usar para describir el grado
hasta el cual una variable esta linealmente relacionada con la otra.
La regresión simple se presenta cuando una variable independiente ejerce influencia sobre otra
variable dependiente. Ejemplo: Y = f(x)
La regresión Múltiple se presenta cuando dos o más variables independientes influyen sobre una
variable dependiente. Ejemplo: Y = f(x, w, z).
17
Referencias
Referencias electrónicas:
BLOG CURSO ESTADÍSTICA DESCRIPTIVA. Recuperado de:
http://estadisticadescriptivaunad100105.blogspot.com.co/
REGRESION MULTIPLE. Recuperado de:
http://www.monografias.com/trabajos30/regresion-multiple/regresion-multiple.shtml
REGRESIÓN LINEAL SIMPLE. Recuperado de:
http://html.rincondelvago.com/regresion-lineal-simple.html