Evaluacion Final 2014 I

15
Universidad Central de Venezuela Departamento de Ciencias Básicas Facultad de Medicina Cátedra de Estadística Escuela de Nutrición y Dietética Asignatura: Estadística Aplicada Profesora: Zuleima Rodríguez Acevedo ACTIVIDAD FINAL EXPLICACIÓN DE LA ACTIVIDAD: De una investigación hipotética planteada, se dan los resultados del análisis estadístico y se pide responder RAZONADAMENTE a una serie de preguntas relacionadas con la investigación (más abajo). Estudios realizados con anterioridad ponen de manifiesto que incrementos en el contenido de alquitrán y nicotina de los cigarrillos vienen acompañados por incrementos en el monóxido de carbono emitido al fumarel punto de partida son los datos que a continuación se presentan y se plantea el siguiente objetivo:

Transcript of Evaluacion Final 2014 I

Page 1: Evaluacion Final 2014 I

Universidad Central de Venezuela Departamento de Ciencias BásicasFacultad de Medicina Cátedra de EstadísticaEscuela de Nutrición y Dietética Asignatura: Estadística Aplicada

Profesora: Zuleima Rodríguez Acevedo

ACTIVIDAD FINAL

EXPLICACIÓN DE LA ACTIVIDAD: De una investigación hipotética planteada, se dan los resultados del análisis estadístico y se pide responder RAZONADAMENTE a una serie de preguntas relacionadas con la investigación (más abajo).

Estudios realizados con anterioridad ponen de manifiesto que incrementos en el contenido de alquitrán y nicotina de los cigarrillos vienen acompañados por incrementos en el monóxido de carbono emitido al fumarel punto de partida son los datos que a continuación se presentan y se plantea el siguiente objetivo:  

 

Page 2: Evaluacion Final 2014 I

OBJETIVO: Hacer el estudio descriptivo de los datos y encontrar un modelo que permita estimar la cantidad de MONOXIDO de CARBONO, a partir de las variables Alquitrán, Nicotina y Peso del cigarrillo.

Hacer un estudio descriptivo de las variables que intervienen en el estudio. Este documento tendrá 3 partes:

PARTE 1: Genere un breve informe estadístico descriptivo, a partir de la salida de ordenador que se adjunta (tómese el espacio que necesite pero sea breve), en el que señale:

1) el tamaño muestral, El tamaño de la muestral es el número de sujetos que componen la muestra

extraída de una población, necesarios para que los datos obtenidos sean

representativos de la población. En nuestro caso, el tamaño muestral es de 25

cigarrillos, compuesto por 16 cigarrillos de tabaco rubio y 9 cigarrillos de tabaco

negro.

2) cuál es la variable con mayor variabilidad,

Las medidas de dispersión, también llamadas medidas de variabilidad, muestran

la variabilidad de una distribución, indicando por medio de un número, si las

diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto

mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más

homogénea será a la media. Las medidas de dispersión utilizadas en ésta muestra

son la Desviación Típica y la Varianza. La variable con mayor variabilidad es el

alquitrán debido a que presenta una Desviación Típica de 5,87634 y una

Varianza de 34,531, ambas mayores con respecto a las demás variables.

Page 3: Evaluacion Final 2014 I

3) cuál de las medias es más representativa de los datos El peso es la variable con la media más representativa debido a que los

valores de su Desviación Típica y Varianza son inferiores a los de las demás

medias con un valor de 0,0877215 y 0,008 respectivamente, lo que significa que

tiene una menor cantidad de valores que se hallen dispersos a la media con

respecto a las demás variables.

4) cuál de las medias es más estable.

El error típico son las variaciones a menudo inevitables. El error típico puede

definirse también como la variación producida por factores distorsionantes tanto

conocidos como desconocidos. Una media con menor error típico es una media

más estable. Por tanto nuestra media más estable es el peso, ya que posee un

error típico de 0,175443

PARTE IICompare la muestra de mayor variabilidad (la que usted seleccionó) con la muestra que usted estudió para elaborar la base de datos, explique:

P2 4 6 4 5 7 16 8 11 8 2 8 5 6 9 8 8 6 6 1 7 9 8 7 8 7 9 7 6 6 7

Media 6,97Moda 8Mediana 7Desviación típica 2,68Error típico 1,27Varianza 6,97

Fuente: Archivo "Estadística base de datos, tablas y gráficos" segundo corte.

Datos corespondientes a la Pregunta #2 de la encuesta socioeconómica, acerca del número de ambientes en la vivienda incluyendo aquellos destinados para dormir, de la muestra de 30 estudiantes pertenecientes a la Universidad Central de

Venezuela

Page 4: Evaluacion Final 2014 I

Cuál es la variable con mayor variabilidad

Entre la variable alquitrán y la variable del número de ambientes en la vivienda la

que tiene mayor variabilidad es la de alquitrán con una Desviación Típica de

5,87634 y una Varianza de 34,531 con respecto al de la variable del número de

ambientes.

Cuál de las medias es más representativa de los datos

La media más representativa es la de número de ambiente en la vivienda

utilizado en la base de datos. Debido a que es la que tiene los valores de 2,68 de

la Desviación Típica y el 6,97 de la Varianza inferiores a los presentados por el

alquitrán.

Cuál de las medias es más estable.

La media con el menor Error Típico es el alquitrán con 1,17527, por lo tanto es

la media más estable de las dos.

PARTE III

Estudios realizados con anterioridad ponen de manifiesto que incrementos en el contenido de alquitrán y nicotina de los cigarrillos vienen acompañados por incrementos en el monóxido de carbono emitido al fumar. Se Parte de los datos que se presentan y se plantea el siguiente objetivo:  

 

Page 5: Evaluacion Final 2014 I

OBJETIVO: Encontrar un modelo que nos permita estimar la cantidad de MONOXIDO de CARBONO, a partir de las variables Alquitrán, Nicotina y Peso del cigarrillo..

Page 6: Evaluacion Final 2014 I
Page 7: Evaluacion Final 2014 I
Page 8: Evaluacion Final 2014 I

PARTE 3.1. Comience con una inspección gráfica de las nubes de puntos . Genere un breve informe (tómese el espacio que necesite, pero sea breve) sobre la relación entre el monóxido de carbono y cada una de las variables explicativas, a partir de las correspondientes nubes de puntos que se adjuntan. A partir de la inspección visual  de las nubes,  cuál de las variables parece más relacionada con el monóxido y si  la relación parece similar para los dos tipos de tabaco, Rubio y Negro.

A partir de las correspondientes nubes de puntos que se adjuntan, se manifiesta

una correlación dependiente entre la producción de monóxido de carbono con el

contenido de nicotina y el contenido de alquitrán evidenciado en mayor medida

con la variable del contenido de nicotina. Lo que significa que a mayor

contenido de nicotina en el cigarrillo habrá un aumento relativamente similar

del monóxido de carbono producido. Con respecto al peso, si bien existe una

relación, no se hace muy evidente.

Page 9: Evaluacion Final 2014 I

Respecto a si existe una relación similar entre tabaco rubio y negro se puede decir

que, si bien para ambos existe la misma correlación entre el contenido de

alquitrán y el monóxido de carbono, las cantidades de dichos elementos

encontrados en los cigarros de la muestra son superiores para el tabaco negro,

o lo que es lo mismo, se encuentran notablemente en menor cantidad para el

tabaco rubio.

PARTE 3.2. Búsqueda de modelos que permitan estimar la cantidad de MONÓXIDO de CARBONO, a partir de las variables Alquitrán, Nicotina y Peso del cigarrillo.a. Realice un breve informe sobre los modelos y su representatividad, a la vista de los resultados que se adjuntan: Interprete el coeficiente de determinación R2 y el coeficiente de regresión, en cada modelo y díganos cuál le parece más adecuado y porqué

Coeficiente de determinación

El coeficiente de determinación R2 indica la existencia de una relación lineal y

Mide el porcentaje de variación en la variable explicada por una variable

dependiente, que es más fuerte cuanto más próximo es a 1, ésta relación está

determinada en porcentaje, por tanto sí R2=1 significa que explica el 100% de la

muestra. En el caso del modelo MA este coeficiente es de 0.91 y el del modelo

MN es de 0.93 en ambos casos la correlación lineal es muy alta, explicando el

91% y 93% de la muestra respectivamente. En el tercer modelo MP es 0.46 donde

Page 10: Evaluacion Final 2014 I

la correlación lineal es moderada, ya que solo explica el 46% de la muestra.

Siendo la correlación positiva en todos los casos, entonces cuando “X” aumenta

se espera que “Y” también aumente.

El coeficiente de regresión

Con respecto al modelo MA, El valor de “b” es 0.73 que indica el incremento de

alquitrán en promedio por monóxido de carbono producido, el valor de “a” se

interpretara como el valor obtenido, entendiéndose este valor como 3.88. En el

segundo modelo MN el valor “b” indica que el aumento de la nicotina aumenta el

monóxido de carbono producido. Por último en el modelo MP podemos ver una

diferencia Como el coeficiente de correlación lineal es 0.46 no podemos deducir

que exista una relación fuerte ni débil, tendríamos que realizar contraste de

hipótesis para saberlo con claridad.

Un valor ≠0 indica que Existe regresión lineal de Y en función de x.

En relación al caso se considera más apropiado el coeficiente de determinación

dado que este nos permite conocer la intensidad de relación lineal entre dos

variables de un intervalo, a fin de predecir futuros resultados o testear una

hipótesis, haciendo más específico el estudio y mejor interpretación de los datos

al momento de analizar la investigación. A diferencia del coeficiente de regresión

que solo nos suministra la relación entre las variables.

 

PARTE IV

Calcule para la variable (ingreso y edad) y (ingreso familiar y número de personas que trabajan) de la muestra que usted estudió , el coeficiente de determinación y correlación

INGRESO = 157,89*EDAD - 900,96

R² = 0,0968

Page 11: Evaluacion Final 2014 I

Explicando apenas el 9,6% de la variable no posee una correlación fuerte o

moderada, solo podría hablarse de una correlación débil entre la edad y el

ingreso.

INGRESO FAMILIAR = -256,35*NÚMERO DE PERSONAS QUE TRABAJAN +

22725

R² = 0,0002

Explicando tan solo 0,02% de la variable, estaríamos frente a una correlación

inexistente entre el ingreso familiar y el número de personas que trabajan en el

hogar.

Grafique a través de un diagrama de nubes las variables que estudió anteriormente

0 20 40 60 80 100 120Bs. F. 0

Bs. F. 10,000

Bs. F. 20,000

Bs. F. 30,000

Bs. F. 40,000

Bs. F. 50,000

Bs. F. 60,000

Bs. F. 70,000

Bs. F. 80,000

Bs. F. 90,000

f(x) = 157.889247506072 x − 900.95635976797R² = 0.0967960172359598

NUBE Y RECTA DE CORRELACIÓN ENTRE INGRESOS Y EDAD

EDAD

ING

RESO

S

Page 12: Evaluacion Final 2014 I

PARTE V

Entrega de las encuestas en físico

Coeficiente de correlación

Recuerde:

N= tamaño de la muestra en estudio

Xi = valores de la variable independiente

Yi = valores de la variable dependiente

Fecha de entrega:

El trabajo será entregado en grupo

Page 13: Evaluacion Final 2014 I

n∑ xy−∑ x∑ y√¿¿¿