SEMINARIO 6Análisis exploratorio de
datos Tablas de frecuencias, resúmenes numéricos y
gráficos.Selena Expósito Sollo
EJERCICIO 1•Selecciona dos variables
cualitativas-factor del fichero
“activossalud.RData”, descríbelas en tablas de
frecuencias e interpreta al menos 3 aspectos en
relación a la distribución de las mismas.
• Las variables cualitativas que vamos a distribuir en tablas de frecuencia y a comentar son: Edad: variable tipo factor de la edad medida en intervalos: 1- 18
años, 2- 19-20 años, 3- 21-22 años, 4- 23-25 años, 4- Más de 25 años
Uso de píldora del día después: : 0- “Siempre”, 1- “Alguna vez”, 2- “Nunca”, 3- “No he tenido relación”
edad Uso de la píldora del día después
• En la variable “edad” observamos: Más del 38% tienen 18 años. Sólo el 10,03% tienen más de 25 años. El 77,51% tiene de 18 a 22 años.
• En la variable “uso de la píldora del dia después” vemos: No hay nadie en la muestra que la
haya usado siempre. El 69,43% no ha requerido nunca el
uso de la píldora. El 27.98% de las que han respondido
la ha usado alguna vez.
EJERCICIO 2• Selecciona dos variables
numéricas del fichero “activossalud.RData”, y
mediante resúmenes numéricos describe e
interpreta la distribución de las mismas.
• Las variables cuantitativas que vamos a resumir son:
Hora de práctica deportiva: Horas de dedicación a practicar deporte a la semana
Medicalización: Escala cuantitativa, formada tras sumar las siguientes preguntas: ¿Has tomado alguno de los siguientes medicamentos en el último trimestre: Analgésicos, Laxantes, Anti-inflamatorios, Inhaladores, Antibióticos, Jarabe?, cada una de ellas con las siguientes categorías de respuesta: 1- “Sí”, 2- “No”. Por tanto, a más puntuación menor uso de medicamentos.
• La media de tiempo de deporte entre las unidades de análisis es de 2,48 horas semanales.
• El 75% de las personas que han contestado al cuestionario realizan 4 horas de deporte semanalmente o menos.
• La media del consumo de medicamentos es de 9,91 lo que es un buen indicador puesto que el valor máximo es de 12.
• El valor mínimo en el consumo de medicamentos es 7, lo que nos indica que no hay que tenga menos de esa puntuación, es decir, los que ha contestado todos toman algún medicamento de los expuestos.
EJERCICIO 3•Debes realizar al menos un
gráfico de cada tipo con variables adecuadamente seleccionadas del fichero
“activossalud.RData”, describe e interpreta la distribución los mismos.
DIAGRAMA DE BARRAS• Variable cualitativa usada: Botellón
Más del 30% hace botellón sólo los fines de semana mientras que entre un 15 y un 20% no lo realiza. Sin embargo, hay un 2% de los alumnos que confiesa hacer botellón diariamente.
DIAGRAMA DE SECTORES• Variable cualitativa usada: Cerveza
Como se puede observar en el gráfico, un 40% aproximadamente no bebe cerveza nunca. Sin embargo, más de la mitad de los encuestados que contestaron esta pregunta, la consumen.
HISTOGRAMA• Variable cuantitativa usada: Altura
En el histograma observamos que las alturas que se dan con mayor frecuencia se encuentran en el intervalo entre 1,5 y 1,8m. Menos de 5 personas miden menos de 1,5m o más de 1,9m.
GRÁFICO DE CAJA O BIGOTE• Variable cuantitativa usada: Comunicación
familiar.
El gráfico nos muestra que la media se encuentra en 7h de comunicación aproximadamente y que el 50 % de la muestra dedica entre 6 y 9h a la comunicación familiar. El valor mínimo se encuentra alrededor de las 3h.