2 Repaso de estádistica descriptiva R
-
Upload
alejandro-gil-rodriguez -
Category
Documents
-
view
222 -
download
3
Transcript of 2 Repaso de estádistica descriptiva R
![Page 1: 2 Repaso de estádistica descriptiva R](https://reader030.fdocumento.com/reader030/viewer/2022032701/563dba20550346aa9aa2e8c7/html5/thumbnails/1.jpg)
Repaso de estadística descriptiva con R
Prof. Marcela Ríos
![Page 2: 2 Repaso de estádistica descriptiva R](https://reader030.fdocumento.com/reader030/viewer/2022032701/563dba20550346aa9aa2e8c7/html5/thumbnails/2.jpg)
Instalación de R y R Studio
• Revisar los pasos en el siguiente link:
• http://blog.urcera.com/wordpress/?p=242
![Page 3: 2 Repaso de estádistica descriptiva R](https://reader030.fdocumento.com/reader030/viewer/2022032701/563dba20550346aa9aa2e8c7/html5/thumbnails/3.jpg)
¿Cómo establecer el directorio de trabajo en RStudio?
![Page 4: 2 Repaso de estádistica descriptiva R](https://reader030.fdocumento.com/reader030/viewer/2022032701/563dba20550346aa9aa2e8c7/html5/thumbnails/4.jpg)
¿Cómo establecer el directorio de trabajo en RStudio?
![Page 5: 2 Repaso de estádistica descriptiva R](https://reader030.fdocumento.com/reader030/viewer/2022032701/563dba20550346aa9aa2e8c7/html5/thumbnails/5.jpg)
¿Cómo establecer el directorio de trabajo en RStudio?
![Page 6: 2 Repaso de estádistica descriptiva R](https://reader030.fdocumento.com/reader030/viewer/2022032701/563dba20550346aa9aa2e8c7/html5/thumbnails/6.jpg)
¿Cómo establecer el directorio de trabajo en RStudio?
![Page 7: 2 Repaso de estádistica descriptiva R](https://reader030.fdocumento.com/reader030/viewer/2022032701/563dba20550346aa9aa2e8c7/html5/thumbnails/7.jpg)
¿Cómo establecer el directorio de trabajo en RStudio?
![Page 8: 2 Repaso de estádistica descriptiva R](https://reader030.fdocumento.com/reader030/viewer/2022032701/563dba20550346aa9aa2e8c7/html5/thumbnails/8.jpg)
Crear variable en R
• Crear la variable edad con c( )
• edad <-c(8,8,7,7,5,6,7,5,9,3,4,7,6)
![Page 9: 2 Repaso de estádistica descriptiva R](https://reader030.fdocumento.com/reader030/viewer/2022032701/563dba20550346aa9aa2e8c7/html5/thumbnails/9.jpg)
Medidas de tendencia central
![Page 10: 2 Repaso de estádistica descriptiva R](https://reader030.fdocumento.com/reader030/viewer/2022032701/563dba20550346aa9aa2e8c7/html5/thumbnails/10.jpg)
Medidas de tendencia central
• Moda: puntuación más frecuente de la distribución.
• Mediana: valor por debajo del cual queda el 50% de los puntajes (P50)
• Si la cantidad de puntajes es impar es el puntaje central.
• Si la cantidad de puntajes es par es el promedio de los dos puntajes centrales.
• Media: suma de los puntajes divididos entre la cantidad de puntajes.
![Page 11: 2 Repaso de estádistica descriptiva R](https://reader030.fdocumento.com/reader030/viewer/2022032701/563dba20550346aa9aa2e8c7/html5/thumbnails/11.jpg)
moda
moda
![Page 12: 2 Repaso de estádistica descriptiva R](https://reader030.fdocumento.com/reader030/viewer/2022032701/563dba20550346aa9aa2e8c7/html5/thumbnails/12.jpg)
Medidas de tendencia central en R
• Media
• Mediana
![Page 13: 2 Repaso de estádistica descriptiva R](https://reader030.fdocumento.com/reader030/viewer/2022032701/563dba20550346aa9aa2e8c7/html5/thumbnails/13.jpg)
Medidas de posición
![Page 14: 2 Repaso de estádistica descriptiva R](https://reader030.fdocumento.com/reader030/viewer/2022032701/563dba20550346aa9aa2e8c7/html5/thumbnails/14.jpg)
Medidas de posición
• Las medidas de posición dividen un conjunto de datos en grupos con el mismo número de individuos.
• Para calcular las medidas de posición es necesario que los datos estén ordenados de menor a mayor.
• Las medidas de posición son: cuartiles, deciles y percentiles.
![Page 15: 2 Repaso de estádistica descriptiva R](https://reader030.fdocumento.com/reader030/viewer/2022032701/563dba20550346aa9aa2e8c7/html5/thumbnails/15.jpg)
Cuartiles
• Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales.
• Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos.
• Q2 coincide con la mediana.
![Page 16: 2 Repaso de estádistica descriptiva R](https://reader030.fdocumento.com/reader030/viewer/2022032701/563dba20550346aa9aa2e8c7/html5/thumbnails/16.jpg)
Deciles
• Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.
• Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.
• D5 coincide con la mediana.
![Page 17: 2 Repaso de estádistica descriptiva R](https://reader030.fdocumento.com/reader030/viewer/2022032701/563dba20550346aa9aa2e8c7/html5/thumbnails/17.jpg)
Percentiles
• Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.
• Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.
• P50 coincide con la mediana.
![Page 18: 2 Repaso de estádistica descriptiva R](https://reader030.fdocumento.com/reader030/viewer/2022032701/563dba20550346aa9aa2e8c7/html5/thumbnails/18.jpg)
Medidas de posición en R
• Cuartiles
![Page 19: 2 Repaso de estádistica descriptiva R](https://reader030.fdocumento.com/reader030/viewer/2022032701/563dba20550346aa9aa2e8c7/html5/thumbnails/19.jpg)
Medidas de variabilidad
![Page 20: 2 Repaso de estádistica descriptiva R](https://reader030.fdocumento.com/reader030/viewer/2022032701/563dba20550346aa9aa2e8c7/html5/thumbnails/20.jpg)
Medidas de dispersión o variabilidad
• Rango: la diferencia entre los puntajes más alto y más bajo en la distribución
• Desviación estándar: valor que nos permite saber cuán alejado está el puntaje en bruto de la media de su distribución.
• Varianza: cuadrado de la desviación estándar.
![Page 21: 2 Repaso de estádistica descriptiva R](https://reader030.fdocumento.com/reader030/viewer/2022032701/563dba20550346aa9aa2e8c7/html5/thumbnails/21.jpg)
Medidas de dispersión en R
• Rango
• Desviación estándar
• Varianza
![Page 22: 2 Repaso de estádistica descriptiva R](https://reader030.fdocumento.com/reader030/viewer/2022032701/563dba20550346aa9aa2e8c7/html5/thumbnails/22.jpg)
Asociación entre variables
![Page 23: 2 Repaso de estádistica descriptiva R](https://reader030.fdocumento.com/reader030/viewer/2022032701/563dba20550346aa9aa2e8c7/html5/thumbnails/23.jpg)
Correlación
• Correlación producto-momento de Pearson: describe la fuerza de una asociación lineal entre dos variables numéricas.
• La relación puede representarse con mayor precisión con una línea recta.
• El coeficiente de correlación expresa la magnitud y la dirección de la relación de forma cuantitativa.
• Variabilidad de Y explicada por X.
![Page 24: 2 Repaso de estádistica descriptiva R](https://reader030.fdocumento.com/reader030/viewer/2022032701/563dba20550346aa9aa2e8c7/html5/thumbnails/24.jpg)
Correlación en R
![Page 25: 2 Repaso de estádistica descriptiva R](https://reader030.fdocumento.com/reader030/viewer/2022032701/563dba20550346aa9aa2e8c7/html5/thumbnails/25.jpg)
Práctica
• En R Studio y utilizando la base “Exam.Anxiety.dat”:
1. calcule las medidas de tendencia central y variabilidad de la variable “Anxiety”.
2. calcule el valor del tercer cuartil de la variable “Anxiety”.
3. calcule la correlación entre la variable “Anxiety” y “Exam”.
• Envíe los resultados al correo de la profesora.