Seminario 8

12
Seminario VIII : Análisis bivariado con variables cuantitativas Beatriz Rojas Jiménez Estadística y Tic’s 1º Enfermería V. Rocío; subgrupo 16 Curso: 2015/16

Transcript of Seminario 8

Page 1: Seminario 8

Seminario VIII: Análisis

bivariado con variables

cuantitativasBeatriz Rojas Jiménez

Estadística y Tic’s1º Enfermería V. Rocío; subgrupo 16

Curso: 2015/16

Page 2: Seminario 8

Introducción

En este seminario, continuamos dando un paso más a lo aprendido anteriormente. Como ya vimos en el seminario pasado R Commander nos permite realizar operaciones y conocer si existe relación entre variables y la fortaleza de esta relación. Esta vez, vamos ha realizarlo pero referido a variables cuantitativas.Las pruebas que vamos a aplicar cuando dos variables son cuantitativas es la Coeficientes de correlación de Pearson y Rho Spearman pero para ello tenemos que comprobar antes: Normalidad Linealidad

Page 3: Seminario 8

EJERCICIO

Determina que si existe relación y como de fuerte es entre las variables altura y peso.

Page 4: Seminario 8

Recordamos que lo primero que debemos hacer cada vez que entremos en R Commander es siempre:1º) Establecer el directorio de trabajo (la carpeta de trabajo).2º) Cargar los datos con los que vamos a trabajar, en este caso, de nuevo trabajamos con “activossalud”.

Page 5: Seminario 8

Nosotros queremos saber la existencia de relación entre las variables “peso” y “altura”. Para ello debemos saber que tipo de test tenemos que utilizar (paramétrico o no paramétrico) debemos comprobar la normalidad de las variables.Comenzamos comprobando la normalidad de la variable “peso”: Gráficas Gráfica de comparación de cuantiles seleccionamos la variable (comprobamos que en estadísticos esté seleccionado la distribución normal)

Page 6: Seminario 8

-3 -2 -1 0 1 2 3

4060

8010

012

0

norm quantiles

peso

158259

Tras realizar los pasos anteriores, nos aparecerá este diagrama de dispersión de la variable “peso”.Podemos observar como muchos puntos de la variable se salen de los intervalos de confianza (líneas discontinuas), por tanto, decimos que esta variable no sigue una distribución normal.

Page 7: Seminario 8

-3 -2 -1 0 1 2 3

1.5

1.6

1.7

1.8

1.9

2.0

norm quantiles

altu

ra

259

103

Ahora realizamos de nuevo los mismos pasos, pero elegimos la variable “altura”.Nos aparecerá el diagrama de dispersión de la izquierda. En él podemos observar como hay puntos que se salen de los intervalos de confianza, por tanto, decimos que la variable “altura” no sigue una distribución normal.

En resumen, ninguna de las dos variables (“peso” y “altura”) sigue una distribución normal. En este caso tendremos que utilizar un test no paramétrico: Rho Spearman.

Page 8: Seminario 8

Sabiendo que las variables no siguen una distribución normal, ahora podemos empezar a estudiar:1. El tipo de relación (regresión) que hay entre ellas.2. La fortaleza de dicha relación en caso de que

hubiera (correlación).

Page 9: Seminario 8

1º) ESTUDIO DEL TIPO DE RELACIÓN (REGRESIÓN):Gráficas Diagrama de dispersión… elegimos variables “peso” y “altura”*En opciones: elegimos “línea de mínimos cuadrados”

Page 10: Seminario 8

40 60 80 100 120

1.5

1.6

1.7

1.8

1.9

2.0

peso

altu

ra

Como podemos observar, las puntuaciones se alejan de la línea mínimos cuadrados, sobre todo a medida que aumenta. Por tanto, decimos que las variables no están relacionadas.

Page 11: Seminario 8

2º) ESTUDIAMOS LA FUERZA DE LA RELACIÓN EN CASO DE QUE HUBIERA (CORRELACIÓN)Estadísticos Resúmenes Matriz de correlaciones Elegir las dos variables* En opciones: marcamos “Coeficiente de Pearson” ya que son variables cuantitativas que no siguen la distribución normal

Page 12: Seminario 8

Tras los datos obtenidos por el Coeficiente de Correlación de Pearson que sería 0’6311292, concluimos que la fuerza de relación entre nuestras dos variables es positiva débil (coeficiente de Pearson va de 0-1). Según la escala de fortaleza, se considera que dos variables están relacionadas cuando el valor está por encima de 0’8 y nuestro valor es menor, así que, nuestras variables “peso” y “altura” no están relacionadas.

COEFICIENTE DE CORRELACIÓN DE PEARSON: