Presentación estadistica

17
Instituto universitario politécnico “Santiago Mariño” Sede-Barcelona Escuela Ingeniería en mantenimiento mecánico Sección ZV COEFICIENTES DE CORRELACION DE PEARSON Y SPEARMAN Profesor Bachiller Ramón Aray Silva Romario CI: 25.272.049

Transcript of Presentación estadistica

Page 1: Presentación estadistica

Instituto universitario politécnico“Santiago Mariño”

Sede-BarcelonaEscuela

Ingeniería en mantenimiento mecánicoSección ZV

COEFICIENTES DE CORRELACION DE PEARSON Y SPEARMAN

Profesor Bachiller Ramón Aray Silva Romario CI: 25.272.049

Page 2: Presentación estadistica

Coeficiente de Correlación de Pearson

El Coeficiente de Correlación de Pearson es una medida de la relación lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables.De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas.En el caso de que se esté estudiando dos variables aleatorias x e y sobre una población; el coeficiente de correlación de Pearson se simboliza con la letra , siendo la expresión que nos permite calcularlo:

Page 3: Presentación estadistica

Coeficiente de Correlación de

PearsonDonde;   es la covarianza de (X,Y)  es la desviación típica de la variable X  es la desviación típica de la variable Y

De manera análoga podemos calcular este coeficiente sobre un estadístico muestral, denotado como   a:

Page 4: Presentación estadistica

Ventajas y Desventajas del Coeficiente de Pearson

Ventajas• El valor del coeficiente de correlación es independiente de cualquier unidad usada para medir variables.

• Mientras mas grande sea la muestra mas exacta será la estimación

Desventajas• Requiere supuestos acerca de la naturaleza

o formas de las poblaciones afectadas.• Requiere que las dos variables hayan ido

medidas hasta un nivel cuantitativo continuo y que la distribución de ambas sea

semejante a la de la curva normal.

Page 5: Presentación estadistica

Usos del Coeficiente de Correlación de Pearson

Permite predecir el valor de una variable dado un valor determinado de la otra variable. Se trata de valorar la asociación entre dos variables cuantitativas estudiando el método conocido como correlación. Dicho cálculo es el primer paso para determinar la relación entre las variables. Consiste en la posibilidad de calcular su distribución muestral y así poder determinar su error típico de estimación.Reporta un valor de correlación cercano a 0 como un indicador de que no hay relación lineal entre 2 variables.Reporta un valor de correlación cercano a 1 como un indicador de que existe una relación lineal positiva entre las 2 variables. Un valor mayor a cero que se acerque a 1 da como resultado una mayor correlación positiva entre la información.

Page 6: Presentación estadistica

Características de la R de Pearson

La r de Pearson es una medida que indica hasta que punto los mismos individuos o sucesos ocupan la misma posición relativa a 2 variables.

La r de Pearson refleja únicamente la relación lineal entre 2 variables

Cuando la relación es perfecta positiva, cada individuo obtiene exactamente las mismas calificaciones en ambas variables.

Un valor alto positivo alto de r de Pearson indica que cada individuo obtiene, aproximadamente; las mismas calificaciones en ambas variables.

Page 7: Presentación estadistica

Interpretación del Coeficiente R de Pearson

Page 8: Presentación estadistica

Formulas de Pearson

Page 9: Presentación estadistica

Usos de Enfoques de Pearson a Problemas Estadísticos

En la perspectiva de Pearson, para establecer el nivel de significación estadística habría que atender al impacto de cada tipo de error en el objetivo del investigador, y a partir de ahí se decidiría cuál de ellos es preferible minimizar.

Pearson llamaron alfa al error tipo I y beta al error tipo II; a partir de este último tipo de error, introdujeron el concepto de “poder de una prueba estadística”, el cual se refiere a su capacidad para evitar el error tipo II, y está definido por 1-beta, y en estrecha relación con éste se ha desarrollado el concepto de “tamaño del efecto” que algunos han propuesto como sustituto de los valores p en los informes de investigación científica.

Las pruebas paramétricas más conocidas y usadas son la prueba T de Student, la prueba F, llamada así en honor a Fisher, y el coeficiente de correlación de Pearson, simbolizado por r.

Page 10: Presentación estadistica

Coeficiente de Correlación de Spearman

El Coeficiente de Correlación de Spearman, ρ (rho) es una medida de la correlación (la asociación o interdependencia) entre dos variables aleatorias continuas. Para calcular ρ, los datos son ordenados y reemplazados por su respectivo orden.

El estadístico ρ viene dado por la expresión:

Page 11: Presentación estadistica

Coeficiente de Correlación de Spearman

Donde D es la diferencia entre los correspondientes estadísticos de orden de x - y. N es el número de parejas.

Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si éstos son pocos, se puede ignorar tal circunstancia.

Para muestras mayores de 20 observaciones, podemos utilizar la siguiente aproximación a la distribución t de Student

Page 12: Presentación estadistica

Coeficiente de Correlación de Spearman

La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson. Oscila entre -1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no independencia.

La correlación estimada entre X e Y se halla calculando el coeficiente de correlación de Pearson para el conjunto de rangos apareados.

La correlación de Spearman puede ser calculada con la fórmula de Pearson, si antes hemos transformado las puntuaciones en rangos.

Page 13: Presentación estadistica

Usos del Coeficiente de correlación de Spearman

A partir de un conjunto de n puntuaciones, la formula que permite el calculo de la correlación entre dos variables X e Y, medidas al menos en escala ordinal, es la siguiente:

P=0 No hay correlaciónp≠ 0 Hay correlación

Donde d es la distancia existente entre los puestos que ocupan las puntuaciones correspondientes a un sujeto i cuando estas puntuaciones han sido ordenadas para X y para Y.

Page 14: Presentación estadistica

Ventajas y Desventajas del Coeficiente de

Spearman

Ventajas

No esta afectada por los cambios en las unidades de medida.

Al ser una técnica no parámetra, es libre de distribución probabilística.

Desventajas Es recomendable usarlo cuando los

datos presentan valores extremos, ya que dichos valores afectan mucho el coeficiente de correlación de Pearson, o ante distribuciones no normales.

r no debe ser utilizado para decir algo sobre la relación entre causa y efecto.

Page 15: Presentación estadistica

Usos del Coeficiente de correlación de Spearman

Para aplicar el coeficiente de correlación de Spearman se requiere que las variables estén medidas al menos en escala ordinal, es decir; de forma que las puntuaciones que la representan puedan ser colocadas en dos series ordenadas.

A veces, este coeficiente es denominado por la letra griega ρs (rho), aunque cuando nos situamos en el contexto de la Estadística Descriptiva se emplea la notación rs.

Page 16: Presentación estadistica

Formulas de Spearman

Page 17: Presentación estadistica

Una generalización del coeficiente de Spearman es útil en la situación en la cual hay tres o más condiciones, varios individuos son observados en cada una de ellas, y predecimos que las observaciones tendrán un orden en particular. Por ejemplo, un conjunto de individuos pueden tener tres oportunidades para intentar cierta tarea, y predecimos que su habilidad mejorará de intento en intento.

El coeficiente de correlación de rangos de Spearman debe utilizarse para series de datos en los que existan valores extremos, pues si calculamos la correlación de Pearson, los resultados se verán afectados.

La interpretación del resultado del coeficiente de correlación de Spearman se encuentra entre los valores de -1 y 1. La significación estadística de un coeficiente debe tenerse en cuenta conjuntamente con la relevancia clínica del fenómeno que se estudia.