Conceptos Correlacion

download Conceptos Correlacion

of 4

description

Conceptos correlacion

Transcript of Conceptos Correlacion

  • Universidad Nacional Agraria La Molina Departamento de Manejo Forestal FR2000 ESTADISTICA FORESTAL

    8/1/2008 1 Correlacin lineal

    Correlacin Lineal

    A veces es necesario investigar dos variables de una poblacin, por lo que requerimos recoger datos apareados de los individuos o entidades que integran la poblacin.

    Por ejemplo, si fuera posible establecer que existe una relacin entre la longitud de los osos y sus respectivos pesos, se podra construir un instrumento de prediccin que nos permita estimar el peso que probablemente posee un oso, segn la longitud que lo caracteriza. Empleando mtodos pticos y geomtricos debe ser relativamente ms fcil medir la longitud de los osos que pesarlos, de modo que tal investigacin tendra un valor prctico significativo para los administradores de las reservas donde habitan estos plantgrados.

    Longitudes y pesos de osos macho x Longitud (m) 1.35 1.71 1.83 1.83 1.87 1.74 1.85 0.94 y Peso (kg) 29.9 128.4 155.3 129.9 97.8 134.4 123.9 12.7

    Las relaciones que existen entre variables se pueden investigar por medio del anlisis de regresin y/o del anlisis de correlacin.

    El anlisis de regresin permite deducir el tipo o naturaleza de la relacin entre las variables; el anlisis de correlacin tiene que ver con la fuerza o intensidad de las relaciones.

    Cuando las variables cuya relacin se estudia son dos (como en el presente caso), los mtodos de anlisis se conocen como anlisis de correlacin simple y anlisis de regresin simple.

    Este documento se refiere nicamente a la correlacin simple.

    El estudio de la relacin entre las variables debe iniciarse con la construccin de un grfico denominado diagrama de dispersin, que muestra la naturaleza de la relacin.

    Diagrama de dispersin

    Correlacin Existe una correlacin entre dos variables si una de ellas est relacionada con la otra de alguna manera.

    Dado que las conclusiones que se sacan de los diagramas de dispersin tienden a ser subjetivas, necesitamos mtodos ms precisos y objetivos. El clculo del coeficiente de correlacin lineal es til para detectar patrones de lnea recta.

    El coeficiente de correlacin lineal r mide la fuerza de la relacin lineal entre valores x y y apareados de una muestra. Este coeficiente es representado con la letra griega (ro) cuando se refiere a la poblacin, y se conoce tambin como coeficiente de correlacin de momento producto de Pearson en honor a Kart Pearson (1857-1936), quien lo dedujo originalmente.

  • Universidad Nacional Agraria La Molina Departamento de Manejo Forestal FR2000 ESTADISTICA FORESTAL

    8/1/2008 2 Correlacin lineal

    = promedio X x( ) x

    Y y( ) y

    El estimador r (coeficiente de correlacin lineal para una muestra) se calcula con la frmula:

    r = 1(n 1)xi xsx

    yi ysy

    i=1

    n

    = 1(n 1)xi x( ) yi y( )i=1

    n

    sxsy

    Dado que sx y sy son las desviaciones estndar normales de los valores x y y, respectivamente, una frmula equivalente para r es:

    r =xi x( ) yi y( )i=1

    n

    [ xi x( )2

    i=1

    n ][ yi y( )

    2

    i=1

    n ]

    Una manipulacin algebraica apropiada de esta ltima ecuacin nos lleva a la siguiente frmula a la que se le han retirado los subndices para permitir una mayor claridad:

    r =n xy x( ) y( )

    n x 2( ) x( )2 n y 2( ) y( )

    2

    Interpretacin del coeficiente de correlacin lineal

    El valor de r siempre debe quedar entre -1 y +1 inclusive. Si r es cercano a 0, concluimos que no existe correlacin lineal significativa entre x y y, pero si r est cerca de -1 o +1, concluimos que existe una correlacin lineal significativa entre x y y.

    Algunas propiedades del coeficiente de correlacin lineal r:

    1. El valor de r siempre est entre -1 y +1. Es decir, -1 r 1

    2. El valor de r no cambia si todos los valores de cualquiera de las variables se convierten a una escala diferente (por ejemplo, los pesos de los osos podran cambiarse a libras sin que el valor de r cambie)..

    3. El valor de r no cambia si escogemos x o y. El intercambio de todos los valores de x y y no cambiar el valor de r.

    4. r mide la fuerza de una relacin lineal; no est diseado para medir la fuerza de una relacin no lineal.

    Errores que deben evitarse respecto a la correlacin.

    Correlacin no implica causalidad. Un valor alto de r puede originarse en una tercera variable correlacionada fuertemente con las dos variables consideradas en el anlisis.

    No deberan usarse en el anlisis de correlacin valores basados en promedios o en tasas.

    La falta de correlacin lineal entre dos variables no implica que estas no estn relacionadas; indica que no hay una correlacin lineal entre las dos variables.

  • Universidad Nacional Agraria La Molina Departamento de Manejo Forestal FR2000 ESTADISTICA FORESTAL

    8/1/2008 3 Correlacin lineal

    Prueba de hiptesis para determinar si existe una correlacin lineal significativa entre dos variables

    Se emplean dos mtodos para una prueba de hiptesis acerca de la existencia de una correlacin lineal significativa entre dos variables. Las expresiones sobre las hiptesis nula y alternativa indican lo siguiente:

    A continuacin se muestra la prueba de t, que es consistente con el formato presentado anteriormente, en el que se usa la distribucin t de Student con una estadstica de prueba de la forma t = (r - r)/sr, donde r y sr denotan el valor aseverado para la media y la desviacin estndar de muestra de los valores de r. Ya que suponemos que = 0, sigue que r = 0. Adems, dado que sr, la desviacin estndar de los coeficientes de correlacin lineales, se puede expresar como [(1- r2)/(n 2)], podemos usar la estdstica de prueba indicada en el cuarto recuadro.

    Aplicando el procedimiento para probar la aseveracin sobre la correlacin entre el peso y la longitud de los osos, tenemos:

    1. Planteamiento de hiptesis. (no hay correlacin lineal significativa) (correlacin lineal significativa)

    2. Nivel de significancia. Usamos = 0.05 para la prueba.

    H0: = 0 H1: 0

    Escoger un nivel de significancia

    Calcule r usando la frmula indicada

    La estadstica de prueba es:

    t = r 1 r2n 2

    Los valores crticos de t se obtienen de la Tabla de distribucin t usual, con n - 2 grados de libertad.

    Si el valor absoluto de la estadstica de prueba excede los valores crticos, rechazamos H0: = 0. Si no, no rechazamos H0..

    Si rechazamos H0 , concluimos que existe una correlacin lineal significativa. Si no rechazamos H0.. es que no hay suficientes indicios para concluir que existe una correlacin lineal.

    1

    2

    3

    4

    5

    6

    H0: = 0 (no hay correlacin lineal significativa); H1: 0 (hay correlacin lineal significativa)

    H0: = 0 H1: 0

  • Universidad Nacional Agraria La Molina Departamento de Manejo Forestal FR2000 ESTADISTICA FORESTAL

    8/1/2008 4 Correlacin lineal

    3. Clculo de r.

    r = 8(151,879) - (516.5)(2176)8(34,525.75) (516.5)2 8(728,520) (2176)2

    r = 91,128 / ([9433.75] [1,093,184]) = 0.897

    4. Clculo de la estadstica de prueba.

    t = r1 r2n 2

    =0.8971 0.89728 2

    = 4.971

    Los valores crticos de t = -2.447 y t = 2.447 se obtienen de la tabla de t, donde 2.447 corresponde a 0.05 dividido entre dos colas (con 0.025 en cada cola) y el nmero de grados de libertad (n 2 = 6).

    5. Dado que la estadstica de prueba 4.971 sobrepasa el valor crtico superior (2.447), entonces quiere decir que cae dentro de la regin crtica y, por tanto, rechazamos H0: = 0.

    6. Concluimos que hay indicios de la existencia de una correlacin lineal significativa entre el peso y la longitud de los osos.