Factorial - Universidad de Córdoba ·  · 2009-02-16ANÁLISIS FACTORIAL 1. Introducción 2....

27
ANÁLISIS FACTORIAL 1. Introducción 2. Examen de la matriz de correlación 3. Extracción de los factores 4. Rotación de los factores 5. Puntuaciones factoriales 6. Caso práctico

Transcript of Factorial - Universidad de Córdoba ·  · 2009-02-16ANÁLISIS FACTORIAL 1. Introducción 2....

Page 1: Factorial - Universidad de Córdoba ·  · 2009-02-16ANÁLISIS FACTORIAL 1. Introducción 2. Examen de la matriz de correlación 3. Extracción de los factores 4. Rotación de los

ANÁLISIS FACTORIAL

1. Introducción

2. Examen de la matriz de correlación

3. Extracción de los factores

4. Rotación de los factores

5. Puntuaciones factoriales

6. Caso práctico

Page 2: Factorial - Universidad de Córdoba ·  · 2009-02-16ANÁLISIS FACTORIAL 1. Introducción 2. Examen de la matriz de correlación 3. Extracción de los factores 4. Rotación de los

Objetivo. Resumir la información contenida en una base de datos con p variables en un reducido número de factores F, siendo el número de factores menor que el número de variables.

Principios básicos.

- Parsimonia. Los fenómenos deben explicarse con el menor número de F posibles.

- Interpretabilidad. Los F deben ser susceptibles de interpretación positiva.

Introducción

Page 3: Factorial - Universidad de Córdoba ·  · 2009-02-16ANÁLISIS FACTORIAL 1. Introducción 2. Examen de la matriz de correlación 3. Extracción de los factores 4. Rotación de los

Ideas básicas.

- El conjunto de variables a resumir deben tener interrelaciones importantes (matriz de correlación).

- Se acepta la hipótesis de que las relaciones existen porque las variables son manifestaciones comunes de factores no "observables”

- El objetivo del AF es llegar a un cálculo de esos factores: resumiendo la información, clarificando las relaciones entre las variables y sin pérdida excesiva de información

Introducción

Page 4: Factorial - Universidad de Córdoba ·  · 2009-02-16ANÁLISIS FACTORIAL 1. Introducción 2. Examen de la matriz de correlación 3. Extracción de los factores 4. Rotación de los

Utilidad.

- Proporcionar la estructura interna, las dimensiones subyacentes, de un conjunto amplio de variables, elaborando una estructura más simple que proporcione la misma información y permita entender los fenómenos.

- Simplificar la modelización convirtiendo, por eliminación de redundancias expresadas en altas correlaciones, un amplio conjunto de variables en factores “estructurales”.

Introducción

Page 5: Factorial - Universidad de Córdoba ·  · 2009-02-16ANÁLISIS FACTORIAL 1. Introducción 2. Examen de la matriz de correlación 3. Extracción de los factores 4. Rotación de los

Cada variable se expresa como una combinación lineal de factores no directamente observables.

Xij = F1i ai1 + F2i ai2+....+Fki aik + Vi

Siendo:

Xij la puntuación del individuo i en la variable j

Fij son los coeficientes factoriales (factores comunes)

aij son las puntuaciones factoriales (factores comunes)

Vi es el factor único de cada variable

Los factores únicos no están correlacionados entre sí ni con los factores comunes.

Introducción

Page 6: Factorial - Universidad de Córdoba ·  · 2009-02-16ANÁLISIS FACTORIAL 1. Introducción 2. Examen de la matriz de correlación 3. Extracción de los factores 4. Rotación de los

AF vs CP- CP podría definirse como una etapa de AF.

- AF diferencia la varianza común (variación de la variable que es compartida con las otras variables) y varianza única (la variación de la variable que es propia de esa variable).

- CP determina “factores” que sucesivamente expliquen la mayor parte de la varianza total, mientras que AF busca factores que expliquen la mayor parte de la varianza común.

- CP busca combinaciones lineales de las variables originales que expliquen la mayor parte de la variación total, mientras que AF pretende hallar un nuevo conjunto de variables, menor en número que las variables originales, que exprese lo que es común a esas variables.

- AF supone que existen factores comunes subyacentes a todas las variables, CP no.

Introducción

Page 7: Factorial - Universidad de Córdoba ·  · 2009-02-16ANÁLISIS FACTORIAL 1. Introducción 2. Examen de la matriz de correlación 3. Extracción de los factores 4. Rotación de los

Pasos del AF.

1. Calcular y examinar la matriz de correlaciones entre todas las variables.

2. Extracción de los factores necesarios para representar los datos.

3. Rotación de los factores con objeto de facilitar su interpretación.

4. Calcular las puntuaciones factoriales de cada individuo.

Introducción

Page 8: Factorial - Universidad de Córdoba ·  · 2009-02-16ANÁLISIS FACTORIAL 1. Introducción 2. Examen de la matriz de correlación 3. Extracción de los factores 4. Rotación de los

Examen de la matriz.

Examen de la matriz

Correlations

NHT NVAC UTHT --------------------------------------------------------------------------------NHT 0,4957 0,2334 ( 12) ( 12) 0,1013 0,4654

NVAC 0,4957 0,4368 ( 12) ( 12) 0,1013 0,1556

UTHT 0,2334 0,4368 ( 12) ( 12) 0,4654 0,1556

RN 0,3642 -0,4641 -0,1814 ( 12) ( 12) ( 12) 0,2444 0,1285 0,5725 --------------------------------------------------------------------------------

RN

RN ------------------------------------- 0,3642 ( 12) 0,2444

-0,4641 ( 12) 0,1285

-0,1814 ( 12) 0,5725

Page 9: Factorial - Universidad de Córdoba ·  · 2009-02-16ANÁLISIS FACTORIAL 1. Introducción 2. Examen de la matriz de correlación 3. Extracción de los factores 4. Rotación de los

- Determinante de la matriz de correlaciones (es un escalar o polinomio, que resulta de obtener todos los productos posibles de una matriz):

- muy bajo: altas intercorrelaciones

- cero: algunas de las variables son linealmente dependientes

- alto: altas correlaciones

- Test de Esfericidad de Bartlett. Comprueba que la matriz de correlaciones se ajuste a la matriz identidad (I), es decir ausencia de correlación significativa entre las variables, es decir, que el determinante de la matriz de correlaciones es 1.

Examen de la matriz

Page 10: Factorial - Universidad de Córdoba ·  · 2009-02-16ANÁLISIS FACTORIAL 1. Introducción 2. Examen de la matriz de correlación 3. Extracción de los factores 4. Rotación de los

n =tamaño muestral

v =número de variables

R =matriz de correlaciones

Si se acepta la hipótesis nula (p>0.05) significa que las variables no están intercorrelacionadas. Es muy útil cuando el tamaño

muestral es pequeño.

Examen de la matriz

Page 11: Factorial - Universidad de Córdoba ·  · 2009-02-16ANÁLISIS FACTORIAL 1. Introducción 2. Examen de la matriz de correlación 3. Extracción de los factores 4. Rotación de los

- Índice KMO de Kaiser-Meyer-Olkin. Valores bajos del índice KMO desaconsejan la utilización de Análisis Factorial

rij= correlación simple aij= correlación parcial

según Kaiser:

1 >= KMO >= 0.9 muy bueno

0.9 >= KMO >= 0.8 meritorio

0.8 >= KMO >= 0.7 mediano

0.7 >= KMO >= 0.6 mediocre

0.6 >= KMO > 0.5 bajo

KMO <= 0.5 inaceptable

Examen de la matriz

Page 12: Factorial - Universidad de Córdoba ·  · 2009-02-16ANÁLISIS FACTORIAL 1. Introducción 2. Examen de la matriz de correlación 3. Extracción de los factores 4. Rotación de los

- Correlación Anti-imagen: El negativo del coeficiente de correlación parcial. Deberá haber pocos coeficientes altos para que AF sea razonable.

- Correlación Múltiple: Deberá ser alto.

- Medida de Adecuación de la Muestra (MSA): Valores bajos desaconsejan AF.

rij= correlación simple aij= correlación parcial

Examen de la matriz

Page 13: Factorial - Universidad de Córdoba ·  · 2009-02-16ANÁLISIS FACTORIAL 1. Introducción 2. Examen de la matriz de correlación 3. Extracción de los factores 4. Rotación de los

Extracción de los factores. - A partir de una matriz de correlaciones, el AF extrae otra matriz

que reproduce la primera de forma más sencilla.

- Esta nueva matriz se denomina matriz factorial:1 2

1 P11 P21

2 P12 P22

3 P13 P23

4 P14 P24

5 P15 P25

6 P16 P26

- Pij pueden interpretarse como índices de correlación entre el factor i y la variable j, aunque estrictamente sólo son correlaciones cuando los factores no están correlacionados entre sí, es decir, son ortogonales.

- Estos coeficientes reciben el nombre de pesos, cargas, ponderaciones o saturaciones factoriales, y lo ideal es que cada variable cargue alto en un factor y bajo en los demás.

Extracción de los factores

Page 14: Factorial - Universidad de Córdoba ·  · 2009-02-16ANÁLISIS FACTORIAL 1. Introducción 2. Examen de la matriz de correlación 3. Extracción de los factores 4. Rotación de los

Con Statgrafics: Extracción de los factores

Factor Loading Matrix Before Rotation

Factor Factor 1 2 ------------ ------------ NHT 0,494032 0,515909 NHT_NHP -0,0866254 0,843973 NVAC 0,825778 0,342145 TREP 0,739585 -0,0828711 TMORT -0,718349 0,561025

EstimatedVariable Communality-------------------------NHT 0,51023 NHT_NHP 0,719794 NVAC 0,798972 TREP 0,553853 TMORT 0,830774 -------------------------

Page 15: Factorial - Universidad de Córdoba ·  · 2009-02-16ANÁLISIS FACTORIAL 1. Introducción 2. Examen de la matriz de correlación 3. Extracción de los factores 4. Rotación de los

Métodos de extracción.- CP. El análisis explora toda la varianza de cada variable: la común,

la específica y la debida a errores de observación.

- Recomendable para reducción de datos

- Recomendable en conjuntos con varianza común elevada

- Otros (clásicos). El análisis explora sólo la varianza común de cada variable.

- Recomendable en AF confirmatorio

- Recomendable cuando las puntuaciones factoriales no son importantes (no van a usarse)

Extracción de los factores

Page 16: Factorial - Universidad de Córdoba ·  · 2009-02-16ANÁLISIS FACTORIAL 1. Introducción 2. Examen de la matriz de correlación 3. Extracción de los factores 4. Rotación de los

Comunalidad.- Proporción de la varianza explicada por los factores comunes

en una variable.

- h2: suma de los pesos factoriales al cuadrado en cada una de las filas.

Extracción de los factores

Factor Loading Matrix Before Rotation

Factor Factor 1 2 ------------ ------------ NHT 0,494032 0,515909 NHT_NHP -0,0866254 0,843973 NVAC 0,825778 0,342145 TREP 0,739585 -0,0828711 TMORT -0,718349 0,561025

EstimatedVariable Communality-------------------------NHT 0,51023 NHT_NHP 0,719794 NVAC 0,798972 TREP 0,553853 TMORT 0,830774 -------------------------

Page 17: Factorial - Universidad de Córdoba ·  · 2009-02-16ANÁLISIS FACTORIAL 1. Introducción 2. Examen de la matriz de correlación 3. Extracción de los factores 4. Rotación de los

- El AF comienza sus cálculos a partir de lo que se conoce como matriz reducida compuesta por los coeficientes de correlación entre las variables y con las comunalidades en la diagonal.

- Como la comunalidad no se puede saber hasta que se conocen los factores, este resulta ser uno de los problemas del AF.

- Si se usa CP, como no suponemos la existencia de ningún factor común la comunalidad toma como valor inicial 1.

- En el método clásico:

- Estimando la comunalidad por la mayor correlación en la fila i-ésima de la matriz de correlaciones.

- Estimando la comunalidad por el cuadrado del coeficiente de correlación múltiple entre x y las demás variables (es el que da el ordenador por defecto).

- El promedio de los coeficientes de correlación de una variable con todas las demás.

- Calculando a partir de los dos coeficientes de correlación mayores de esa variable

Extracción de los factores

Page 18: Factorial - Universidad de Córdoba ·  · 2009-02-16ANÁLISIS FACTORIAL 1. Introducción 2. Examen de la matriz de correlación 3. Extracción de los factores 4. Rotación de los

Autovalores.- El cuadrado de una carga factorial indica la proporción de la

varianza explicada por un factor en una variable particular.

- La suma de los cuadrados de los pesos de las columnas se denominan autovalores e indica la cantidad total de varianza que explica ese factor para las variables consideradas como grupo.

- Las cargas factoriales pueden tener como valor máximo 1, por tanto el valor máximo que puede alcanzar el autovalor es igual al número de variables.

Extracción de los factores

Factor Analysis----------------------------------------------- Factor Percent of Cumulative Number Eigenvalue Variance Percentage 1 1,99649 39,930 39,930 2 1,41713 28,343 68,272 3 0,948198 18,964 87,236 4 0,368793 7,376 94,612 5 0,269385 5,388 100,000-----------------------------------------------

Page 19: Factorial - Universidad de Córdoba ·  · 2009-02-16ANÁLISIS FACTORIAL 1. Introducción 2. Examen de la matriz de correlación 3. Extracción de los factores 4. Rotación de los

Factores a extraer.- Autovalores superiores a la unidad.

- Gráfico de sedimentación.

- Contraste de Barlett (similar al de raíces no retenidas de CP).

- Método MAP (Minimum Average Partial). Los factores retenidos deben tener al menos dos variables con pesos altos en ellos.

- Calcular el promedio de las correlaciones parciales al cuadrado después de que cada uno de los factores ha sido parcializado.

- Cuando el promedio alcanza un mínimo no se extraen más componentes.

Extracción de los factores

Page 20: Factorial - Universidad de Córdoba ·  · 2009-02-16ANÁLISIS FACTORIAL 1. Introducción 2. Examen de la matriz de correlación 3. Extracción de los factores 4. Rotación de los

Factores a extraer.- Análisis Paralelo:

- A nivel poblacional los autovalores de una matriz de correlaciones para variables no correlacionadas tomarían valor 1.

- Cuando se generan matrices muestrales basadas en esa matriz poblacional por fluctuaciones debidas al azar los autovalores excederán levemente de 1 y los últimos estarán ligeramente por debajo de 1.

- Se comparan los autovalores con los obtenidos a partir de una matriz de variables no correlacionadas basada en el mismo número de variables que los datos empíricos y en el mismo tamaño de muestra. Los componentes empíricos con autovalores superiores a los de la matriz son retenidos.

Extracción de los factores

Page 21: Factorial - Universidad de Córdoba ·  · 2009-02-16ANÁLISIS FACTORIAL 1. Introducción 2. Examen de la matriz de correlación 3. Extracción de los factores 4. Rotación de los

- La matriz factorial indica la relación entre los factores y las variables. Sin embargo, muchas veces resulta difícil la interpretación de los factores:

rotación de los factores

Factor Loading Matrix Before Rotation

Factor Factor 1 2 ------------ ------------ NHT 0,494032 0,515909 NHT_NHP -0,0866254 0,843973 NVAC 0,825778 0,342145 TREP 0,739585 -0,0828711 TMORT -0,718349 0,561025

EstimatedVariable Communality-------------------------NHT 0,51023 NHT_NHP 0,719794 NVAC 0,798972 TREP 0,553853 TMORT 0,830774 -------------------------

Page 22: Factorial - Universidad de Córdoba ·  · 2009-02-16ANÁLISIS FACTORIAL 1. Introducción 2. Examen de la matriz de correlación 3. Extracción de los factores 4. Rotación de los

- Para facilitar la interpretación se realizan lo que se denominan rotaciones factoriales.

- La rotación factorial pretende seleccionar la solución más sencilla e interpretable.

- Consiste en hacer girar los ejes de coordenadas, que representan a los factores, hasta conseguir que se aproxime al máximo a las variables en que están saturados.

- La saturación de factores transforma la matriz factorial inicial en otra denominada matriz factorial rotada, de más fácil interpretación.

- La matriz factorial rotada es una combinación lineal de la primera y explica la misma varianza.

- Las comunalidades no se alteran, sin embargo, cambia la varianza explicada por cada factor.

rotación de los factores

Page 23: Factorial - Universidad de Córdoba ·  · 2009-02-16ANÁLISIS FACTORIAL 1. Introducción 2. Examen de la matriz de correlación 3. Extracción de los factores 4. Rotación de los

- La rotación intenta aproximarla al principio de estructura simple (Thurstone, 1935), con las siguientes características:

- Cada factor debe tener pocos pesos altos y los otros próximos a 0.

- Cada variable no debe estar saturada más que en un factor.

- No deben existir factores con la misma distribución, es decir, los factores distintos deben presentar distribuciones de cargas altas y bajas distintas.

rotación de los factores

Page 24: Factorial - Universidad de Córdoba ·  · 2009-02-16ANÁLISIS FACTORIAL 1. Introducción 2. Examen de la matriz de correlación 3. Extracción de los factores 4. Rotación de los

- Rotación ortogonal (Varimax, Equamax, Cuartimax).

- Rotaciones perpendiculares de los ejes (factores).

- Maximiza la varianza explicada.

- Rotación oblicua (Oblimin).

- Es más realista.

- Suele ofrecer resultados más claros (según algunos autores).

- La matriz factorial no rotada se convierte en dos matrices diferentes: la matriz de ponderaciones (que es la que se utilizaen la interpretación) y la matriz de correlaciones entre factores y variables. También obtendremos otra matriz de correlaciones entre factores.

rotación de los factores

Page 25: Factorial - Universidad de Córdoba ·  · 2009-02-16ANÁLISIS FACTORIAL 1. Introducción 2. Examen de la matriz de correlación 3. Extracción de los factores 4. Rotación de los

rotación de los factores

Factor Loading Matrix Before Rotation

Factor Factor 1 2 ------------ ------------ NHT 0,494032 0,515909 NHT_NHP -0,0866254 0,843973 NVAC 0,825778 0,342145 TREP 0,739585 -0,0828711 TMORT -0,718349 0,561025

Factor Loading Matrix After Varimax Rotation

Factor Factor 1 2 ------------ ------------ NHT 0,689469 0,186714 NHT_NHP 0,361608 0,767485 NVAC 0,883843 -0,133393 TREP 0,59057 -0,452859 TMORT -0,325485 0,851371

Page 26: Factorial - Universidad de Córdoba ·  · 2009-02-16ANÁLISIS FACTORIAL 1. Introducción 2. Examen de la matriz de correlación 3. Extracción de los factores 4. Rotación de los

- Juega un papel preponderante el conocimiento del investigador.

- Proceso de interpretación:

- Ordenar la matriz rotada de forma que las variables con saturaciones altas en un factor aparezcan juntas.

- Estudiar la composición de las saturaciones factoriales significativas de cada factor.

- Intentar dar nombre a los factores.

- Deberemos ser tanto más exigentes si:

- Menor sea el tamaño muestral

- Menos variables se incluyan en el factorial

- El factor analizado sea de los últimos extraídos

interpretación de los factores

Page 27: Factorial - Universidad de Córdoba ·  · 2009-02-16ANÁLISIS FACTORIAL 1. Introducción 2. Examen de la matriz de correlación 3. Extracción de los factores 4. Rotación de los

- Si el método de extracción ha sido el clásico, sólo se podrán hacer estimaciones.

- Si ha sido CP, el cálculo de las puntuaciones factoriales se realiza a partir de la matriz factorial rotada y se basa en el modelo de la regresión múltiple (idem CP) :

Fij= en la puntuación factorial del individuo j en el factor i

Pil es la ponderación factorial de la variable l en el factor i

Zl son las puntuaciones del sujeto con cada variable.

Puntuaciones factoriales