2. ANÁLISIS DE CORRESPONDENCIAS SIMPLESvalentin/ad3d/anadat/teoria_web/simposio... ·...

25
Simposio de Estadística – 2001 i Pardo C.E. y Cabarcas G. Métodos estadísticos multivariados en investigación social 2. ANÁLISIS DE CORRESPONDENCIAS SIMPLES .....................................................................31 2.1. Dominio de aplicación ................................................................................................................31 2.2. Fundamentos del método ............................................................................................................32 2.2.1. Tabla de frecuencias relativas ............................................................................................32 2.2.2. Tablas de perfiles fila y columna .......................................................................................33 2.3. Nubes de perfiles fila y columna ................................................................................................35 2.3.1. La distancia ji-cuadrado entre perfiles ...............................................................................36 2.3.2. Centro de gravedad de la nube de perfiles fila (en R p ) .......................................................37 2.3.3. Inercia de la nube de puntos ...............................................................................................37 2.4. Solución del análisis de correspondencias simples - ACS..........................................................38 2.5. Relaciones cuasi-bibaricentricas .................................................................................................39 2.6. Proyección de elementos suplementarios ...................................................................................41 2.7. Ayudas a la interpretación ..........................................................................................................41 2.7.1. Contribución absoluta del punto i en el eje α, ca α (i)..........................................................42 2.7.2. Contribución relativa del eje α a la posición de un punto i, cr α (i) .....................................42 2.8. Un ejemplo de aplicación: estudio de la situación regional de la educación media en Colombia (1997-1998). ............................................................................................................................................43 2.8.1. Presentación .......................................................................................................................43 2.8.2. Análisis de tablas y gráficos...............................................................................................43 2.8.3. Conclusiones. .....................................................................................................................46 2.9. Ejercicio: Estudio de la situación regional de la educación media en Colombia (1997-1998). Desagregando educación oficial y educación privada en cada departamento. ........................................49 2.9.1. Presentación. ......................................................................................................................49 2.9.2. Guía para el análisis. ..........................................................................................................49 TABLAS Y GRAFICOS Tabla 2-1: Tabla de contingencia: razones x método ...................................................................................31 Tabla 2-2: tabla de frecuencias relativas (%) ...............................................................................................32 Tabla 2-3: perfiles fila ..................................................................................................................................34 Tabla 2-4: perfiles columna..........................................................................................................................34 Gráfico 2-1: distancia jicuadrado .................................................................................................................36 Gráfico 2-2: primer plano factorial con razones de abandono .....................................................................38 Gráfico 2-3: primer plano factorial con métodos anticonceptivos ...............................................................38 Tabla 2-5: Resultados del ejemplo razones x métodos ................................................................................40 Gráfico 2-4: representación simultánea para el ejemplo razones x métodos ...............................................41 Gráfico 2-5: coseno cuadrado ......................................................................................................................42

Transcript of 2. ANÁLISIS DE CORRESPONDENCIAS SIMPLESvalentin/ad3d/anadat/teoria_web/simposio... ·...

Page 1: 2. ANÁLISIS DE CORRESPONDENCIAS SIMPLESvalentin/ad3d/anadat/teoria_web/simposio... · 2011-01-21 · El análisis de correspondencias simples es el método factorial apropiado para

Simposio de Estadística – 2001 i

Pardo C.E. y Cabarcas G. Métodos estadísticos multivariados en investigación social

2. ANÁLISIS DE CORRESPONDENCIAS SIMPLES .....................................................................31

2.1. Dominio de aplicación ................................................................................................................31

2.2. Fundamentos del método............................................................................................................32

2.2.1. Tabla de frecuencias relativas ............................................................................................32

2.2.2. Tablas de perfiles fila y columna .......................................................................................33

2.3. Nubes de perfiles fila y columna ................................................................................................35

2.3.1. La distancia ji-cuadrado entre perfiles ...............................................................................36

2.3.2. Centro de gravedad de la nube de perfiles fila (en Rp).......................................................37

2.3.3. Inercia de la nube de puntos...............................................................................................37

2.4. Solución del análisis de correspondencias simples - ACS..........................................................38

2.5. Relaciones cuasi-bibaricentricas.................................................................................................39

2.6. Proyección de elementos suplementarios ...................................................................................41

2.7. Ayudas a la interpretación ..........................................................................................................41

2.7.1. Contribución absoluta del punto i en el eje α, caα(i)..........................................................42

2.7.2. Contribución relativa del eje α a la posición de un punto i, crα(i) .....................................42

2.8. Un ejemplo de aplicación: estudio de la situación regional de la educación media en Colombia

(1997-1998). ............................................................................................................................................43

2.8.1. Presentación .......................................................................................................................43

2.8.2. Análisis de tablas y gráficos...............................................................................................43

2.8.3. Conclusiones. .....................................................................................................................46

2.9. Ejercicio: Estudio de la situación regional de la educación media en Colombia (1997-1998).

Desagregando educación oficial y educación privada en cada departamento. ........................................49

2.9.1. Presentación. ......................................................................................................................49

2.9.2. Guía para el análisis. ..........................................................................................................49

TABLAS Y GRAFICOS

Tabla 2-1: Tabla de contingencia: razones x método...................................................................................31

Tabla 2-2: tabla de frecuencias relativas (%) ...............................................................................................32

Tabla 2-3: perfiles fila ..................................................................................................................................34

Tabla 2-4: perfiles columna..........................................................................................................................34

Gráfico 2-1: distancia jicuadrado .................................................................................................................36

Gráfico 2-2: primer plano factorial con razones de abandono .....................................................................38

Gráfico 2-3: primer plano factorial con métodos anticonceptivos ...............................................................38

Tabla 2-5: Resultados del ejemplo razones x métodos ................................................................................40

Gráfico 2-4: representación simultánea para el ejemplo razones x métodos ...............................................41

Gráfico 2-5: coseno cuadrado ......................................................................................................................42

Page 2: 2. ANÁLISIS DE CORRESPONDENCIAS SIMPLESvalentin/ad3d/anadat/teoria_web/simposio... · 2011-01-21 · El análisis de correspondencias simples es el método factorial apropiado para

Simposio de Estadística – 2001 ii

Pardo C.E. y Cabarcas G. Métodos estadísticos multivariados en investigación social

Tabla 2-6: Clasificación de los planteles de educación media por departamentos. Según resultados

obtenidos por los estudiantes de grado 11 en los exámenes de Estado. Agosto 1997 y Marzo 1998 ......... 44

Tabla 2-7: Histograma de los 4 primeros valores propios.......................................................................... 44

Tabla 2-8: coordenadas, contribuciones y cosenos cuadrados .................................................................... 45

Gráfico 2-6: Primer Plano Factorial. Proyección conjunta de los perfiles filas y los perfiles columnas.... 46

Gráfico 2-7: Agrupamiento aproximado de los Departamentos................................................................. 46

Gráfico 2-8: Perfiles de los Departamentos Reordenados.......................................................................... 48

Tabla 2-9: Departamentos (Educación Oficial – Educación Privada) contra Categoría ............................. 51

Tabla 2-10: Resultados del ejercicio ........................................................................................................... 52

Gráfico 2-9: Proyección de los Puntos-Departamentos sobre el primer plano factorial.............................. 53

Gráfico 2-10: Proyección conjunta de los puntos-departamentos y los puntos-categorías sobre el primer

plano factorial.............................................................................................................................................. 53

Page 3: 2. ANÁLISIS DE CORRESPONDENCIAS SIMPLESvalentin/ad3d/anadat/teoria_web/simposio... · 2011-01-21 · El análisis de correspondencias simples es el método factorial apropiado para

Simposio de Estadística – 2001 31

Pardo C.E. y Cabarcas G. Métodos estadísticos multivariados en investigación social

2. ANÁLISIS DE CORRESPONDENCIAS SIMPLES

2.1. Dominio de aplicación

El análisis de correspondencias simples es el método factorial apropiado para la lectura de tablas de

contingencia y se extiende a otras tablas de frecuencia. El ejemplo de aplicación es una tabla de

contingencia que cruza los departamentos de Colombia con la calificación de sus colegios (instituciones

de enseñanza secundaria, Tabla 2-6).. El ejercicio que se propone también corresponde a la clasificación

de planteles por parte del icfes, pero en este caso en cada departamento se han separado los planteles de

educación oficial de los privados (Tabla 2-9).

Una tabla de contingencia cruza dos variables cualitativas. En las filas se representan las modalidades de

una variable y en las columnas la de la otra variable. El subíndice i denota las filas y el subíndice j las

columnas. Cada celda (i,j) de la tabla contiene el número de individuos (unidades estadísticas) que

asumieron simultáneamente las categorías o modalidades i y j. Al sumar sobre una fila se obtiene el total

de individuos que asumieron esa modalidad fila y haciéndolo para todas las filas de obtiene una columna

que es la marginal de la variable representada en las filas. El mismo proceso se puede hacer para las

columnas para obtener la marginal de la variable representada en las columnas.

Para ilustrar tomemos un ejemplo reducido: a una muestra de 4402 mujeres que abandonaron el último

método anticonceptivo que usaban regularmente, se les preguntó las razones para hacerlo. Para este

ejemplo se agruparon los métodos en tres modalidades: métodos fuertes (píldora, diu e inyección), otros

(vaginales, abstinencia periódica, retiro y otros menos usados) y condón. Estos se etiquetan en la tabla

como FUER, OTRO y COND, respectivamente. Las razones de abandono se agruparon en cuatro

modalidades: EMBA, quedó embarazada o busca un método más seguro; DEEM, desea embarazo, tiene

relaciones poco frecuentes, por creencias fatalistas y otros; NONE, no necesita o no tiene acceso; SALU,

problemas de salud, efectos secundarios o costo.

La tabla de contingencia que cruza estas dos variables, métodos anticonceptivos y razones para

abandonarlos, es la Tabla 2-1, en la cual aparecen también las marginales y el total. La última columna

representa la repartición de las 4402 mujeres entre las cuatro causas por las que abandonaron el último

método anticonceptivo que venían usando, por ejemplo, 1157 lo hicieron por razones de salud o efectos

secundarios. La última fila representa la distribución de las mujeres entre las tres clases de métodos

anticonceptivos: 2908 usaban métodos fuertes, 1242 otros métodos y 252 condón. Cualquier número

interior de la tabla representa el número de mujeres que usaban el método indicado por la columna y la

razón indicada por la fila. Por ejemplo 1106 mujeres usaban métodos fuertes y los abandonaron por

razones de salud.

Tabla 2-1: Tabla de contingencia: razones x método

FUER OTRO COND Tot.fila

EMBA 431 632 71 1134

DEEM 1166 425 92 1683

NONE 205 142 81 428

SALU 1106 43 8 1157

Tot.columna 2908 1242 252 4402

Conviene tener una notación generalizada para cualquier tabla de contingencia: sea K la tabla de

contingencia, k el número total de individuos, ki. la marginal de la fila i, k.j la marginal de la columna j.

Page 4: 2. ANÁLISIS DE CORRESPONDENCIAS SIMPLESvalentin/ad3d/anadat/teoria_web/simposio... · 2011-01-21 · El análisis de correspondencias simples es el método factorial apropiado para

Simposio de Estadística – 2001 32

Pardo C.E. y Cabarcas G. Métodos estadísticos multivariados en investigación social

∑ ∑∑∑

=

= ===

=

=

===→

=→

=

n

i

ijj

n

i

p

j

ji

p

j

ij

n

i

pj

p

j

iji

n

i

npnjn

ij

pj

kk

kkkkkkkk

kk

k

k

k

kkk

k

kkk

K

1

1 111

1

1

1

1

1111

.

.......

.

.

.

.

LL

M

M

LL

MMM

LLLL

MMM

LL

En la Tabla 2-1: k21 =1166, k22 =425, k23 =92 y k2o =1166+425+92 =1683. Sumando la última columna o

la ultima fila se obtiene el total de mujeres de la muestra: k =4402.

2.2. Fundamentos del método

Lo que interesa en el análisis de una tabla de contingencia es el estudio de las asociaciones entre las

modalidades de las dos variables. Estas se pueden ver mediante la comparación de los distribuciones

condicionales (perfiles) de las modalidades fila por un lado y de las columnas por el otro. No es entonces

la tabla de contingencia la que se representa geométricamente sino dos tablas de perfiles en dos espacios

diferentes pero que están relacionados. Es decir que el método requiere de transformaciones de las tabla

de contingencia inicial.

2.2.1. Tabla de frecuencias relativas

Si la Tabla 2-1 se hubiera construido con una muestra de otro número de mujeres y suponiendo que las

reparticiones fueran exactamente las mismas, los números de la tabla serían todos diferentes a pesar de

tener la misma estructura de interrelaciones. Para eliminar este inconveniente basta dividir todas las celdas

de la tabla por el total, k =4402, con lo cual se obtiene una tabla de frecuencias relativas, la que se presenta

en la Tabla 2-2. Si se multiplican todos los números de la tabla por 100, se tiene la misma información

pero expresada en porcentajes.

Tabla 2-2: Frecuencias relativas razones x método (%)

FUER OTRO COND Tot.filaOCO EMBA 9.8 14.4 1.6 25.8

DEEM 26.5 9.7 2.1 38.2

NONE 4.7 3.2 1.8 9.7

SALU 25.1 1.0 0.2 26.3

Tot.col.OFI

66.1 28.2 5.7 100.0

El total de la tabla suma 100%, al interior de la tabla se tiene la distribución de frecuencias conjunta entre

las dos variables (métodos y razones). Por ejemplo el 3.2% del total de mujeres usaban otro método y lo

Page 5: 2. ANÁLISIS DE CORRESPONDENCIAS SIMPLESvalentin/ad3d/anadat/teoria_web/simposio... · 2011-01-21 · El análisis de correspondencias simples es el método factorial apropiado para

Simposio de Estadística – 2001 33

Pardo C.E. y Cabarcas G. Métodos estadísticos multivariados en investigación social

abandonaron porque no lo necesitaban; el 25.1% de las mujeres de la muestra, usaban métodos fuertes y

los abandonaron por razones de salud.

La última columna de la Tabla 2-2 es la distribución marginal de la variable razones: 25.8% de las mujeres

abandonaron el método que usaban (cualquiera) por que quedaron embarazadas o porque buscaban un

método más seguro; 38.2% por que deseaban embarazo; 9.7% porque no lo necesitaban y 26.3% por

razones de salud.

La última fila de la Tabla 2-2 es la distribución marginal de los métodos: de las mujeres de la muestra el

66.1% usaba métodos fuertes, el 28.2% otros métodos y el 5.5% usaba condón.

Una notación generalizada de una tabla de frecuencias, calculada a partir de una tabla de contingencias es

la siguiente:

∑ ∑∑∑

=

= ===

=

=

===→

=→

=

===

n

i

ijj

n

i

p

j

ji

p

j

ij

n

i

pj

p

j

iji

n

i

npnjn

ij

pj

j

j

i

i

ij

ij

ff

ffffff

ff

f

f

f

fff

f

fff

F

k

kf

k

kf

k

kf

1

1 111

1

1

1

1

1111

.

..11...

.

.

.

.

..,

..,

LL

M

M

LL

MMM

LLLL

MMM

LL

2.2.2. Tablas de perfiles fila y columna

La lectura interesante de la información contenida en una tabla de contingencia es la comparación entre

filas y entre columnas. En la tabla de frecuencias relativas las filas y las columnas están influenciadas por

el peso relativo de sus marginales. La comparación se facilita obteniendo las distribuciones condicionales

o perfiles de cada una de las filas y de cada una de las columnas. Para obtener la distribución condicional

de la fila i, se dividen todas las celdas de esa fila por el valor total de la fila. De manera análoga se

obtienen las condicionales de las columnas. Se llega entonces a dos tablas: una de perfiles fila y otra de

perfiles columna.

A partir de la Tabla 2-1 o de la Tabla 2-2 se obtienen la Tabla 2-3, de perfiles fila: por ejemplo para la fila

2, 26.5/38.2 = 0.6928 9.7/38.2= 0.2525 y 2.1/38.2 = 0.547 y expresados en porcentaje: 69.28, 25.25 y

5.47.

Page 6: 2. ANÁLISIS DE CORRESPONDENCIAS SIMPLESvalentin/ad3d/anadat/teoria_web/simposio... · 2011-01-21 · El análisis de correspondencias simples es el método factorial apropiado para

Simposio de Estadística – 2001 34

Pardo C.E. y Cabarcas G. Métodos estadísticos multivariados en investigación social

Tabla 2-3: Perfiles fila, razones de abandono según métodos

FUER OTRO COND Tot.fila

EMBA 38.01 55.73 6.26 100.00

DEEM 69.28 25.25 5.47 100.00

NONE 47.90 33.18 18.93 100.00

SALU 95.59 3.72 0.69 100.00

0.00 50.00 100.00

EMBA

DEEM

NONE

SALU

COND

OTRO

FUER

Tanto en la tabla como en gráfico se pueden comparar fácilmente los perfiles fila: el abandono del método

por embarazo o por buscar uno más seguro se da más en los otros métodos (58%), luego en los métodos

fuertes (38%) y finalmente en el condón (6%). Los abandonos por salud ocurren en los métodos fuertes

(96%). Los perfiles desea embarazo y no necesita son los más parecidos en su forma. En ambos los

métodos se ordenan según frecuencia así: lo métodos fuertes, en otros y en condón.

La Tabla 2-4 contiene los perfiles columna expresados en porcentaje, calculados a partir de la Tabla 2-1 o

de la Tabla 2-2, dividiendo la celda en cada columna por la marginal, por ejemplo para la columna 3:

1.6/5.7 = 0.2817 = 28.17%

2.1/5.7 = 0.3651 = 36.51%

1.8/5.7 = 0.3214 = 32.14%

0.2/5.7 = 0.0317 = 3.17%

Tabla 2-4: Perfiles columna, métodos según razone de abandono

FUER OTRO COND

EMBA 14.82 50.89 28.17

DEEM 40.10 34.22 36.51

NONE 7.05 11.43 32.14

SALU 38.03 3.46 3.17

Tot.col. 100.00 100.00 100.00

0.00

10.00

20.00

30.00

40.00

50.00

60.00

FUER OTRO COND

EMBA

DEEM

NONE

SALU

A partir de la Tabla 2-4 y su gráfico asociado se pueden comparar los tres perfiles columna: lo que

diferencia a los tres métodos son los abandonos por salud y por no necesidad, siendo más abandonado por

salud el grupo de métodos fuertes y por no necesidad el condón.

Page 7: 2. ANÁLISIS DE CORRESPONDENCIAS SIMPLESvalentin/ad3d/anadat/teoria_web/simposio... · 2011-01-21 · El análisis de correspondencias simples es el método factorial apropiado para

Simposio de Estadística – 2001 35

Pardo C.E. y Cabarcas G. Métodos estadísticos multivariados en investigación social

De los perfiles filas y columnas en conjunto se puede concluir principalmente que hay una

correspondencia entre los métodos fuertes y el abandono por salud y efectos secundarios. También se

puede observar una correspondencia entre los otros métodos y el abandono por embarazo y por buscar un

método más seguro.

En términos generalizados los perfiles se pueden representar de la siguiente forma, si se obtienen a partir

de la tabla de frecuencias relativas:

perfiles filaf

fperfiles columna

f

f

ij

i

ij

j

..

. ..

. . ..

L L L

L L

L L L

M M M

M M

M M M

1

1

1

1 1 1

En el análisis de correspondencias simples (ACS) se busca una representación más adecuada para analizar

simultáneamente los perfiles fila y columna obtenidos a partir de una tabla de contingencia. Cuando se

tienen tablas de contingencia de gran tamaño es muy difícil obtener una síntesis apropiada de forma como

se hizo en el ejemplo. Para el ACS se parte de la representación de los perfiles fila en un espacio

multidimensional, donde las columnas son los ejes y simétricamente de otra nube de perfiles columna,

donde las líneas son los ejes. Para ello se requiere del uso de una distancia apropiada: la distancia ji-

cuadrado entre distribuciones.

2.3. Nubes de perfiles fila y columna

En el ejemplo se tienen cuatro puntos fila que se pueden representar haciendo corresponder a cada una de

las tres columnas un eje, es decir que cada punto necesita tres coordenadas para poderlo ubicar en el

espacio de tres dimensiones. Para cada una de las filas las coordenadas se pueden leer en la Tabla 2-3. A

cada punto se le asocia como peso la marginal de la fila que representa y que se puede leer en la Tabla 2-2.

Las coordenada de los puntos fila y sus pesos se transcriben a continuación:

Coordenadas Pesos EMBA: [38.01 55.73 6.26] 0.258

DEEM: [69.28 25.25 5.47] 0.382

NONE: [47.90 33.18 18.93] 0.097

SALU: [95.59 3.72 0.69] 0.263

La representación de estos cuatro perfiles se hace mediante 4 puntos en el espacio de tres dimensiones y

además a cada punto se le asocia una masa o peso que es igual a la marginal de la fila de la tabla de

frecuencias (última columna de la Tabla 2-2).

Pero la distancia que se utiliza no es la euclidiana convencional sino la distancia ji-cuadrado, la cual se

presenta más adelante.

Para los perfiles columna la situación en simétrica: hay tres puntos representados en un espacio de cuatro

dimensiones, FUER, OTRO, COND.

A continuación se hace la descripción de los perfiles en forma generalizada.

Nube de perfiles fila

En el espacio Rp se representan los n perfiles fila, dotados del peso pi = fi.

Page 8: 2. ANÁLISIS DE CORRESPONDENCIAS SIMPLESvalentin/ad3d/anadat/teoria_web/simposio... · 2011-01-21 · El análisis de correspondencias simples es el método factorial apropiado para

Simposio de Estadística – 2001 36

Pardo C.E. y Cabarcas G. Métodos estadísticos multivariados en investigación social

.......2,1,.....2,1,.

ii

i

ijfpconnipj

f

f==

=

Nube de perfiles columna

En el espacio Rn cada punto representa un perfil columna y esta dotado de un peso igual a la marginal la

respectiva columna.

jj

j

ijfpconpjni

f

f.......2,1,.....2,1,

.==

=

2.3.1. La distancia ji-cuadrado entre perfiles

La distancia ji-cuadrado entre dos perfiles fila i e i’ viene dada por:

d i if

f

f

f

fj

ij

i

ij

ij

p2

2

1

1( , )

. . .

′ = −

′=∑

Para el caso de dos líneas, esta distancia, es la suma de la diferencia de cada una de las respectivas

componentes de los dos perfiles, ponderadas por el inverso de las frecuencias marginales de las columnas

respectivas. Con este peso las diferencias se amplifican cuando se deben a columnas de baja frecuencia, es

decir tiende a destacar los casos raros. El Gráfico 2-1 se presenta para facilitar la comprensión de los

elementos de la distancia ji-cuadrado.

Gráfico 2-1: distancia jicuadrado

Perfil i:

Pesos de las columnas f.j

( )ji

ij

f

f

Perfil l:

( )jl

lj

f

f

(i )

(l)

(j)

.

En el ejemplo las frecuencias marginales de las columnas son: 0.661, 0.282 y 0.057. La distancia ji-

cuadrado entre la fila 1 y la fila 2 es:

(0.3801-0.6928)2 /0.661 + (0.5573-0.2525)

2 /0.282 + (0.0626-0.0547)

2 /0.057 =

0.09778129/0.661 + 0.09290304/0.282 + 0.00006241/0.057 =

0.1479 + 0.3294 + 0.0011 = 0.4784

Page 9: 2. ANÁLISIS DE CORRESPONDENCIAS SIMPLESvalentin/ad3d/anadat/teoria_web/simposio... · 2011-01-21 · El análisis de correspondencias simples es el método factorial apropiado para

Simposio de Estadística – 2001 37

Pardo C.E. y Cabarcas G. Métodos estadísticos multivariados en investigación social

De manera simétrica, la distancia entre perfiles columna es:

∑= ••

−=

n

i k

ik

j

ij

i f

f

f

f

fkjd

1

2

.

2 1),(

La distancia ji-cuadrado confiere al análisis de correspondencias dos propiedades muy útiles: la

equivalencia distribucional y las relaciones de transición.

La equivalencia distribucional de la distancia ji-cuadrado

Dos perfiles fila idénticos están representados por el mismo punto en Rp. Si se reemplazan los dos puntos

por un punto común, cuyo peso sea la suma de los pesos (fi. + fl.), entonces las distancias de los demás

puntos, tanto en Rp como en Rn

permanecen inalteradas. Igual resultado se obtiene para dos perfiles

idénticos en Rn.. En Crivisqui (1993) hay una descripción bastante pedagógica de esta propiedad y en

Lebart et al. (1995) se encuentra la demostración. Con la distancia ji-cuadrado los resultados son robustos

respecto a la determinación arbitraria del número de categorías filas y categorías columna. Esto permite

unir modalidades antes y después de un análisis de correspondencias. Antes, cuando hay modalidades de

baja frecuencia que se pueden asimilar a otra modalidad, por ejemplo muy bueno a bueno. Después, para

presentar los resultados del ACS con tablas reducidas, uniendo filas y columnas de perfiles parecidos.

2.3.2. Centro de gravedad de la nube de perfiles fila (en Rp)

Sea rg el vector de p componentes, centro de gravedad de la nube de perfiles fila, la componente j es:

j

n

i i

ij

i

i

ijn

i

ij ff

ff

f

fpg •

= ••

•=

=

=

= ∑∑

11

es decir que [ ]pj fffg •••=′ LLr

1

En el ejemplo el centro de gravedad es: (0.6606, 0.2821, 0.0572), que es la distribución marginal de la

variable que esta en columna, es decir la distribución de los métodos anticonceptivos usados por las

mujeres de la muestra. Esta es la distribución promedio con la cual se comparan las distribuciones

condicionales de las razones de abandono. Esta distribución se coloca en el centro de representación.

2.3.3. Inercia de la nube de puntos

La inercia de la nube de puntos respecto al centro de gravedad es:

( )( )

kff

fff

f

fff

ffgidpI

n

i

p

j ji

jiijn

i

p

j i

jiij

j

i

n

i

i

2

1 1

22

1 11

2 1,

χ=

−=

−== ∑∑∑ ∑∑

= == == oo

oo

o

oo

o

o

donde χ2 es la estadística ji-cuadrado, de la prueba de independencia, calculada para la tabla de

contingencia K y k es el número total de individuos en la tabla. Crivisqui (1993) ilustra el hecho de que la

nube de puntos perfiles es una hiperesfera en el caso de independencia en la tabla de contingencia. La

inercia es un índice de deformación de la nube y se puede descomponer en los diferentes ejes de la

representación.

Lo que se tiene hasta ahora son dos representaciones que contienen la información de la tabla de

contingencia: la nube de perfiles fila y la nube de perfiles columna, con puntos ponderados, centradas y

con una inercia asociada. Esta información es apta para llevar a cabo dos análisis de componentes

principales con ponderación. La solución tiene propiedades particulares derivadas de la propiedades de las

tablas de perfiles y de las propiedades de la distancia ji-cuadrado.

Page 10: 2. ANÁLISIS DE CORRESPONDENCIAS SIMPLESvalentin/ad3d/anadat/teoria_web/simposio... · 2011-01-21 · El análisis de correspondencias simples es el método factorial apropiado para

Simposio de Estadística – 2001 38

Pardo C.E. y Cabarcas G. Métodos estadísticos multivariados en investigación social

2.4. Solución del análisis de correspondencias simples - ACS

Encontrar el subespacio (plano cuando son dos dimensiones) que se aproxime lo mejor posible a la nube

de n puntos (perfiles fila i), dotados de los pesos fi., equivale a hacer un análisis de en componentes

principales sobre la tabla de los perfiles fila, cada uno ponderado por su frecuencia marginal y utilizando

la distancia ji-cuadrado entre perfiles.

Los planos factoriales de los individuos permiten comparar los perfiles fila entre sí y con el perfil marginal

(promedio). El perfil marginal esta ubicado en el centro de las gráficas y por lo tanto la ubicación de los

puntos perfiles indican el parecido (cerca) o la diferencia (lejos) de la distribución de la muestra o

población según las modalidades de la variable que está en columna.

El Gráfico 2-2 es el primer plano factorial de razones de abandono. Las razones de SALUD y

EMBARAZO tienen las distribuciones más opuestas. La razón DESEA EMBARAZO es la más parecida

a la distribución promedio de los métodos utilizados. En este caso la representación en el plano contiene

toda la información pues, para cada perfil fila (razones de abandono), se necesitan tres coordenadas

(método), pero como cada perfil suma uno, se pierde una dimensión: una de las coordenadas se puede

encontrar restando de uno las demás.

Gráfico 2-2: primer plano factorial con razones de abandono

De manera similar se obtiene la representación para la nube de perfiles columna: puntos perfiles columna,

ponderados por sus marginales y con la distancia ji-cuadrado (ponderación por el inverso de las

marginales fila). El Gráfico 2-3 presenta los puntos perfiles columna que representan las distribuciones de

los métodos anticonceptivos según sus razones de abandono. Las más opuestas son métodos fuertes y

otros métodos.

Page 11: 2. ANÁLISIS DE CORRESPONDENCIAS SIMPLESvalentin/ad3d/anadat/teoria_web/simposio... · 2011-01-21 · El análisis de correspondencias simples es el método factorial apropiado para

Simposio de Estadística – 2001 39

Pardo C.E. y Cabarcas G. Métodos estadísticos multivariados en investigación social

2.5. Relaciones cuasi-bibaricentricas

Los ejes factoriales de los análisis de las dos nubes de perfiles estas relacionadas puesto que provienen de

la misma tabla de contingencia. En Lebart et al. (1995) y otros textos se pueden ver las denominadas

relaciones entre los dos espacios. Las más importantes desde el punto de vista de la interpretación de las

gráficas son las denominadas relaciones cuasi-bibaricentricas, propiedad derivada de utilizar la distancia

ji-cuadrado.

Gráfico 2-3: primer plano factorial con métodos anticonceptivos

La coordenada sobre un eje factorial de una modalidad fila (perfil) se puede calcular así:

ψλ

ϕα

α

αi

ij

ij

p

j

f

f=

=∑

1

1 o

Esta fórmula significa que la coordenada de un perfil fila es igual al promedio aritmético de las

coordenadas de los perfiles columna pero cada una ponderada por el valor de la coordenada del perfil fila

que se está considerando y además dilatado por el inverso del la raíz del valor propio.

Para entender mejor esta propiedad se procede a calcular la coordenada de EMBA (-0.60) en función de

las coordenadas de métodos:

( )

60.0)275.0(1848.2)0326.03678.01254.0(1848.2

.52)0.0626x(-0 66).5573x(-0.0 30.3801x0.32095.0

11,

−=−=−−=

++=EMBAψ

Las ponderaciones se toman de la Tabla 2-3, el valor propio y las coordenadas de la Tabla 2-5. La media

ponderada es –0.275, este es un baricentro de las coordenadas de las modalidades columna. Como la

Page 12: 2. ANÁLISIS DE CORRESPONDENCIAS SIMPLESvalentin/ad3d/anadat/teoria_web/simposio... · 2011-01-21 · El análisis de correspondencias simples es el método factorial apropiado para

Simposio de Estadística – 2001 40

Pardo C.E. y Cabarcas G. Métodos estadísticos multivariados en investigación social

modalidad ‘otros métodos’ es la de mayor frecuencia (55.73%) en el perfil de embarazo, ‘otros métodos’

va a atraer a la modalidad ‘embarazo’ y gráficamente se va a observar una cercanía, dando cuenta de este

hecho. Desde luego hay una dilatación (alejamiento) de la coordenada de 2.1848, la cual generalmente

hace destacar esa asociación. La dilatación (por la que se introduce la palabra cuasi) es la que permite la

representación simultánea de las proyecciones de los dos espacios.(Gráfico 2-4).

De manera simétrica, la coordenada de un perfil columna se calcula como el promedio ponderado por su

perfil de las coordenadas de los perfiles propios y dilatada por el inverso de la raíz del valor propio:

αα

α ψλ

ϕ i

n

i j

ij

jf

f∑

=

=

1

1

o

Exceptuando el coeficiente 1 λ , la coordenada de un punto es el baricentro de los puntos de la otra

nube, con pesos iguales a los elementos del perfil. Haciendo la dilatación apropiada las dos nubes se

pueden representar simultáneamente sobre el mismo plano.

Tabla 2-5: Resultados del ejemplo razones x métodos

HISTOGRAMA DE LOS 2 PRIMEROS VALORES PROPIOS

+--------+------------+----------+----------+------------------------------------------+

| NUMERO | VALOR | PORCENTA.| PORCENTA.| |

| | PROPIO | | ACUMU. | |

+--------+------------+----------+----------+------------------------------------------+

| 1 | .2095 | 87.55 | 87.55 | **************************************** |

| 2 | .0298 | 12.45 | 100.00 | ***** |

+--------+------------+----------+----------+------------------------------------------+

COORDENADAS , CONTRIBUCIONES Y COSENOS CUADRADOS DE LAS FRECUENCIAS EN LOS EJES 1 A 2

+------------------------------------------+---------------+-------------+------------+

| FRECUENCIAS | COORDENADAS |CONTRIBUCIONE|COSENOS CUA.|

|------------------------------------------+---------------+-------------+------------|

| IDEN - ETIQUETA CORTA PESO R DIST | 1 2 | 1 2 | 1 2 |

+------------------------------------------+---------------+-------------+------------+

| FRECUENCIAS ACTIVAS

|

| fuer - Metodos fuertes 66.06 .11 | .33 .01 | 33.8 .2 | 1.00 .00 |

| otro - Otros metodos 28.21 .45 | -.66 .12 | 58.8 13.0 | .97 .03 |

| cond - Condon 5.72 .72 | -.52 -.67 | 7.4 86.9 | .38 .62 |

|------------------------------------------+---------------+-------------+------------|

COORDENADAS, CONTRIBUCIONES Y COSENOS CUADRADOS DE LOS INDIVIDUOS EN LOS EJES 1 A 2

+---------------------------------------+---------------+-------------+------------+

| INDIVIDUOS | COORDENADAS |CONTRIBUCIONE|COSENOS CUA.|

|---------------------------------------+---------------+-------------+------------|

| IDENTIFICADOR P.REL DIST. | 1 2 | 1 2 | 1 2 |

+---------------------------------------+---------------+-------------+------------+

| EMBA 25.76 .39 | -.60 .15 | 44.8 20.1 | .94 .06 |

| DEEM 38.23 .00 | .07 -.01 | .9 .1 | .98 .02 |

| NONE 9.72 .36 | -.35 -.49 | 5.7 78.1 | .34 .66 |

| SALU 26.28 .39 | .62 .04 | 48.5 1.7 | 1.00 .00 |

+---------------------------------------+---------------+-------------+------------+

La lectura simultánea apoyada en las relaciones cuasi-bibaricéntricas pone en evidencia las

correspondencias más destacadas entre las dos variables. En el Gráfico 2-4 se observa la asociación entre

las modalidades EMBARAZO y otro método, NO NECESITA y condón, SALUD y métodos fuertes. El

abandono de los métodos fuertes se debe a razones de SALUD y a DESEA EMBARAZO. Esto es

exactamente lo mismo que se puede leer fácilmente en las tablas y e histogramas de los perfiles (Tabla 2-3

Page 13: 2. ANÁLISIS DE CORRESPONDENCIAS SIMPLESvalentin/ad3d/anadat/teoria_web/simposio... · 2011-01-21 · El análisis de correspondencias simples es el método factorial apropiado para

Simposio de Estadística – 2001 41

Pardo C.E. y Cabarcas G. Métodos estadísticos multivariados en investigación social

y Tabla 2-4). Obviamente el método es útil en grandes tablas de contingencia en donde un observador se

puede perder en la gran cantidad de cifras.

Porqué SALUD está más alejada que la modalidad fuerte?. En la distribución de las mujeres que

abandonaron el método que usaban por razones de SALUD (ver Tabla 2-3) casi el 96% estaba usando

métodos fuertes. En cambio para el grupo que usaba métodos fuertes el 38% lo abandonaron por razones

de SALUD y el 40% porque deseaban quedar embarazadas, es decir que los métodos fuertes también están

atraídos por DEEM (ver Tabla 2-4).

Gráfico 2-4: representación simultánea para el ejemplo razones x métodos

2.6. Proyección de elementos suplementarios

Al igual que en ACP sobre los ejes factoriales se pueden proyectar filas y columnas que no hayan

participando en el análisis. Se hace mediante las relaciones cuasi-bibaricéntricas y por lo tanto se

interpreta de la misma forma, pero debe hacerse por cada modalidad ilustrativa con respecto a las

modalidades activas. No es apropiado interpretar modalidades ilustrativas entre sí pues no han participado

en la construcción de los ejes. Esto se ilustrará en los ejemplos de más adelante.

2.7. Ayudas a la interpretación

En un ACS las modalidades aparecen repartidas a ambos lados de los ejes, lo que conlleva a la lectura de

las contraposiciones más importantes entre modalidades. En el ejemplo de métodos x razones, en el eje

uno se contraponen los métodos ‘otros’ con ‘fuertes’ y las razones EMBARAZO con SALUD (ver

Gráfico 2-4). En una tabla de contingencia de gran tamaño se puede buscar las modalidades más

importantes sobre cada eje recurriendo a las denominadas contribuciones absolutas. En el ejemplo se leen

en la Tabla 2-5.

Page 14: 2. ANÁLISIS DE CORRESPONDENCIAS SIMPLESvalentin/ad3d/anadat/teoria_web/simposio... · 2011-01-21 · El análisis de correspondencias simples es el método factorial apropiado para

Simposio de Estadística – 2001 42

Pardo C.E. y Cabarcas G. Métodos estadísticos multivariados en investigación social

Las proyecciones sobre los ejes y sobre los planos factoriales serán muy ‘buenas’ para algunos puntos

pero también pueden ser de ‘mala’ calidad para otros puntos. Se requiere entonces de un índice que ponga

en evidencia este hecho, que se denomina coseno cuadrado o contribución relativa. Los cosenos

cuadrados para el ejemplo se pueden leer en la Tabla 2-5.

A continuación se presentan las expresiones de las contribuciones absolutas y relativas para las

modalidades fila. Las expresiones para las modalidades columna tienen la misma forma y la misma

interpretación.

2.7.1. Contribución absoluta del punto i en el eje αααα, caαααα(i)

( )ca if i i

αα

α

ψλ

= o

2

Es la proporción con que cada punto contribuye a la inercia del eje. Los puntos que tengan contribución

absoluta alta son los que fijan la posición del eje. La suma de las contribuciones es 1, por comodidad se

expresan en porcentaje. La contribución absoluta depende tanto del peso de la modalidad como del valor

de la proyección, y la combinación de estos dos valores da origen a distintas situaciones: una modalidad

no tan alejada del origen puede ser muy contributiva si tiene una frecuencia alta. No necesariamente los

puntos más alejados del origen son los más contributivos.

2.7.2. Contribución relativa del eje αααα a la posición de un punto i, crαααα(i)

( )( )Gid

icr i

,2

2

αα

ψ=

Estos valores son el cociente de las longitudes al cuadrado de la proyección sobre el eje, sobre la distancia

del punto al centro de gravedad (centro de la representación). Es el valor del coseno al cuadrado del

ángulo que forman las rectas que unen el origen con cada uno de los dos puntos (el punto perfil y su

proyección sobre el eje). El coseno cuadrado tiene valores entre 0 y 1 y la suma de los cosenos cuadrados

de un punto sobre cada uno de los ejes da uno, hechos estos que facilitan su interpretación. Un coseno

cuadrado cercano al 100% indica buena calidad de la proyección, es decir, buena representación de la

distancia original del punto al origen sobre un eje. Valores cercanos a 0 indican mala calidad de

representación y por lo tanto los puntos que los posean no deben leerse sobre ese eje (ver Gráfico 2-5). El

coseno cuadrado sobre un plano se obtiene sumando los cosenos cuadrados de los ejes que los conforman.

Gráfico 2-5: coseno cuadrado

G

Cos2α(i)≅0

α

i

Cos2α(i)≅1

G

i

α

i. bien representado sobre el eje α i. mal representado sobre el eje α

(Tomado de Lebart (1995))

Page 15: 2. ANÁLISIS DE CORRESPONDENCIAS SIMPLESvalentin/ad3d/anadat/teoria_web/simposio... · 2011-01-21 · El análisis de correspondencias simples es el método factorial apropiado para

Simposio de Estadística – 2001 43

Pardo C.E. y Cabarcas G. Métodos estadísticos multivariados en investigación social

2.8. Un ejemplo de aplicación: estudio de la situación regional de la educación

media en Colombia (1997-1998).

2.8.1. Presentación

Para este estudio se parte de información aportada por el ICFES. El instituto clasifica los planteles

educativos teniendo en cuenta los resultados obtenidos por los estudiantes que egresan de los mismos.

Cada colegio es clasificado en una de 7 categorías, desde Muy Inferior hasta Muy Superior. El criterio de

clasificación es el promedio de los puntajes obtenidos por sus egresados en la prueba que el Icfes aplica a

todos los egresados de la educación media. La Tabla 2-6 es una tabla de contingencia: cada celda contiene

el número de planteles clasificados en una categoría y departamento especificado. Es decir, en Antioquia

14 planteles fueron clasificados en la categoría Muy Superior, mientras que en Bolívar 20 fueron

clasificados en Alto.

Frente a esta tabla cabe preguntarse si la distribución de los planteles educativos en cuanto a su calidad es

aproximadamente igual para todos los departamentos, o si por el contrario, es posible encontrar tipologías

de departamentos, es decir, grupos de departamentos con una distribución similar entre ellos que los

diferencia, a su vez, de otros grupos de departamentos.

Después de una primera exploración se decidió eliminar los departamentos con una muy baja cobertura (se

restringió la tabla a aquellos departamentos cuyo número de planteles supera el 1 % del total nacional), al

departamento del Chocó por tener una distribución muy atípica, y juntar Bogotá y Cundinamarca en una

sola categoría.

Las preguntas más importantes son: Cuales son las distribuciones que se apartan del perfil promedio? Qué

tipologías de Departamentos podrían ser establecidas?.

Para responder a estos interrogantes una de las técnicas mas adecuadas es el Análisis de Correspondencia

Simples o Binarias. Se procederá a continuación a explicar como hacer dicho análisis en este caso

particular.

2.8.2. Análisis de tablas y gráficos.

Descomposición de la Inercia total.

Después de una primera exploración de la tabla usando el análisis de correspondencias se convino en

juntar las categorías extremas Muy Inferior e Inferior en una sola categoría que llamamos Infer, y Muy

Superior y Superior en una sola categoría Super. En consecuencia, solo quedaron cinco columnas, y por

esa razón, el histograma de valores propios solo muestra cuatro valores propios, de los cuales los dos

primeros recogen más del 91 % de la inercia total. Por esta razón, podemos concentrar la atención en el

análisis del primer plano factorial.

Page 16: 2. ANÁLISIS DE CORRESPONDENCIAS SIMPLESvalentin/ad3d/anadat/teoria_web/simposio... · 2011-01-21 · El análisis de correspondencias simples es el método factorial apropiado para

Simposio de Estadística – 2001 44

Pardo C.E. y Cabarcas G. Métodos estadísticos multivariados en investigación social

Tabla 2-6: Clasificación de los planteles de educación media por departamentos. Según resultados obtenidos por los estudiantes de grado 11 en los exámenes de Estado. Agosto 1997 y Marzo 1998

Departamento Muy

Superior

Superior

Alto

Medio

Bajo

Inferior Muy

Inferior

Total Amazonas 0 0 0 0 3 2 0 5

Antioquia 14 15 52 100 343 89 1 614

Arauca 0 0 3 12 12 3 0 30

Atlantico 8 13 26 42 183 130 1 403

Bolivar 5 4 20 42 130 75 0 276

Bogota 62 58 222 363 277 2 0 984

Boyaca 1 10 33 130 60 5 0 239

Caldas 2 10 14 61 91 23 0 201

Caqueta 0 0 1 10 32 12 0 55

Casanare 0 0 4 16 12 1 0 32

Cauca 3 3 13 50 60 37 0 166

Cesar 2 2 6 15 76 61 0 162

Cordoba 1 2 5 15 87 36 0 146

Cundinamarca 2 12 40 155 148 11 0 368

Choco 0 0 0 7 16 34 9 66

Guainia 0 0 0 1 1 0 0 2

Guaviare 0 0 0 1 3 0 0 4

Huila 3 3 13 69 56 12 0 156

La Guajira 1 2 1 8 42 30 1 85

Magdalena 0 2 6 18 76 78 1 181

Meta 0 2 14 44 57 11 0 128

Nariño 3 6 27 93 64 29 0 222

N. de Santander 4 5 24 69 106 16 0 224

Putumayo 0 0 2 10 17 2 0 31

Quindio 1 2 8 23 43 1 0 78

Risaralda 3 2 18 24 79 8 0 134

San Andres 0 0 0 3 4 4 0 11

Santander 9 12 41 113 116 11 0 302

Sucre 0 2 7 18 60 18 0 105

Tolima 2 3 11 82 140 28 0 266

Valle 13 24 61 131 275 91 0 595

Vaupes 0 0 0 1 1 1 0 3

Vichada 0 0 0 3 1 0 0 4

Total 139 194 672 1729 2671 861 13 6279

(Fuente: ICFES)

Tabla 2-7: Histograma de los 4 primeros valores propios

APRECIACION DE LA PRECISION DE LOS CALCULOS : TRAZA ANTES DE LA DIAGONALIZACION .................... 0.2235

SUMA DE LOS VALORES PROPIOS .......................... 0.2235

+--------+------------+----------+----------+----------------------------------------------------------------------------------+

| NUMERO | VALOR | PORCENTA.| PORCENTA.| |

| | PROPIO | | ACUMUL. | |

+--------+------------+----------+----------+----------------------------------------------------------------------------------+

| 1 | 0.1817 | 81.28 | 81.28 | ******************************************************************************** |

| 2 | 0.0239 | 10.70 | 91.98 | *********** |

| 3 | 0.0164 | 7.36 | 99.34 | ******** |

| 4 | 0.0015 | 0.66 | 100.00 | * |

+--------+------------+----------+----------+----------------------------------------------------------------------------------+

Page 17: 2. ANÁLISIS DE CORRESPONDENCIAS SIMPLESvalentin/ad3d/anadat/teoria_web/simposio... · 2011-01-21 · El análisis de correspondencias simples es el método factorial apropiado para

Simposio de Estadística – 2001 45

Pardo C.E. y Cabarcas G. Métodos estadísticos multivariados en investigación social

Análisis del primer plano factorial.

Proyección de los puntos perfiles columnas (categorías).

En el Gráfico 2-6 se puede observar que a lo largo del primer eje se enfrentan las categorías Infer y Bajo a

Alto, Medio y Super , sin embargo, al examinar las contribuciones y cosenos cuadrados en la Tabla 2-8

vemos que Bajo, con un peso relativo grande del 42.7% tiene una pequeña contribución a la inercia en el

primer eje. Esto significa que este perfil es muy cercano al perfil promedio; de otra parte, Super, con un

peso relativamente pequeño, es poco contributivo al primer eje, pero también es el más mal representado

en el primer plano factorial (suma de cosenos =.52) . De lo anterior se sigue que los perfiles que definen

el primer eje son Infer de un lado y Alto y Medio por el otro. De una manera similar se puede ver que el

segundo eje factorial enfrenta principalmente la categoría Infer a Bajo.

Proyección de los puntos perfiles filas (Departamentos).

Examinando conjuntamente el Gráfico 2-6 y la Tabla 2-8, que recoge las coordenadas, contribuciones y

cosenos cuadrados de los perfiles de los departamentos podemos decir que el primer eje factorial enfrenta

a departamentos como Magdalena, Atlántico, Cesar, Guajira en un extremo a Boyacá y Bog+Cund por el

otro. El segundo eje factorial enfrenta a los departamentos como Magdalena, Cauca, Nariño y Boyacá a

Antioquia, Risaralda y Quindío. Es de advertir que la nube de puntos de los departamentos tiende a formar

una especie de arco parabólico que tiene como foco al departamento del Cauca que parece aislado del

resto.

Tabla 2-8: Coordenadas, contribuciones y cosenos cuadrados

COORDENADAS, CONTRIBUCIONES DE LAS FRECUENCIAS SOBRE LOS EJES 1 A 4

FRECUENCIAS ACTIVAS

+------------------------------------------+-------------------------------+--------------------------+--------------------------+

| FRECUENCIAS | COORDENADAS | CONTRIBUCIONES | COSENOS CUADRADOS |

|------------------------------------------+-------------------------------+--------------------------+--------------------------|

| IDEN – ETIQUETA P.REL DISTO | 1 2 3 4 0 | 1 2 3 4 0 | 1 2 3 4 0 |

+------------------------------------------+-------------------------------+--------------------------+--------------------------+

| ALTO - Alto 10.89 0.25 | -0.44 -0.06 0.21 0.08 0.00 | 11.4 1.5 30.2 46.0 0.0 | 0.78 0.01 0.19 0.03 0.00 |

| MEDI - Medio 27.50 0.20 | -0.41 -0.11 -0.14 -0.01 0.00 | 25.8 13.2 32.1 1.3 0.0 | 0.85 0.06 0.10 0.00 0.00 |

| BAJO - Bajo 42.71 0.05 | 0.16 0.17 -0.01 0.00 0.00 | 5.8 51.0 0.5 0.0 0.0 | 0.46 0.53 0.00 0.00 0.00 |

| SUPE - Super 5.47 0.26 | -0.36 -0.07 0.33 -0.12 0.00 | 3.9 1.1 37.1 52.5 0.0 | 0.50 0.02 0.43 0.05 0.00 |

| INFE - Infer 13.43 0.78 | 0.85 -0.24 0.02 0.00 0.00 | 53.0 33.2 0.2 0.2 0.0 | 0.92 0.08 0.00 0.00 0.00 |

+------------------------------------------+-------------------------------+--------------------------+--------------------------+

COORDENADAS, CONTRIBUCIONES Y COSENOS CUADRADOS DE LOS INDIVIDUOS

EJES 1 A 4

+---------------------------------------+-------------------------------+--------------------------+--------------------------+

| INDIVIDUOS | COORDENADAS | CONTRIBUCIONES | COSENOS CUADRADOS |

|---------------------------------------+-------------------------------+--------------------------+--------------------------|

| IDENTIFICADOR P.REL DISTO | 1 2 3 4 0 | 1 2 3 4 0 | 1 2 3 4 0 |

+---------------------------------------+-------------------------------+--------------------------+--------------------------+

| ANTQ 10.08 0.09 | 0.21 0.21 0.05 0.00 0.00 | 2.5 19.4 1.5 0.1 0.0 | 0.48 0.49 0.03 0.00 0.00 |

| ATLA 6.62 0.40 | 0.60 -0.13 0.13 -0.02 0.00 | 13.2 5.0 6.4 2.6 0.0 | 0.91 0.05 0.04 0.00 0.00 |

| BOLI 4.53 0.22 | 0.46 -0.06 0.03 0.04 0.00 | 5.4 0.7 0.2 3.9 0.0 | 0.97 0.02 0.00 0.01 0.00 |

| BOYA 3.92 0.44 | -0.57 -0.21 -0.26 0.02 0.00 | 7.1 7.1 16.2 0.9 0.0 | 0.75 0.10 0.15 0.00 0.00 |

| CALD 3.30 0.02 | -0.02 0.05 -0.09 -0.11 0.00 | 0.0 0.4 1.6 24.8 0.0 | 0.02 0.12 0.35 0.50 0.00 |

| CAQE 0.90 0.27 | 0.45 0.16 -0.20 0.01 0.00 | 1.0 1.0 2.1 0.1 0.0 | 0.76 0.09 0.14 0.00 0.00 |

| CAUC 2.73 0.09 | 0.17 -0.21 -0.11 0.00 0.00 | 0.5 5.0 2.0 0.0 0.0 | 0.35 0.51 0.14 0.00 0.00 |

| CESA 2.66 0.63 | 0.77 -0.17 0.03 0.01 0.00 | 8.7 3.1 0.1 0.3 0.0 | 0.95 0.05 0.00 0.00 0.00 |

| CORD 2.40 0.34 | 0.56 0.17 -0.03 0.00 0.00 | 4.1 2.9 0.1 0.0 0.0 | 0.91 0.09 0.00 0.00 0.00 |

| HUIL 2.56 0.15 | -0.26 -0.08 -0.27 -0.04 0.00 | 1.0 0.7 11.0 3.4 0.0 | 0.46 0.05 0.48 0.01 0.00 |

| GUAJ 1.40 0.62 | 0.77 -0.12 0.01 -0.07 0.00 | 4.6 0.8 0.0 5.3 0.0 | 0.97 0.02 0.00 0.01 0.00 |

| MADG 2.97 0.88 | 0.88 -0.31 -0.01 0.05 0.00 | 12.7 12.2 0.0 5.7 0.0 | 0.89 0.11 0.00 0.00 0.00 |

| META 2.10 0.06 | -0.12 0.07 -0.18 0.10 0.00 | 0.2 0.4 4.3 14.5 0.0 | 0.24 0.07 0.53 0.16 0.00 |

| NARI 3.65 0.13 | -0.20 -0.24 -0.16 0.04 0.00 | 0.8 9.1 5.5 4.1 0.0 | 0.32 0.47 0.20 0.01 0.00 |

| NORT 3.68 0.04 | -0.13 0.13 -0.09 0.03 0.00 | 0.3 2.7 1.8 1.7 0.0 | 0.37 0.42 0.19 0.02 0.00 |

| QUIN 1.28 0.15 | -0.19 0.32 -0.10 0.02 0.00 | 0.3 5.6 0.8 0.2 0.0 | 0.25 0.68 0.07 0.00 0.00 |

| RISA 2.20 0.15 | -0.01 0.36 0.07 0.12 0.00 | 0.0 11.9 0.7 19.8 0.0 | 0.00 0.87 0.04 0.09 0.00 |

| SANT 4.96 0.12 | -0.35 0.02 -0.03 -0.02 0.00 | 3.3 0.1 0.3 1.8 0.0 | 0.98 0.00 0.01 0.00 0.00 |

| SUCR 1.72 0.14 | 0.30 0.20 -0.06 0.05 0.00 | 0.9 3.0 0.4 2.7 0.0 | 0.66 0.30 0.03 0.02 0.00 |

| TOLI 4.37 0.10 | 0.05 0.17 -0.26 -0.04 0.00 | 0.1 5.4 17.4 4.8 0.0 | 0.02 0.30 0.66 0.02 0.00 |

| VALL 9.77 0.02 | 0.10 0.05 0.07 -0.02 0.00 | 0.6 0.9 2.7 3.4 0.0 | 0.60 0.12 0.25 0.03 0.00 |

| BO+CU 22.20 0.29 | -0.52 -0.05 0.14 0.00 0.00 | 32.9 2.7 24.9 0.0 0.0 | 0.93 0.01 0.06 0.00 0.00 |

+---------------------------------------+-------------------------------+--------------------------+--------------------------+

Page 18: 2. ANÁLISIS DE CORRESPONDENCIAS SIMPLESvalentin/ad3d/anadat/teoria_web/simposio... · 2011-01-21 · El análisis de correspondencias simples es el método factorial apropiado para

Simposio de Estadística – 2001 46

Pardo C.E. y Cabarcas G. Métodos estadísticos multivariados en investigación social

Gráfico 2-6: Primer Plano Factorial. Proyección conjunta de los perfiles filas y los perfiles columnas

Proyección Conjunta de los puntos perfiles – categorías y los perfiles - departamentos.

La proyección conjunta permite observar aproximadamente tres centros de gravedad constituidos por las

categorías, en torno a los cuales se agrupan los departamentos. En un extremo está la Categoría Infer que

parece ser el centro de gravedad de los departamentos encerrados en el circulo en el Gráfico 2-7. En ese

mismo gráfico se han trazado círculos para definir aproximadamente los otros dos agrupamientos.

Naturalmente quedan por fuera de esos círculos algunos puntos cuya ubicación en uno u otros

agrupamiento no está precisada. Esta situación puede ser resuelta usando los métodos de clasificación.

2.8.3. Conclusiones.

Siguiendo el arco formado por los departamentos en el primer plano factorial es posible reordenar los

perfiles de los departamentos y verificar el parecido de dichos perfiles entre sí. Esta situación se puede

apreciar en el Gráfico 2-8. Lo que se observa en el plano factorial (Gráfico 2-6), se puede ahora verificar

aquí: los departamentos ubicados en el circulo de la derecha del plano factorial son los mismos ubicados

en la parte inferior del gráfico, caracterizados por el gran peso que tiene en ellos la categoría Infer. Los del

circulo inferior son los mismos departamentos ubicados en la mitad de la tabla y caracterizados por la

categoría Bajo. Y los del circulo izquierdo están ubicados en la parte superior de la tabla, en el peso

relativo de las categorías Infer y Bajo en pequeño al tiempo que tienen un mayor peso las categorías

Medio, Alto y Super . El departamento del Cauca, que aparece ubicado en el plano en el ‘foco’ del arco

parabólico que arman los demás departamentos se ubica hacia el centro de la tabla y es el que muestra un

perfil en el cual están más equilibradas las cinco categorías.

Page 19: 2. ANÁLISIS DE CORRESPONDENCIAS SIMPLESvalentin/ad3d/anadat/teoria_web/simposio... · 2011-01-21 · El análisis de correspondencias simples es el método factorial apropiado para

Simposio de Estadística – 2001 47

Pardo C.E. y Cabarcas G. Métodos estadísticos multivariados en investigación social

Gráfico 2-7: Agrupamiento aproximado de los Departamentos

Page 20: 2. ANÁLISIS DE CORRESPONDENCIAS SIMPLESvalentin/ad3d/anadat/teoria_web/simposio... · 2011-01-21 · El análisis de correspondencias simples es el método factorial apropiado para

Simposio de Estadística – 2001 48

Pardo C.E. y Cabarcas G. Métodos estadísticos multivariados en investigación social

Gráfico 2-8: Perfiles de los Departamentos Reordenados.

0% 20% 40% 60% 80% 100%

Magdalena

Cesar

Guajira

Atlantico

Bolivar

Cordoba

Caqueta

Sucre

Antioquia

Cauca

Valle

Tolima

Quindio

Risaralda

Caldas

Meta

Norte

Santander

Huila

Narino

Bog+Cun

Boyaca

Super Alto Medio Bajo Infer

Page 21: 2. ANÁLISIS DE CORRESPONDENCIAS SIMPLESvalentin/ad3d/anadat/teoria_web/simposio... · 2011-01-21 · El análisis de correspondencias simples es el método factorial apropiado para

Simposio de Estadística – 2001 49

Pardo C.E. y Cabarcas G. Métodos estadísticos multivariados en investigación social

2.9. Ejercicio: Estudio de la situación regional de la educación media en Colombia

(1997-1998). Desagregando educación oficial y educación privada en cada

departamento.

2.9.1. Presentación.

A continuación se muestra una tabla de contingencia (Tabla 2-9), que contiene la información

correspondiente al número de planteles educativos clasificados por el Icfes en cada una de las cinco

categorías usadas en el ejemplo anterior, pero ahora en cada departamento se han separado los colegios

pertenecientes a la educación oficial de la privada. Los primeros están identificados con una letra ‘O’ y los

otros con una ‘P’. El objetivo es el mismo del ejemplo: estudiar la configuración de las nubes de puntos-

departamentos y puntos-categorías. Como elementos necesarios para realizar el análisis se incluye en la

información: la Tabla 2-10 que contiene la información acerca de los valores propios, las coordenadas,

contribuciones y cosenos cuadrados para las frecuencias (Categorías) y para los individuos

(Departamentos), y dos gráficos: Gráfico 2-9, la proyección de la nube de puntos-departamentos sobre el

primer plano factorial y Gráfico 2-10, la proyección conjunta de las dos nubes de puntos: departamentos y

categorías sobre el primer plano factorial. A continuación encuentra una serie de interrogantes para

orientar el análisis.

2.9.2. Guía para el análisis.

1. Que porcentaje de la inercia total es recogida por el primer eje factorial, por el segundo eje

factorial y por el primer plano factorial. Que se puede concluir de esta constatación?

2. Análisis de la proyección de la nube de puntos-categorías sobre el primer plano factorial.

a. Cuáles son las dos categorías más contributivas al primer eje factorial? Cuáles son sus

coordenadas y cuáles sus pesos relativos?. Qué tan bien representadas están esas

categorías en el primer plano factorial? Cuál es la categoría que está más mal representada

en el primer plano factorial? Puede decirse que está muy mal representada? Como podría

denominarse al primer eje factorial?

b. Cuales son las dos categorías más contributivas al segundo eje factorial? Cuáles son sus

coordenadas y sus pesos relativos?. Qué tan bien representadas están esas categorías en el

primer plano factorial? Como podría denominarse al segundo eje factorial?

3. Análisis de la proyección de la nube de puntos-departamentos sobre el primer plano factorial.

a. Cuáles son los 6 departamentos mas contributivos al primer eje factorial? Cuáles son sus

coordenadas y cuáles sus pesos relativos?. Qué tan bien representadas están estos

departamentos en el primer plano factorial? Cuales son los dos departamentos más mal

representados en el primer plano factorial? Puede concluirse de lo anterior que algunos

departamentos están muy mal representados? De qué manera estos resultados son útiles

para ayudar a la caracterización del primer eje factorial?

b. Cuáles son los 6 departamentos mas contributivos al segundo eje factorial? Cuáles son sus

coordenadas y cuáles sus pesos relativos?. Qué tan bien representadas están estos

departamentos en el primer plano factorial? De qué manera estos resultados son útiles

para ayudar a la caracterización del segundo eje factorial?

4. Análisis de la proyección conjunta de las dos nubes de puntos.

a. Puede evidenciarse algún patrón de comportamiento con respecto a los perfiles de

educación oficial y privada? Teniendo en cuenta las proyecciones de las categorías, como

se puede caracterizar dicho patrón?

Page 22: 2. ANÁLISIS DE CORRESPONDENCIAS SIMPLESvalentin/ad3d/anadat/teoria_web/simposio... · 2011-01-21 · El análisis de correspondencias simples es el método factorial apropiado para

Simposio de Estadística – 2001 50

Pardo C.E. y Cabarcas G. Métodos estadísticos multivariados en investigación social

b. Liste los departamentos más cercanos a cada una de las categorías. Se puede evidenciar

algún patrón especial en estos grupos respecto a la educación oficial y privada?

c. Cuales son las cuatro parejas de perfiles de educación (oficial-privada) de un mismo

departamento más distanciadas entre sí? En que sentido se da tal diferencia?

d. Cuales son las cuatro parejas de perfiles de educación (oficial-privada) de un mismo

departamento menos distanciadas entre sí? En que sentido se da tal diferencia?

e. Se puede sugerir un reordenamiento de los departamentos teniendo en cuenta su

disposición en el primer plano factorial? Cuál?

5. Escriba en un párrafo las conclusiones más relevantes del análisis.

Page 23: 2. ANÁLISIS DE CORRESPONDENCIAS SIMPLESvalentin/ad3d/anadat/teoria_web/simposio... · 2011-01-21 · El análisis de correspondencias simples es el método factorial apropiado para

Simposio de Estadística – 2001 51

Pardo C.E. y Cabarcas G. Métodos estadísticos multivariados en investigación social

Tabla 2-9: Departamentos (Educación Oficial – Educación Privada) contra Categoría

Departamento Super Alto Medio Bajo Infer

AN_O 0 1 7 54 53

AN_P 0 1 1 31 22

AT_O 0 0 2 72 32

AT_P 0 3 6 58 40

BG_O 0 0 1 3 2

BG_P 0 4 22 77 47

BL_O 2 5 11 22 26

BL_P 20 21 33 120 110

BY_O 4 3 9 18 21

BY_P 3 0 7 11 9

CA_O 1 5 9 63 21

CA_P 0 12 40 277 77

CE_O 0 1 9 29 10

CE_P 0 12 40 135 36

CL_O 1 2 13 41 11

CL_P 0 8 18 68 7

CO_O 0 3 15 41 1

CO_P 3 7 63 121 23

CQ_O 1 7 47 88 23

CQ_P 2 3 16 29 10

CU_O 1 5 5 19 7

CU_P 0 9 39 48 27

GJ_O 3 16 56 69 14

GJ_P 4 17 76 55 27

HU_O 2 4 19 19 5

HU_P 3 22 84 78 10

MA_O 0 7 55 38 11

MA_P 3 22 104 99 8

ME_O 0 11 28 28 1

ME_P 3 25 107 51 5

NA_O 113 147 256 167 2

NA_P 7 75 107 110 0

NO_O 11 18 51 49 3

NO_P 5 10 17 9 2

QU_O 8 8 23 9 0

QU_P 3 5 8 2 0

RI_O 11 7 14 3 0

RI_P 5 10 6 11 1

ST_O 18 19 29 38 1

ST_P 29 40 60 66 13

SU_O 6 6 14 18 1

SU_P 6 8 13 37 2

TO_O 3 5 13 13 4

TO_P 37 49 91 140 55

VL_O 6 4 11 12 10

VL_P 37.00 49.00 91.00 140.00 55.00

Page 24: 2. ANÁLISIS DE CORRESPONDENCIAS SIMPLESvalentin/ad3d/anadat/teoria_web/simposio... · 2011-01-21 · El análisis de correspondencias simples es el método factorial apropiado para

Simposio de Estadística – 2001 52

Pardo C.E. y Cabarcas G. Métodos estadísticos multivariados en investigación social

Tabla 2-10: Resultados del ejercicio

ANALYSE DES CORRESPONDANCES BINAIRES

VALEURS PROPRES APERCU DE LA PRECISION DES CALCULS : TRACE AVANT DIAGONALISATION .. 0.2777

SOMME DES VALEURS PROPRES .... 0.2777 HISTOGRAMME DES 4 PREMIERES VALEURS PROPRES +--------+------------+----------+----------+----------------------------------------------------------------------------------+

| NUMERO | VALEUR | POURCENT.| POURCENT.| |

| | PROPRE | | CUMULE | |

+--------+------------+----------+----------+----------------------------------------------------------------------------------+

| 1 | 0.1753 | 63.11 | 63.11 | ******************************************************************************** |

| 2 | 0.0540 | 19.43 | 82.54 | ************************* |

| 3 | 0.0362 | 13.02 | 95.56 | ***************** |

| 4 | 0.0123 | 4.44 | 100.00 | ****** |

+--------+------------+----------+----------+----------------------------------------------------------------------------------+ COORDONNEES, CONTRIBUTIONS DES FREQUENCES SUR LES AXES 1 A 4

FREQUENCES ACTIVES +------------------------------------------+-------------------------------+--------------------------+--------------------------+

| FREQUENCES | COORDONNEES | CONTRIBUTIONS | COSINUS CARRES |

|------------------------------------------+-------------------------------+--------------------------+--------------------------|

| IDEN - LIBELLE COURT P.REL DISTO | 1 2 3 4 0 | 1 2 3 4 0 | 1 2 3 4 0 |

+------------------------------------------+-------------------------------+--------------------------+--------------------------+

| Supe - Super 7.44 0.49 | -0.24 0.53 -0.32 0.22 0.00 | 2.5 38.3 21.6 30.2 0.0 | 0.12 0.57 0.21 0.10 0.00 |

| Alto - Alto 10.80 0.40 | -0.50 0.29 -0.01 -0.26 0.00 | 15.5 16.7 0.1 57.0 0.0 | 0.63 0.21 0.00 0.16 0.00 |

| Medi - Medio 26.55 0.25 | -0.44 -0.13 0.18 0.07 0.00 | 29.9 8.9 23.5 11.1 0.0 | 0.78 0.07 0.13 0.02 0.00 |

| Bajo - Bajo 41.20 0.10 | 0.22 -0.17 -0.15 -0.02 0.00 | 11.2 21.1 24.9 1.6 0.0 | 0.49 0.28 0.22 0.01 0.00 |

| Infe - Infer 14.00 0.65 | 0.72 0.24 0.28 0.01 0.00 | 41.0 15.1 29.9 0.1 0.0 | 0.79 0.09 0.12 0.00 0.00 |

+------------------------------------------+-------------------------------+--------------------------+--------------------------+

COORDONNEES, CONTRIBUTIONS ET COSINUS CARRES DES INDIVIDUS

AXES 1 A 4 +---------------------------------------+-------------------------------+--------------------------+--------------------------+

| INDIVIDUS | COORDONNEES | CONTRIBUTIONS | COSINUS CARRES |

|---------------------------------------+-------------------------------+--------------------------+--------------------------|

| IDENTIFICATEUR P.REL DISTO | 1 2 3 4 0 | 1 2 3 4 0 | 1 2 3 4 0 |

+---------------------------------------+-------------------------------+--------------------------+--------------------------+

| AN_O 6.95 0.30 | 0.46 -0.12 -0.28 0.03 0.00 | 8.3 1.8 14.8 0.5 0.0 | 0.69 0.05 0.26 0.00 0.00 |

| AN_P 3.30 0.19 | -0.34 0.23 -0.13 -0.03 0.00 | 2.2 3.1 1.7 0.3 0.0 | 0.63 0.27 0.10 0.01 0.00 |

| AT_O 1.57 0.36 | 0.53 -0.20 -0.12 -0.15 0.00 | 2.5 1.2 0.6 2.9 0.0 | 0.78 0.11 0.04 0.06 0.00 |

| AT_P 4.82 0.46 | 0.59 0.27 0.21 -0.01 0.00 | 9.5 6.3 5.7 0.1 0.0 | 0.75 0.15 0.09 0.00 0.00 |

| BG_O 5.51 0.18 | -0.19 0.05 0.20 -0.31 0.00 | 1.2 0.3 6.0 43.1 0.0 | 0.21 0.02 0.23 0.55 0.00 |

| BG_P 10.86 0.46 | -0.62 0.25 -0.13 0.03 0.00 | 23.6 12.9 5.0 0.9 0.0 | 0.82 0.14 0.04 0.00 0.00 |

| BL_O 2.57 0.30 | 0.53 0.08 0.05 0.10 0.00 | 4.1 0.3 0.2 2.3 0.0 | 0.93 0.02 0.01 0.04 0.00 |

| BL_P 2.00 0.09 | 0.24 0.16 0.02 -0.12 0.00 | 0.6 0.9 0.0 2.2 0.0 | 0.59 0.26 0.00 0.14 0.00 |

| BY_O 3.03 0.52 | -0.58 -0.29 0.32 0.04 0.00 | 5.7 4.7 8.7 0.4 0.0 | 0.64 0.16 0.20 0.00 0.00 |

| BY_P 0.88 0.31 | -0.37 0.29 0.21 0.20 0.00 | 0.7 1.4 1.1 2.9 0.0 | 0.44 0.28 0.15 0.13 0.00 |

| CA_O 2.11 0.05 | 0.10 0.04 0.16 0.12 0.00 | 0.1 0.0 1.5 2.7 0.0 | 0.19 0.02 0.49 0.29 0.00 |

| CA_P 0.68 0.16 | 0.08 0.33 0.12 0.19 0.00 | 0.0 1.3 0.3 2.0 0.0 | 0.04 0.65 0.09 0.22 0.00 |

| CE_O 1.83 0.56 | 0.72 0.17 0.04 0.05 0.00 | 5.5 1.0 0.1 0.3 0.0 | 0.94 0.05 0.00 0.00 0.00 |

| CE_P 0.87 0.50 | 0.54 0.30 0.33 0.09 0.00 | 1.5 1.5 2.6 0.5 0.0 | 0.59 0.18 0.22 0.01 0.00 |

| CL_O 2.63 0.14 | 0.16 -0.33 0.04 0.00 0.00 | 0.4 5.4 0.1 0.0 0.0 | 0.18 0.80 0.01 0.00 0.00 |

| CL_P 0.65 0.85 | -0.45 0.72 0.00 0.37 0.00 | 0.7 6.2 0.0 7.0 0.0 | 0.24 0.61 0.00 0.16 0.00 |

| CO_O 2.06 0.37 | 0.52 0.15 -0.19 -0.18 0.00 | 3.2 0.9 2.1 5.6 0.0 | 0.74 0.06 0.10 0.09 0.00 |

| CO_P 0.60 0.05 | -0.21 0.01 0.07 0.02 0.00 | 0.1 0.0 0.1 0.0 0.0 | 0.90 0.00 0.09 0.01 0.00 |

| CQ_O 0.84 0.17 | 0.36 -0.10 -0.12 0.12 0.00 | 0.6 0.2 0.3 1.0 0.0 | 0.77 0.06 0.08 0.08 0.00 |

| CQ_P 0.12 0.19 | 0.36 0.21 0.07 -0.07 0.00 | 0.1 0.1 0.0 0.1 0.0 | 0.70 0.24 0.03 0.03 0.00 |

| CU_O 3.74 0.25 | -0.31 -0.38 0.11 0.02 0.00 | 2.1 9.8 1.3 0.1 0.0 | 0.39 0.56 0.05 0.00 0.00 |

| CU_P 2.09 0.17 | -0.39 -0.11 -0.04 0.03 0.00 | 1.8 0.4 0.1 0.2 0.0 | 0.91 0.07 0.01 0.01 0.00 |

| GJ_O 0.94 0.72 | 0.82 0.19 0.02 0.04 0.00 | 3.7 0.6 0.0 0.1 0.0 | 0.95 0.05 0.00 0.00 0.00 |

| GJ_P 0.53 0.15 | 0.23 0.26 0.17 0.02 0.00 | 0.2 0.7 0.4 0.0 0.0 | 0.34 0.45 0.20 0.00 0.00 |

| HU_O 1.90 0.20 | -0.28 -0.16 0.19 0.26 0.00 | 0.8 0.9 1.9 10.0 0.0 | 0.38 0.12 0.18 0.32 0.00 |

| HU_P 0.71 0.16 | -0.32 0.03 -0.22 0.09 0.00 | 0.4 0.0 1.0 0.4 0.0 | 0.64 0.00 0.31 0.05 0.00 |

| MA_O 1.97 0.85 | 0.84 0.28 0.21 0.11 0.00 | 8.0 2.8 2.4 1.8 0.0 | 0.84 0.09 0.05 0.01 0.00 |

| MA_P 1.05 0.55 | 0.56 0.24 0.42 -0.05 0.00 | 1.9 1.1 5.0 0.2 0.0 | 0.58 0.10 0.32 0.00 0.00 |

| ME_O 1.16 0.18 | -0.40 -0.12 -0.05 -0.02 0.00 | 1.1 0.3 0.1 0.0 0.0 | 0.90 0.08 0.02 0.00 0.00 |

| ME_P 0.95 0.07 | 0.17 -0.19 0.06 0.04 0.00 | 0.2 0.6 0.1 0.1 0.0 | 0.43 0.50 0.05 0.02 0.00 |

| NA_O 2.84 0.16 | -0.16 -0.14 0.34 0.05 0.00 | 0.4 1.0 8.9 0.6 0.0 | 0.16 0.12 0.71 0.02 0.00 |

| NA_P 0.68 0.39 | -0.58 0.22 0.06 -0.08 0.00 | 1.3 0.6 0.1 0.4 0.0 | 0.85 0.13 0.01 0.02 0.00 |

| NO_O 2.50 0.09 | -0.13 -0.26 0.08 -0.05 0.00 | 0.2 3.1 0.5 0.4 0.0 | 0.18 0.72 0.08 0.02 0.00 |

| NO_P 1.05 0.16 | -0.06 -0.13 -0.37 -0.08 0.00 | 0.0 0.3 4.0 0.5 0.0 | 0.02 0.10 0.84 0.04 0.00 |

| QU_O 1.03 0.27 | 0.01 -0.34 -0.38 0.07 0.00 | 0.0 2.3 4.1 0.4 0.0 | 0.00 0.44 0.54 0.02 0.00 |

| QU_P 0.33 0.52 | -0.48 0.48 0.23 -0.02 0.00 | 0.4 1.4 0.5 0.0 0.0 | 0.46 0.44 0.10 0.00 0.00 |

| RI_O 1.73 0.20 | 0.13 -0.21 -0.37 -0.03 0.00 | 0.2 1.5 6.5 0.1 0.0 | 0.08 0.23 0.68 0.01 0.00 |

| RI_P 0.52 0.56 | -0.42 0.41 -0.32 -0.34 0.00 | 0.5 1.6 1.5 4.8 0.0 | 0.31 0.30 0.19 0.20 0.00 |

| ST_O 3.12 0.20 | -0.30 -0.30 0.13 -0.03 0.00 | 1.6 5.3 1.6 0.2 0.0 | 0.45 0.46 0.09 0.00 0.00 |

| ST_P 1.66 0.30 | -0.40 0.21 -0.31 0.04 0.00 | 1.5 1.3 4.5 0.2 0.0 | 0.54 0.14 0.32 0.00 0.00 |

| SU_O 1.08 0.22 | 0.34 -0.30 -0.08 -0.02 0.00 | 0.7 1.8 0.2 0.1 0.0 | 0.54 0.42 0.03 0.00 0.00 |

| SU_P 0.59 0.14 | 0.27 -0.02 -0.05 -0.26 0.00 | 0.2 0.0 0.0 3.2 0.0 | 0.51 0.00 0.02 0.47 0.00 |

| TO_O 3.44 0.16 | 0.12 -0.39 -0.03 0.04 0.00 | 0.3 9.5 0.1 0.4 0.0 | 0.08 0.90 0.01 0.01 0.00 |

| TO_P 0.78 0.09 | -0.16 -0.20 0.14 0.07 0.00 | 0.1 0.6 0.4 0.4 0.0 | 0.27 0.45 0.21 0.06 0.00 |

| VL_O 3.82 0.12 | 0.27 -0.11 -0.19 0.04 0.00 | 1.6 0.9 3.9 0.5 0.0 | 0.59 0.10 0.30 0.01 0.00 |

| VL_P 5.90 0.02 | -0.03 0.13 -0.02 -0.01 0.00 | 0.0 1.9 0.1 0.0 0.0 | 0.04 0.93 0.03 0.01 0.00 |

+---------------------------------------+-------------------------------+--------------------------+--------------------------+

Page 25: 2. ANÁLISIS DE CORRESPONDENCIAS SIMPLESvalentin/ad3d/anadat/teoria_web/simposio... · 2011-01-21 · El análisis de correspondencias simples es el método factorial apropiado para

Simposio de Estadística – 2001 53

Pardo C.E. y Cabarcas G. Métodos estadísticos multivariados en investigación social

Gráfico 2-9: Proyección de los Puntos-Departamentos sobre el primer plano factorial

Gráfico 2-10: Proyección conjunta de los puntos-departamentos y los puntos-categorías sobre el primer plano factorial