ANÁLISIS DE CONGLOMERADOS (ESTADÍSTICA CON SPSS PARA WINDOWS)

21
ANÁLISIS DE CONGLOMERADOS (ESTADÍSTICA CON SPSS PARA WINDOWS)

Transcript of ANÁLISIS DE CONGLOMERADOS (ESTADÍSTICA CON SPSS PARA WINDOWS)

Page 1: ANÁLISIS DE CONGLOMERADOS (ESTADÍSTICA CON SPSS PARA WINDOWS)

ANÁLISIS DE CONGLOMERADOS

(ESTADÍSTICA CON SPSS PARA WINDOWS)

Page 2: ANÁLISIS DE CONGLOMERADOS (ESTADÍSTICA CON SPSS PARA WINDOWS)

Método por conglomerados

• Método en el que se separa la muestra obteniendo grupos de objetos de forma que, por un lado, los objetos pertenecientes a un mismo grupo sean muy semejantes entre sí (homogéneos), es decir, que el grupo esté cohesionado internamente y, por el otro, los objetos pertenecientes a grupos diferentes tengan un comportamiento distinto con respecto a las variables analizadas, es decir, que cada grupo sea completamente distinto y distante al otro.

Page 3: ANÁLISIS DE CONGLOMERADOS (ESTADÍSTICA CON SPSS PARA WINDOWS)

Ejercicio de conglomerados

• Considerando un grupo de n integrantes con base a una encuesta con tema “¿ que alcohol no beben por tener efectos negativos en si mismos?”. De acuerdo con la investigaciónecha, se identificaron siete variables, cada una correspondiente al tipo de alcohol que no se ingerían por la muestra. Se sospecha que la variación en alguno de estos elementos, demostrará cual es el que peor efecto tiene en los encuestados.

• N=Número de individuos (filas)• P= Número de variables observadas (columnas)• N=14

• P= (Ron, Vodka, Vino, Pisco, Tequila, Cerveza,Caipirinha)

Page 4: ANÁLISIS DE CONGLOMERADOS (ESTADÍSTICA CON SPSS PARA WINDOWS)

Pasos para realizar el análisis por conglomerados para el ejercicio planteado

1º Establecer medida de distancia entre individuos:

Para este paso utilizaremos la distancia euclídea

Page 5: ANÁLISIS DE CONGLOMERADOS (ESTADÍSTICA CON SPSS PARA WINDOWS)

2º Luego realizaremos las correlaciones respectivas:

(En cuadro de diálogo) Analizar -> correlaciones-> BivariadasVariables: vodka, ron, vinoAceptar.

Page 6: ANÁLISIS DE CONGLOMERADOS (ESTADÍSTICA CON SPSS PARA WINDOWS)

3º Análisis de valor tipificados:

(En cuadro de diálogo) Analizar->estadísticos descriptivos->descriptivosVariables: vodka, Ron, vino. Guardar variables tipificados como variablesAceptar.

Habiendo realizado ambos pasos procederemos a realizar el paso de las K-medias en el cual especificaremos el número de iteraciones (repeticiones del proceso) para poder obtener los centros iniciales.

Page 7: ANÁLISIS DE CONGLOMERADOS (ESTADÍSTICA CON SPSS PARA WINDOWS)

4º Método de las K-medias: Este método no jerárquico realiza una división de los individuos en grupos donde k debe ser definido anteriormente.

Este método realiza los siguientes pasos:

1. Elegir número de conglomerados2. Especificar centros de k conglomerados iniciales ( en el caso que sea

desconocidos, estimarlos)3. En función del centro más cercano, agrupar pacientes en conglomerados4. Calcular centro de conglomerados a partir de la agrupación en el paso

anterior. 5. Repetir paso 3 y 4 hasta que se de algún criterio de parada.

Para k conocida:

(Cuadro de dialogo)Gráficos->dispersión3-D -> definir Eje y: Puntua (Ron) (ZRon)Eje X: Puntua (Vodka) (ZVodka)Eje Z: Puntua (Vino) (ZVino) Aceptar.

Page 8: ANÁLISIS DE CONGLOMERADOS (ESTADÍSTICA CON SPSS PARA WINDOWS)

Para k desconocido :

Para el método de las K-medias al momento de determinar los conglomerados se debe realizar el siguiente procedimiento en el cuadro de diálogo del programa:

(Cuadro de dialogo) Analizar-> clasificar-> conglomerado de k medias Variables: Puntua (Ron) (ZRon), Puntua (Vodka) (Z Vodka), Puntua (Vino) (ZVino) Nº de conglomerados: 4Opciones Estadísticos: Centros de conglomerados iniciales Información del conglomerado para cada casoContinuar:Guardar Conglomerado de pertenencia ContinuarAceptar.

Page 9: ANÁLISIS DE CONGLOMERADOS (ESTADÍSTICA CON SPSS PARA WINDOWS)

Dando como resultado los siguientes cuadros y representaciones gráficas:

Page 10: ANÁLISIS DE CONGLOMERADOS (ESTADÍSTICA CON SPSS PARA WINDOWS)
Page 11: ANÁLISIS DE CONGLOMERADOS (ESTADÍSTICA CON SPSS PARA WINDOWS)

Luego de haber localizado los primeros centros se procederá a realizar un cálculo para los nuevo centros, que corresponderá al centro de cada uno de los conglomerados, para proceder a la siguiente agrupación, hasta que alguna de las soluciones coincida (criterio de parada), dando como resultado la siguiente tabla.

Los siguientes cuadros resumen la pertenencia de cada individuo en su variable respectiva.

Page 12: ANÁLISIS DE CONGLOMERADOS (ESTADÍSTICA CON SPSS PARA WINDOWS)

Mediante la opción Guardar: Conglomerado de pertenecia, se generará la variable QCL_1 , a partir de esta variable podremos ver que tienen en común las personas clasificadas en un mismo conglomerado, a través de un grafico matricial analizaremos este tópico.

(Cuadro de dialogo)Gráficos-> dispersión Matricial-> definir Variables en la matriz: RON, VODKA, VINO. Etiquetar los casos mediante: Numero inicial de casos (QCL_1) Opciones Mostrar el gráfico con las etiquetas de casoContinuarAceptar

Generándose el siguiente grafico matricial.

Page 13: ANÁLISIS DE CONGLOMERADOS (ESTADÍSTICA CON SPSS PARA WINDOWS)
Page 14: ANÁLISIS DE CONGLOMERADOS (ESTADÍSTICA CON SPSS PARA WINDOWS)

Método jerárquico Aglomerativo: Promedio entre gruposEste proceso tiene el mismo proceso que el de K-medias, se debe determinar las distancias entre conglomerados pero con la diferencia que ésta se determina con el promedio de las distancias entre todos los pares de individuos o con distancia euclídea que justamente en este caso seguiremos utilizándola. En este método cada individuo se convierte en un conglomerado en particular para luego agruparse de a dos en dos hasta formar entre todos un gran conglomerado.

Page 15: ANÁLISIS DE CONGLOMERADOS (ESTADÍSTICA CON SPSS PARA WINDOWS)

El número de casos en este método se puede definir con anterioridad dependiendo de lo obtenido en cada etapa.

Obtención de conglomerados:

(Cuadro de diálogo)Analizar->Clasificar ->Conglomerados jerárquicos. Variables: Puntua (ron), puntua (vodka), puntua (vino)Método Método de conglomeración: Vinculación Inter- Grupos Medida: Intervalo: Distancia EuclideaContinuar.Estadísticos Conglomerado de pertenencia Rango de soluciones: Desde 2 hasta 13 gruposContinuarGráficos Dendograma Témpano: Orientación: Horizontal.Aceptar.

Page 16: ANÁLISIS DE CONGLOMERADOS (ESTADÍSTICA CON SPSS PARA WINDOWS)
Page 17: ANÁLISIS DE CONGLOMERADOS (ESTADÍSTICA CON SPSS PARA WINDOWS)
Page 18: ANÁLISIS DE CONGLOMERADOS (ESTADÍSTICA CON SPSS PARA WINDOWS)

Caso

Número de conglomerados

1 2 3 4 5 6 7 8 9 10 11 12 13

10 X X X X X X X X X X X X X

X X X X X X X X

6 X X X X X X X X X X X X X

X

14 X X X X X X X X X X X X X

X X X X X X X

12 X X X X X X X X X X X X X

X X X X X X X X X X

11 X X X X X X X X X X X X X

X X

7 X X X X X X X X X X X X X

X X X X X X

3 X X X X X X X X X X X X X

X X X X X X X X X

8 X X X X X X X X X X X X X

X X X X X X X X X X X

5 X X X X X X X X X X X X X

X X X X X X X X X X X X

2 X X X X X X X X X X X X X

X X X

13 X X X X X X X X X X X X X

X X X X

9 X X X X X X X X X X X X X

X X X X X X X X X X X X X

4 X X X X X X X X X X X X X

X X X X X

1 X X X X X X X X X X X X X

Page 19: ANÁLISIS DE CONGLOMERADOS (ESTADÍSTICA CON SPSS PARA WINDOWS)
Page 20: ANÁLISIS DE CONGLOMERADOS (ESTADÍSTICA CON SPSS PARA WINDOWS)

Conclusión

• El Análisis Cluster, también conocido como Análisis de Conglomerados, es una técnica estadística multivariante cuya finalidad es dividir un conjunto de objetos en grupos (cluster en inglés) de forma que los perfiles de los objetos en un mismo grupo sean muy similares entre sí (cohesión interna del grupo) y los de los

objetos de clusters diferentes sean distintos (aislamiento externo del grupo).

• Realizando distintos pasos podemos decir que cada grupo de individuos tendrá una reacción negativa ante el tipo de variable en que se ubicado el conglomerado.

• Los resultados del análisis deberían tomarse como punto de partida en la elaboración de teorías que expliquen dichos resultados.

Page 21: ANÁLISIS DE CONGLOMERADOS (ESTADÍSTICA CON SPSS PARA WINDOWS)

Maria de los Angeles Navarrete Salas

Maria Fernanda

26 de Octubre del 2009