Post on 02-Oct-2018
Tema B6. Tablas de contingencia
Ejemplo
Tema B6. Tablas de contingencia
Tema B6. Tablas de contingencia
En esta tabla se representan los mismos datos que en la tabla anterior, pero en términos de frecuencias (“recuento”)
Tema B6. Tablas de contingencia
� Para simplificar la tabla vamos a agrupar variables1. Juntamos las personas que están muy de acuerdo y bastante de
acuerdo… en considerarse bastante atractivo.2. Juntamos las personas que están poco o nada de acuerdo3. Eliminamos del análisis la no respuesta (hemos excluido a 192+77+31
= 300 personas. En total hay 4832 hombres en la muestra, es decir, que la no respuesta es del 6 por ciento (300/4832 = 0.06 ó el 6%). Esto puede introducir sesgos en nuestras conclusiones.
4. Creamos tres categorías a partir de la variable estudios � Sin estudios / primaria� Secundaria / FP� Universitarios medios y superiores
LA TABLA QUEDARÁ…
Tema B6. Tablas de contingencia
453220622470Total
820340480Universitarios
1459599860Secundaria
225311231130Sin estudios / primaria
TotalPoco / nadaMuy /bastante
A esta tabla se le conoce como tabla de frecuencias observadas
Tabla de frecuencias observadas
Tema B6. Tablas de contingencia
453220622470Total
820340480Universitarios
1459599860Secundaria
225311231130Sin estudios / primaria
TotalPoco / nada
Muy /bastante
100%45.5%54.5%Total
100%41.5%58.5%Universitarios
100%41.1%58.9%Secundaria
100%49.8%50.2%Sin estudios / primaria
TotalPoco / nada
Muy /bastante
Esta sería la tabla de frecuencias observadas
En términos de porcentajes, las frecuencias observadas quedarían así:
El porcentaje de personas que se consideran atractivos parece ser menor en las personas sin estudios o con estudios de primaria
Tema B6. Tablas de contingencia
� El porcentaje de personas que se consideran atractivos parece ser menor en las personas sin estudios o con estudios de primaria que en las personas con estudios secundarios o universitarios
100%45.5%54.5%Total
100%41.5%58.5%Universitarios
100%41.1%58.9%Secundaria
100%49.8%50.2%Sin estudios / primaria
TotalPoco / nada
Muy /bastante
¿Se podría hablar de que existe asociación entre nivel de estudios y considerarse atractivo (autoconceptoestético)?
Para explorar si existe asociación vamos a comparar esta tabla con una tabla imaginaria en la que no existiría asociación (tabla de no asociación) o también llamada tabla de frecuencias esperadas (en caso de no asociación)
Tema B6. Tablas de contingencia
453220622470Total
820Universitarios
1459Secundaria
2253Sin estudios / primaria
TotalPoco / nadaMuy /bastante
Por ello, una vez que se cuenta con la tabla de frecuencias observadas, el siguiente paso es construir la tabla de frecuencias esperadas
Para ello trabajaremos, en primer lugar, con los totales de la tabla
Tema B6. Tablas de contingencia
453220622470Total
820Universitarios
1459Secundaria
22531227.9Sin estudios / primaria
TotalPoco / nadaMuy /bastante
La frecuencia esperada de la celda (muy-bastante y sin estudios-primaria) seráel resultado de multiplicar el total de dicha columna (2470) por el de dicha fila (2253) y dividir la cantidad por el total de la tabla (4532), esto es (2470 * 2253) / 4532 = 1227.9)
Tema B6. Tablas de contingencia
453220622470Total
820373.1446.9Universitarios
1459663.8795.2Secundaria
22531025.11227.9Sin estudios / primaria
TotalPoco / nadaMuy /bastante
Podemos completar la tabla de frecuencias esperadas realizando lo mismo que en la diapositiva anterior para el resto de celdas.
Tema B6. Tablas de contingencia
453220622470Total
820373.1446.9Universitarios
1459663.8795.2Secundaria
22531025.11227.9Sin estudios / primaria
TotalPoco / nada
Muy /bastante
100%45.5%54.5%Total
100%45.5%54.5%Universitarios
100%45.5%54.5%Secundaria
100%45.5%54.5%Sin estudios / primaria
TotalPoco / nada
Muy /bastante
Esta sería la tabla de frecuencias esperadas…
…. Y estos serían los porcentajes de la tabla de frecuencias esperadas
En todas las filas se han obtenido los mismos porcentajes, por eso a la tabla de frecuencias esperadas se le conoce también como tabla de no asociación
Tema B6. Tablas de contingencia
453220622470Total
820340480Universitarios
1459599860Secundaria
225311231130Sin estudios / primaria
TotalPoco / nada
Muy /bastante
453220622470Total
820373.1446.9Universitarios
1459663.8795.2Secundaria
22531025.11127.9Sin estudios / primaria
TotalPoco / nada
Muy /bastante
Esta sería la tabla de frecuencias observadas
Esta sería la tabla de frecuencias esperadas
Hasta ahora hemos producido cuatro tablas: dos con frecuencias…
Tema B6. Tablas de contingencia
100%45.5%54.5%Total
100%41.5%58.5%Universitarios
100%41.1%58.9%Secundaria
100%49.8%50.2%Sin estudios / primaria
TotalPoco / nada
Muy /bastante
100%45.5%54.5%Total
100%45.5%54.5%Universitarios
100%45.5%54.5%Secundaria
100%45.5%54.5%Sin estudios / primaria
TotalPoco / nada
Muy /bastante
Estos serían los porcentajes de la tabla de frecuencias observadas
Y estos los de la tabla de frecuencias esperadas o tabla de no asociación
… y otras dos con porcentajes.
Tema B6. Tablas de contingencia
Tema B6. Tablas de contingencia
453220622470Total
820340480Universitari
os
1459599860Secundaria
225311231130Sin estudios
/ primaria
TotalPoco / nadaMuy
/bastante
OBSERVADAS
453220622470Total
820373.1446.9Universitari
os
1459663.8795.2Secundaria
22531025.11127.9Sin estudios
/ primaria
TotalPoco / nada
Muy /bastante
ESPERADAS
Con nuestros datos, para calcular ji-cuadrado…Con nuestros datos, para calcular ji-cuadrado…
Habría que sumar:
El resultado (aprox.) es: 34.18
Tema B6. Tablas de contingencia
� Tenemos los elementos necesarios para una prueba de hipótesis
1. Las hipótesis
� H0: no existe asociación
� H1: existe asociación
2. Una prueba para comprobar la hipótesis
Tema B6. Tablas de contingencia
� Tenemos los elementos necesarios para una prueba de hipótesis
3. Podemos establecer una región de rechazo a partir de un determinado nivel de significación
Tenemos 2 columnas (2-1) = 1 y 3 filas (3-1) = 2 , luego 1*2=2 g.l.
Se suele emplear un nivel de significación de 0.05 (5%)
En la tabla ji-cuadrado (ver página siguiente) para estos grados de libertad y nivel de significación el valor límite de la región de rechazo (R.R.) es: 5.99
Tema B6. Tablas de contingencia
Tema B6. Tablas de contingencia
� Tenemos los elementos necesarios para una prueba de hipótesis4. Se puede comprobar si el valor obtenido
en la prueba ji-cuadrado pertenece a la región de rechazo.
En este caso el valor obtenido en la prueba de ji cuadrado es 34.18 que es mayor que el valor de ji-cuadrado obtenido en la tabla para un nivel de significación de 0.05 con dos grados de libertad (5.99). Es decir, 34.18 pertenece a la Región de Rechazo, por lo que rechazamos la hipótesis nula. 34.18 ϵ RR (0.05) χ2 > 5.99 por lo que rechazamos la H0 (hipótesis nula)
En el caso de los hombres existe asociación entre nivel educativo y considerarse atractivo con un nivel de significación del 5%. No obstante se ha de tener en cuenta que hubo un porcentaje de no respuesta del 6% (lo que ha podido sesgar la conclusión).
Tema B6. Tablas de contingencia
5. ¡Ojo! Para poder realizar la prueba ji-cuadrado se deben cumplir unos supuestos.� Cochram: un
máximo de un 20% de las celdas debe tener una frecuencia esperada entre 1 y 5
453220622470Total
820373.1446.9Universitari
os
1459663.8795.2Secundaria
22531025.11127.9Sin
estudios /
primaria
TotalPoco / nada
Muy /bastante
ESPERADAS
En el ejemplo, ninguna de las 6 celdas tiene menos de 5 casos.
La celda más pequeña cuenta con 373.1 casos
Se cumple el supuesto y por ello se puede calcular ji-cuadrado
Tema B6. Tablas de contingencia
� Problemas de ji-cuadrado� No indica la dirección
de la asociación� Con ji-cuadrado no
podemos concluir que la gente con mayor nivel de estudios tiende a considerarse más atractiva (o lo contrario)
� No informa sobre el grado de asociación
� Coeficiente de Contingencia� Cálculo
� El coeficiente C (de contingencia) permite conocer el grado de asociación
Tema B6. Tablas de contingencia
� En el ejemplo:
� Problemas del coeficiente de contingencia(C):
χ2= 34.18n= 4532Por tanto C= 0.087
Tema B6. Tablas de contingencia
� V de Cramer
� Cálculo
� Permite conocer el grado de asociación
χ2= 34.18n= 4532t = 1Por tanto V= 0.087
t representa el valor más pequeño de las dos cantidades r-1 o s-1, siendo r y s el número de columnas y de filas.
La ventaja de la V de Cramer es que su valor se sitúa entre 0 (asociación débil) y 1 (asociación fuerte).
CONCLUSIÓN: La asociación detectada entre nivel de estudios y sentirse atractivo, aunque significativa, no es fuerte (cercana a 0).
Medidas ordinales
� La explicación realizada hasta ahora es válida para tablas con variables nominales.
� Cuando trabajemos con datos de variables ordinales, podremos aplicar las medidas explicadas (ji-cuadrado, coeficiente de contingencia, V de Cramer) y las que se explican a continuación.
Tema B6. Tablas de contingencia
� Ejemplo de ejercicio
“En un estudio sobre movilidad social de un grupo de población se encontró la siguiente posición social (status) en las hijas en comparación con la posición social de las madres”.
6074142Bajo
96106118Medio
13611054Alto
AltoMedioBajoHijas\Madres
A partir de un ejemplo de García Ferrando (1992; 244-253)
Tema B6. Tablas de contingencia
� El primer paso es calcular los tipos de pares
1. El total de pares es:
896292290314Total
2766074142Bajo
32096106118Medio
30013611054Alto
TotalAltoMedioBajoHijas\Madres
n = 896 luego T = 400960 pares
Tema B6. Tablas de contingencia
2. A continuación se calculan los pares “semejantes o concordantes” (son aquellos pares en los que se produce un incremento tanto en la variable dependiente (posición de las hijas) como en la independiente (posición de las madres).
896292290314Total
2766074142Bajo
32096106118Medio
30013611054Alto
TotalAltoMedioBajoHijas\Madres
En el ejemplo hay 142 personas con madres con status bajo e hijas con status bajo, comparadas con las 106 hijas en posición media con madres de clase media se produce un incremento en ambas variables. Entre ambos grupos se producen 142*106 pares concordantes.
Tema B6. Tablas de contingencia
2. Pares “semejantes o concordantes” (Ns)
896292290314Total
2766074142Bajo
32096106118Medio
30013611054Alto
TotalAltoMedioBajoHijas\Madres El total de emparejamientos concordantes serían:
142 * (110+136+106+96)=63616
74 * (136+96)=17168
118 * (110+136)=29028
106 * (136)=14416
Ns= 63616+17168+29028+14416 = 124228
Tema B6. Tablas de contingencia
3. Pares “desemejantes o discordantes” (Nd)
El orden en una variable es opuesto al de la otra variable (cuando una se incrementa, la otra se reduce)
896292290314Total
2766074142Bajo
32096106118Medio
30013611054Alto
TotalAltoMedioBajoHijas\Madres El total de emparejamientos disconcordantes serían:
54 * (106+96+74+60)=18144
Nd= 6360+15812+17160+18144 = 57476
110 * (96+60)=17160
118 * (74+60)=15812
106 * (60) = 6360
Tema B6. Tablas de contingencia
4. Pares empatados (en la variable independiente) (Tx)
Están empatados en la variable independiente (x) (status de las madres)
896292290314Total
2766074142Bajo
32096106118Medio
30013611054Alto
TotalAltoMedioBajoHijas\Madres
96 * (60)=5760
Tx= 14040+16756+19800+7844+21216+5760 = 85416
136 * (96+60)=21216
106 * (74)=7844
118 * (142)=16756
110 * (106+74)=19800
54 * (118+142)=14040
Tema B6. Tablas de contingencia
5. Pares empatados (en la variable dependiente) (Ty)
Están empatados en la variable dependiente (y) (status de las hijas)
896292290314Total
2766074142Bajo
32096106118Medio
30013611054Alto
TotalAltoMedioBajoHijas\Madres
74 * (60)=4440
Ty= 13284+14960+123836+10176+19028+4400 = 85724
142 * (74+60)=19028
106 * (96)=10176
110 * (136) =14960
118 * (106+96)=23836
54 * (110+136)=13284
Tema B6. Tablas de contingencia
6. Pares empatados en x e y (Txy)
Son pares que se forman a partir de casos situados en la misma celda de la tabla. Se calculan para cada celda de la tabla y se suman.
896292290314Total
2766074142Bajo
32096106118Medio
30013611054Alto
TotalAltoMedioBajoHijas\Madres
Txy= 48116
54 * (53) / 2 = 1431
110*109 / 2 = 5995
136*135 / 2 = 9180
118*117 / 2 = 6903
106*105 / 2 = 5565
96* 95 / 2 = 4560
142*141 / 2 = 10.011
74 *73 / 2 = 2701
60 *59 / 2 = 1770
Tema B6. Tablas de contingencia
� En resumenNs= 124228
Nd= 57476
Tx= 85416
Ty= 85724
Txy= 48116
T = 400960 pares
� Las medidas que vamos a utilizar tienen todas en el numerador la diferencia entre Ns y Nd� Si Ns – Nd < 0
asociación negativa� Si Ns – Nd > 0
asociación positiva� Si Ns – Nd cercano a
0 no habrá asociación� Ns – Nd = 124228 –
57476 = 66752 (por tanto sería una asociación positiva: a mayor status de las madres, mayor status de las hijas)
Tema B6. Tablas de contingencia
� Coeficiente Tau-a de Kendall
Ns= 124228
Nd= 57476
Tx= 85416
Ty= 85724
Txy= 48116
T = 400960 pares
Tau-a = 0.17
El coeficiente oscila entre -1 y +1, aunque no puede alcanzar un valor de 1 si hay pares empatados
Tema B6. Tablas de contingencia
� Coeficiente Gamma de Goodman y Kruskal
Ns= 124228
Nd= 57476
Tx= 85416
Ty= 85724
Txy= 48116
T = 400960 pares
Gamma = 0.37
El coeficiente oscila entre -1 y +1, incluso con pares empatados.
Se trata de una medida simétrica
Tema B6. Tablas de contingencia
� Coeficiente d de SomersNs= 124228
Nd= 57476
Tx= 85416
Ty= 85724
Txy= 48116
T = 400960 pares
d = 0.25
Interpretación similar a Gamma, pero no sobreestima la asociación al eliminar la influencia de los empatados en la dependiente
Se trata de una medida asimétrica (varía en función de cuál sea la variable dependiente e independiente) luego dyx diferente de dxy
Tema B6. Tablas de contingencia
� Coeficiente Tau-b de KendallNs= 124228
Nd= 57476
Tx= 85416
Ty= 85724
Txy= 48116
T = 400960 pares
Tb = 0.25
También toma valores entre -1 y 1 (si hay igual número de filas y columnas)
Se trata de una medida simétrica
Tema B6. Tablas de contingencia
� Interpretación de los resultados: conclusión� Tau-a = 0.17� Gamma = 0.37� d = 0.25� Tb = 0.25
Lectura descriptiva: Los resultados son positivos, luego la asociación es positiva: cuando mayor es el status en las madres, mayor status en las hijas), pero el grado de asociación no es muy alto.
Lectura inferencial: para realizar una lectura en términos de significación estadística de estos resultados habría que realizar pruebas estadísticas especificas (ver páginas 301 a 306 de García Ferrando, 1992). Los programas estadísticos como SPSS calculan directamente dichas pruebas proporcionando el valor de significación para la hipótesis nula de no asociación (se debe emplear la herramienta de tablas de contingencia).
Ejercicios Cuaderno de Ejercicios
Ejercicio básico 1 (5 puntos sobre 10)
� “En una encuesta realizada a población joven, se obtuvo la siguiente distribución de la identificación religiosa según el lugar de residencia”. ¿Existe asociación significativa entre identificación religiosa y lugar de residencia?. ¿Se trata de una asociación fuerte o débil?
3203560No creyente
66126212280Indiferente
62170290432Católico no practicante
80188305320Católico practicante
Metropolitano
UrbanoSemi-urbano
Rural
García Ferrando, 1992
Ejercicios Cuaderno de Ejercicios
Ejercicio básico 2 (5 puntos sobre 10)� “En un estudio sobre la movilidad
social de un grupo de población, se encontró la siguiente distribución de la movilidad social de los individuos estratificados según el grado de movilidad social de los padres. Las hipótesis del estudio se formuló en el sentido de que existe una asociación moderada entre la movilidad social de los individuos y la movilidad social de los padres. Mediante el cálculo del coeficiente Gamma, ¿qué cabe decir sobre dicha hipótesis? Si se considera la movilidad social de los padres como la variable independiente, calcular el coeficiente d de Somers”. Compara las interpretaciones
433139138156Total
130283468Baja
154465157Media
149655331Alta
TotalAltaMediaBajaHijos / Padres
García Ferrando, 1992: 258