Test Exacto de Fisher
El contraste de homogeneidad mediante la prueba Chi-Cuadrado entre dos variables cualitativas (o también llamado contraste de independencia entre dos variables cualitativas) se basa en la comparación de las frecuencias obtenidas con las frecuencias esperadas.
La prueba exacta de Fisher está basada en la distribución exacta de los datos y no en aproximaciones asintóticas, y presupone que los marginales de la tabla de contingencia están fijos.
En general, cuando las frecuencias absolutas esperadas, en la gran mayoría de casillas o celdas son relativamente grandes (más de 5), se utiliza el estadístico Chi-Cuadrado para realizar el contraste mencionado.
•Cuando en un 20% de las casillas el valor esperado no es superior a 5, el estadístico anterior no es válido y generalmente se utiliza la prueba exacta de Fisher.•Habitualmente, la prueba exacta de Fisher es más conservadora que la prueba Chi-Cuadrado.•La prueba exacta de Fisher se aplica a variables dicotómicas
A continuación, se construyen todas las tablas de contingencia 2x2 posibles con celdas a’, b’, c’, d’, siendo 0 < a’ < mín{c1 , f1}, b’ = f1 –a’, c’ = c1 – a’ y d’ = f2 – c’. A partir de dichas tablas se calcula:
aa
ap'
'
Donde X! indica el factorial de X que se calcula como x·(x-1)·(x-2)·…·2·1,por ejemplo, 5!=5·4·3·2·1=120.
Test Exacto de Fisher
Para calcular el estadístico de contraste, se construye en primer lugar la tabla de contingencia de dimensiones 2x2 con las frecuencias absolutas observadas, con la notación siguiente:
B + - A
+ a b f1
- c d f2
c1 c2 n
El p-valor unilateral-izquierda es =
el p-valor unilateral-derecha es =
!'!'!'!'!
!!!! 2121' dcban
ccffpa
aa
ap'
'
y el p-valor bilateral resultante es:
aa pp
ap'
'
1720,0!18!19!4!1!42
!22!20!37!5'1
ap
0310,0!21!16!1!0!42
!22!20!37!5'0
ap
Ejemplo: A partir de la tablaF1 F2
C1 4 1 5C2 16 21 37
20 22 42
Calcular el valor p correspondiente al Test de Fisher:
1º Calculamos la tabla para a=0
entonces
2ºº Calculamos la tabla para a=1
entonces
F1 F2C1 0 5 5C2 20 17 37
20 22 42
F1 F2C1 1 4 5C2 19 18 37
20 22 42
3096,0!20!17!2!3!42
!22!20!37!5'3
ap
3440,0!19!18!3!2!42
!22!20!37!5'2
ap
3º Calculamos la tabla para a=2
entonces
4º Calculamos la tabla para a=3
Entonces
Para a=4 pa4=0,1253
Para a=5 pa5=0,0182
F1 F2C1 2 3 5C2 18 19 37
20 22 42
F1 F2C1 3 2 5C2 17 20 37
20 22 42
9818,01253,03096,03440,01720,00310,0'
' aa
ap
a’ Pa’0 0.03101 0.17202 0.34403 0.30964 0.12535 0.0182
Los valores de P para cada a’
1745,00310,00182,01253,0'
' aa pp
ap
El valor p unil-izq.es:
El valor p bilateral es
1435,00182,01253,0'
' aa
apEl valor p unil-der.es:
Coeficiente de contingencia
Una forma de cuantificar el grado de asociación entre dos variables es calcular los coeficientes de asociación, particularmente aprenderemos el coeficiente de contingencia.
Es un valor que se encuentra entre cero y uno ,donde la cercanía a cero indica independencia entre las variables.
Matemáticamente el coeficiente de contingencia se define por :K
C
2
2
Donde k es la cantidad de celdas de la tabla de contingencia y
m
i i
ii
e
eo
1
22 )(
m = el número de filas por columnasoi = frecuencia absoluta observada en la celda i, ei = frecuencia absoluta esperada en la celda i ,si es que las variables fueran independientes.
Ejemplo:
En el caso de los fumadores en la tabla siguiente
Mujeres Hombres
Fumadores 65 (58) 80 (87)
No Fumadores 35 (42) 70 (63)
Los valores que aparecen sin paréntesis son las frecuencias absolutas observadas y los que aparecen con paréntesis son las frecuencias absolutas esperadas, según estos valores el coeficiente de contingencia es:
675,0435,3
35,3
C
ya que 35,363
)6370(
87
)8780(
42
)4235(
58
)5865( 22222
Este valor del coeficiente de contingencia refleja que existe cierto grado de asociación entre las variables, es decir que fumar depende del sexo de los individuos. ( El porcentaje de fumadores en el grupo del mujeres es mayor )
Prueba Test de Mc Nemar
Prueba no paramétrica para dos variables dicotómicas relacionadas.
Contrasta los cambios en las respuestas utilizando la distribución de chi-cuadrado.
Es útil para detectar cambios en las respuestas debidas a la intervención experimental en los diseños del tipo "antes-después“ o para comparar dos tipos de tratamiento.
Típicamente, un valor de significación menor que 0,05 se considera significativo, pero podemos establecer un nivel de significación distinto (0,01; 0,1….)
Matemáticamente el Estadístico de Mc Nemar se define por :cb
cbMN
22 )1(
En una tabla de contingencia:
B + - A
+ a b- c d
Nota: Para el valor p, se utiliza la Tabla de con 1 grado de libertad2
Ejemplo 1Se ejecutó la intervención educativa “Salud bucal” para modificar los conocimientos sobre higiene bucal en alumnos de tercer grado durante el primer semestre de 1998.
La tabla muestra los resultados obtenidos en conocimientos generales:Despues Inadecuado Adecuado
AntesInadecuado 14 102Adecuado 0 7
85120
10201
0120
)10102()1( 222
cb
cbMN
001,083,10852 pMN
Ejemplo 2En la tabla se muestra el Grado de variación de las respuestas subjetivas de dolor en el raquis entre test previo y test posterior a una intervención en grupos experimentales de primaria y secundariaGRUPOS EXPERIMENTALES CONTRASTE DE ASOCIACIÓN DE
RESPUESTASTEST PREVIO
No dolor Si dolor TOTALES
TEST No dolor 4 0 4 POSTERIOR Si dolor 5 14 19
Totales 9 14 23
2,35
16
50
)150()1( 222
cb
cbMN
05,084,32,32 pMN
Ejemplo 2En la tabla se muestra el Grado de variación de las respuestas subjetivas de dolor en el raquis entre test previo y test posterior a una intervención en grupos experimentales de BachilleratoGRUPOS EXPERIMENTALES CONTRASTE DE ASOCIACIÓN DE
RESPUESTASTEST PREVIO
No dolor Si dolor TOTALES
TEST No dolor 13 2 15 POSTERIOR Si dolor 10 9 19
Totales 23 11 34
08,412
49
102
)1102()1( 222
cb
cbMN
05,084,308,42 pMN
Se denomina riesgo a la probabilidad de ocurrencia de un
evento, típicamente enfermar, aunque también morir, curar, etc.(en la
terminología anglosajona se usan los términos risk y hazard, este
último especialmente si el evento es morir).
Se define el riesgo como la probabilidad de que un individuo,
libre de enfermedad y susceptible de ella, la desarrolle en un periodo
determinado, condicionada a que el individuo no muera a causa de otra
enfermedad durante el periodo.
Se usa el cociente entre el riesgo en el grupo con el factor y
el riesgo en el grupo de referencia como índice de asociación y se
denomina riesgo relativo (RR) o razón de proporciones.
RIESGO
En la tabla se representan esquemáticamente los resultados de un estudio que permita evaluar el RR, en la columna NR figuran los eventos (“casos o enfermos”: a) y los “no casos o controles” (c) en la categoría que no tiene el factor de Riesgo y en la columna R los de la categoría que sí tiene el factor.
NR R
Casos a b f0
No casos c d f1
Total C0 C1 0
1
0
1
ˆ
ˆˆ
cacb
R
RRR
A partir de la tabla
Características
• no tiene dimensiones
• rango de 0 a ∞
• RR=1 no hay asociación entre la presencia del factor y el evento.
•RR >1 la asociación es positiva, es decir si la presencia del factor se asocia a mayor ocurrencia del evento
•RR<1 la asociación es negativa.
Ejemplo
Y a partir de la tabla:
73,0138,0
101,0
3054420
3051307ˆ
ˆˆ
0
1
0
1 cacb
R
RRR
Placebo Tratamiento
Casos 420 307
No casos 2634 2744
Total 3054 3051
0
1
0
1
ˆ
ˆˆ
cacb
R
RRR
Existe otra manera, proveniente del mundo del juego, de representar
la probabilidad de ocurrencia de un evento y es mediante el cociente entre la
probabilidad de que ocurra el evento y la probabilidad de que no ocurra.
Este cociente, que en inglés se denomina odds y para el que no hay
una traducción española comúnmente aceptada, indica cuanto más probable
es la ocurrencia del evento que su no ocurrencia.
El odds ratio (OR) o razón de ventajas es el cociente entre el odds
en el grupo con el factor y el odds en el grupo sin el factor.
OR
NR R
Casos a b
No casos c d
Total C0 C1
El OR se calcula da
cb
cccacdcb
R
R
R
R
dsdo
dsdoRO
0
0
1
1
0
0
1
1
0
1
ˆ1
ˆ
ˆ1
ˆ
ˆ
ˆˆ
Características
• no tiene dimensiones
• rango de 0 a ∞ .
•OR=1 si no hay asociación entre la presencia del factor y el evento
•OR>1 si la asociación es positiva, es decir si la presencia del factor se asocia a mayor ocurrencia del evento y OR<1 si la asociación es negativa.
Ejemplo
El OR se calcula:
70,02744420
2634307ˆ
da
cbRO
Placebo Tratamiento
Casos 420 307
No casos 2634 2744
Total 3054 3051