Download - Prueba Excacta de Fisher

Transcript

Test Exacto de Fisher

El contraste de homogeneidad mediante la prueba Chi-Cuadrado entre dos variables cualitativas (o también llamado contraste de independencia entre dos variables cualitativas) se basa en la comparación de las frecuencias obtenidas con las frecuencias esperadas.

La prueba exacta de Fisher está basada en la distribución exacta de los datos y no en aproximaciones asintóticas, y presupone que los marginales de la tabla de contingencia están fijos.

En general, cuando las frecuencias absolutas esperadas, en la gran mayoría de casillas o celdas son relativamente grandes (más de 5), se utiliza el estadístico Chi-Cuadrado para realizar el contraste mencionado.

•Cuando en un 20% de las casillas el valor esperado no es superior a 5, el estadístico anterior no es válido y generalmente se utiliza la prueba exacta de Fisher.•Habitualmente, la prueba exacta de Fisher es más conservadora que la prueba Chi-Cuadrado.•La prueba exacta de Fisher se aplica a variables dicotómicas

A continuación, se construyen todas las tablas de contingencia 2x2 posibles con celdas a’, b’, c’, d’, siendo 0 < a’ < mín{c1 , f1}, b’ = f1 –a’, c’ = c1 – a’ y d’ = f2 – c’. A partir de dichas tablas se calcula:

ap'

Donde X! indica el factorial de X que se calcula como x·(x-1)·(x-2)·…·2·1,por ejemplo, 5!=5·4·3·2·1=120.

Test Exacto de Fisher

Para calcular el estadístico de contraste, se construye en primer lugar la tabla de contingencia de dimensiones 2x2 con las frecuencias absolutas observadas, con la notación siguiente:

B + - A

+ a b f1

- c d f2

c1 c2 n

El p-valor unilateral-izquierda es =

el p-valor unilateral-derecha es =

!'!'!'!'!

!!!! 2121' dcban

ccffpa

ap'

y el p-valor bilateral resultante es:

aa pp

ap'

1720,0!18!19!4!1!42

!22!20!37!5'1

0310,0!21!16!1!0!42

!22!20!37!5'0

Ejemplo: A partir de la tablaF1 F2

C1 4 1 5C2 16 21 37

20 22 42

Calcular el valor p correspondiente al Test de Fisher:

1º Calculamos la tabla para a=0

entonces

2ºº Calculamos la tabla para a=1

entonces

F1 F2C1 0 5 5C2 20 17 37

20 22 42

F1 F2C1 1 4 5C2 19 18 37

20 22 42

3096,0!20!17!2!3!42

!22!20!37!5'3

3440,0!19!18!3!2!42

!22!20!37!5'2

3º Calculamos la tabla para a=2

entonces

4º Calculamos la tabla para a=3

Entonces

Para a=4 pa4=0,1253

Para a=5 pa5=0,0182

F1 F2C1 2 3 5C2 18 19 37

20 22 42

F1 F2C1 3 2 5C2 17 20 37

20 22 42

9818,01253,03096,03440,01720,00310,0'

' aa

a’ Pa’0 0.03101 0.17202 0.34403 0.30964 0.12535 0.0182

Los valores de P para cada a’

1745,00310,00182,01253,0'

' aa pp

El valor p unil-izq.es:

El valor p bilateral es

1435,00182,01253,0'

' aa

apEl valor p unil-der.es:

Coeficiente de contingencia

Una forma de cuantificar el grado de asociación entre dos variables es calcular los coeficientes de asociación, particularmente aprenderemos el coeficiente de contingencia.

Es un valor que se encuentra entre cero y uno ,donde la cercanía a cero indica independencia entre las variables.

Matemáticamente el coeficiente de contingencia se define por :K

Donde k es la cantidad de celdas de la tabla de contingencia y

i i

22 )(

m = el número de filas por columnasoi = frecuencia absoluta observada en la celda i, ei = frecuencia absoluta esperada en la celda i ,si es que las variables fueran independientes.

Ejemplo:

En el caso de los fumadores en la tabla siguiente

Mujeres Hombres

Fumadores 65 (58) 80 (87)

No Fumadores 35 (42) 70 (63)

Los valores que aparecen sin paréntesis son las frecuencias absolutas observadas y los que aparecen con paréntesis son las frecuencias absolutas esperadas, según estos valores el coeficiente de contingencia es:

675,0435,3

35,3

ya que 35,363

)6370(

)8780(

)4235(

)5865( 22222

Este valor del coeficiente de contingencia refleja que existe cierto grado de asociación entre las variables, es decir que fumar depende del sexo de los individuos. ( El porcentaje de fumadores en el grupo del mujeres es mayor )

Prueba Test de Mc Nemar

Prueba no paramétrica para dos variables dicotómicas relacionadas.

Contrasta los cambios en las respuestas utilizando la distribución de chi-cuadrado.

Es útil para detectar cambios en las respuestas debidas a la intervención experimental en los diseños del tipo "antes-después“ o para comparar dos tipos de tratamiento.

Típicamente, un valor de significación menor que 0,05 se considera significativo, pero podemos establecer un nivel de significación distinto (0,01; 0,1….)

Matemáticamente el Estadístico de Mc Nemar se define por :cb

cbMN

22 )1(

En una tabla de contingencia:

B + - A

+ a b- c d

Nota: Para el valor p, se utiliza la Tabla de con 1 grado de libertad2

Ejemplo 1Se ejecutó la intervención educativa “Salud bucal” para modificar los conocimientos sobre higiene bucal en alumnos de tercer grado durante el primer semestre de 1998.

La tabla muestra los resultados obtenidos en conocimientos generales:Despues Inadecuado Adecuado

AntesInadecuado 14 102Adecuado 0 7

85120

10201

0120

)10102()1( 222

cbMN

001,083,10852 pMN

Ejemplo 2En la tabla se muestra el Grado de variación de las respuestas subjetivas de dolor en el raquis entre test previo y test posterior a una intervención en grupos experimentales de primaria y secundariaGRUPOS EXPERIMENTALES CONTRASTE DE ASOCIACIÓN DE

RESPUESTASTEST PREVIO

No dolor Si dolor TOTALES

TEST No dolor 4 0 4 POSTERIOR Si dolor 5 14 19

Totales 9 14 23

2,35

)150()1( 222

cbMN

05,084,32,32 pMN

Ejemplo 2En la tabla se muestra el Grado de variación de las respuestas subjetivas de dolor en el raquis entre test previo y test posterior a una intervención en grupos experimentales de BachilleratoGRUPOS EXPERIMENTALES CONTRASTE DE ASOCIACIÓN DE

RESPUESTASTEST PREVIO

No dolor Si dolor TOTALES

TEST No dolor 13 2 15 POSTERIOR Si dolor 10 9 19

Totales 23 11 34

08,412

102

)1102()1( 222

cbMN

05,084,308,42 pMN

Se denomina riesgo a la probabilidad de ocurrencia de un

evento, típicamente enfermar, aunque también morir, curar, etc.(en la

terminología anglosajona se usan los términos risk y hazard, este

último especialmente si el evento es morir).

Se define el riesgo como la probabilidad de que un individuo,

libre de enfermedad y susceptible de ella, la desarrolle en un periodo

determinado, condicionada a que el individuo no muera a causa de otra

enfermedad durante el periodo.

Se usa el cociente entre el riesgo en el grupo con el factor y

el riesgo en el grupo de referencia como índice de asociación y se

denomina riesgo relativo (RR) o razón de proporciones.

RIESGO

En la tabla se representan esquemáticamente los resultados de un estudio que permita evaluar el RR, en la columna NR figuran los eventos (“casos o enfermos”: a) y los “no casos o controles” (c) en la categoría que no tiene el factor de Riesgo y en la columna R los de la categoría que sí tiene el factor.

NR R

Casos a b f0

No casos c d f1

Total C0 C1 0

ˆˆ

cacb

RRR

A partir de la tabla

Características

• no tiene dimensiones

• rango de 0 a ∞

• RR=1 no hay asociación entre la presencia del factor y el evento.