Pruebas de hipótesis

¿Qué son las pruebas de hipótesis?

Hipótesis (formulación coloquial) Las mujeres fuman más que los hombres

Hipótesis (en términos estadísticos) La proporción de mujeres que fuman es

superior a la proporción de hombres que fuman

Observación Proporción de mujeres y hombres fumadores

en una muestra

)/()/( HFPMFP

¿Qué son las pruebas de hipótesis?

Decisión (prueba de hipótesis) Si las observaciones son compatibles con la

hipótesis (al menos dentro de un margen razonable), decidimos aceptar la hipótesis.

En caso contrario la rechazamos. La variabilidad de las muestras determina

que debamos utilizar métodos estadísticos que permitan una evaluación adecuada de los resultados.

Definiciones Tipos de hipótesis

En el caso anterior la hipótesis de que las mujeres fuman más que los hombres

conlleva una hipótesis complementaria

También podemos considerar la hipótesis de igualdad de proporciones (es decir que hombres y mujeres fuman por igual)

)/()/( HFPMFP

)/()/( HFPMFP

)/()/( HFPMFP

Definiciones Hipótesis nula

Una hipótesis restrictiva respecto a los parámetros

Hipótesis alternativa Indica una diferencia en un determinado sentido.

P.e.:)/()/( HFPMFP )/()/( HFPMFP

)/()/( HFPMFP

)/()/( HFPMFP

Definiciones Contraste de hipótesis

En función del problema que se quiere evaluar, se define una hipótesis nula (H0) y una alternativa (H1). P.e.:

La prueba de hipótesis consiste en evaluar si los resultados observados se separan significativamente de los esperados bajo la hipótesis nula.

)/()/(:1 HFPMFPH )/()/(:0 HFPMFPH

Ejemplo introductorio Supongamos que un determinado

laboratorio ha desarrollado un tratamiento que, según ellos, tiene una efectividad de un 70%.

En un ensayo clínico con 25 individuos observamos que sólo 15 mejoran (un 60%). ¿podemos concluir que la efectividad es menor del 70%? Si la efectividad es del 70% esperamos que

mejoren 17.5 pacientes.

Ejemplo introductorio

¿Es posible observar solo 15 mejoras en un grupo de 25 pacientes si la efectividad es del 70%?

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

0

0.025

0.05

0.075

0.1

0.125

0.15

0.175

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

Probabilidad de observarun número determinadode mejoras en un grupo de 25pacientes si P(M)=0.7(Distribución B(25, 0.7))



La probabilidad de que mejoren 15 pacientes de 25 cuando la efectividad del tratamiento es del 70% es:

Es decir, de cada 100 ensayos clínicos que realicemos, 9 tendrán un resultado de 15 mejoras. Este es un resultado que no es incompatible con el hecho de que la probabilidad de mejore sea 0.7.

092.03.07.015

25)15( 1015

XP



En una prueba de hipótesis calculamos cuál es la probabilidad de observar un resultado igual o peor al obtenido según lo que se espera de la hipótesis nula (grado de significación). Por lo tanto, en este caso calcularíamos:

Es decir, de cada 100 ensayos clínicos que realicemos, esperamos obtener un 19% de ensayos con 15 o menos mejoras si la efectividad es del 70%.

En este caso se interpreta que el resultado observado no se aleja significativamente de lo esperado según la hipótesis nula.

189.03.07.025

)15( 2515

0

ii

i iXP

Definiciones Estadístico de una prueba

Función muestral que permite evaluar si los resultados se comportan según lo esperado por la hipótesis nula Grado de significación

Probabilidad de haber obtenido un resultado igual al observado o más alejado que el observado según lo esperado por la hipótesis nula. Nivel de significación

Valor límite del grado de significación para considerar aceptable la hipótesis nula (en general se fija en 0.05). Región crítica

Fijado un nivel de significación, conjunto de resultados que llevan a rechazar la hipótesis nula Región crítica óptima

De todas la regiones críticas de un cierto nivel de significación, la región crítica óptima es el conjunto de resultados más probable cuando la hipótesis nula es falsa Potencia

Probabilidad de observar resultados de la región crítica cuando la hipótesis nula es falsa. La región crítica óptima es la que tiene más potencia para un cierto nivel de significación.

Ejemplo de región crítica Hipótesis: La efectividad (E) del tratamiento es inferior

al 70% Hipótesis estadísticas

Nivel de significación = 0.05. Debemos determinar un conjunto de resultados que tengan una probabilidad inferior a 0.05 si la hipótesis nula es cierta.

Estos resultados deben ser muy probables (potencia) si la hipótesis nula es falsa

Por lo tanto, como la alternativa es que la eficacia es inferior al 70%, resultados inferiores a un 70% de mejoras van en detrimento de la hipótesis nula.

7.0)(:

7.0)(:

1

0

EPH

EPH

Ejemplo de región crítica Región crítica:Si es cierta la hipótesis nula, entonces el

número de mejoras debe seguir una distribución binomial: B(n,0.7), siendo n el tamaño del grupo donde se evalúa la eficacia.

Para determinar la región crítica, buscaremos un valor x que cumpla

dado que un número bajo de mejoras va a favor de la alternativa propuesta.

Para n=25, este valor es

(como es una v.a. discreta no podemos obtener exactamente 0.05)

Por lo tanto, la región crítica queda definida por un número de mejoras igual o inferior a 13.

05.0)( xXP

044.0)13( XP

Utilización de la región crítica

Hemos visto, en el caso de n=25, que la región crítica corresponde a un número de mejoras igual o inferior a 13.

Por lo tanto, si observamos un número de mejoras igual o inferior a 13 rechazamos la hipótesis nula (ya que este suceso tiene una probabilidad baja, en este caso 0.044).

Si observamos un número de mejoras superior a 13, entonces diremos que los resultados no se desvían significativamente de lo esperado según la hipótesis nula.

El concepto de potencia La potencia de una región crítica es la probabilidad

de observar resultados dentro de dicha región cuando la hipótesis nula es falsa.

En el ejemplo que hemos estudiado, la potencia se calcularía como

Su valor depende del valor de P(E) (que si la hipótesis nula es falsa es inferior a 0.7).

1/13 HXP

El concepto de potencia

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7

0.2

0.4

0.6

0.8

1

0.7 0.04424650.6 0.2677180.5 0.6549810.4 0.9221990.3 0.9940060.2 0.9999240.1 1.

p P(X≤13)

El valor de la potencia, en el ejemplo indicado, depende de P(E)

p

P(X≤13)

El concepto de potencia Si en realidad P(E)=0.5, entonces

observaremos valores iguales o inferiores a 13 mejoras en un 65.5% de los ensayos que realicemos

Es decir, en un 34.5% de los ensayos el número de mejoras será superior a 13 y entonces aceptaremos la hipótesis nula (efectividad de un 70%) cuando es falsa.

Con 25 individuos, la potencia no es suficiente para asegurar que podemos diferenciar una eficacia del 50% y una eficacia del 70%.

Para aumentar la potencia debemos aumentar el número de individuos en el ensayo clínico.

0.7 0.04424650.6 0.2677180.5 0.6549810.4 0.9221990.3 0.9940060.2 0.9999240.1 1.

p P(X≤13)

El concepto de región crítica La potencia aumenta

al aumentar el tamaño muestral

Para n=50, la región crítica es (X≤29) con =0.048

Para n=100, la región crítica es (X≤62) con =0.053

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7

0.2

0.4

0.6

0.8

1

25

50100

El concepto de región crítica Para n=100, la región crítica

es (X≤62) con =0.053 Ahora, si P(E)=0.5, un 99%

de los ensayos producirán menos de 62 mejoras y rechazaremos la hipótesis nula

0.7 0.05304560.6 0.693190.5 0.9939840.4 0.9999970.3 1.0.2 1.0.1 1.

p P(X≤62)

El concepto de grado de significación Para la hipótesis nula que establece que la efectividad

es del 70%, la región crítica (X≤62) tiene un nivel de significación de 0.053 para muestras de 100 individuos.

Si en una muestra de 100 individuos observamos 58 mejoras, entonces rechazamos la hipótesis nula.

El grado de significación seria:

Es decir, el grado de significación corresponde a la probabilidad de haber obtenido un resultado igual al obtenido o más alejado que el obtenido según lo que se espera de la hipótesis nula.

007.0)/58( 0 HXP

El concepto de grado de significación Si el grado de significación de un resultado es inferior al

nivel de significación que se considere, entonces el resultado cae dentro de la región crítica.

En este sentido, el grado de significación permite conocer si el resultado observado es o no de la región crítica.

Por lo tanto, dado un nivel de significación , y un grado de significación p para un resultado:

0

0

HAceptar

HRechazar

p

p

Resumen En cada problema concreto debemos establecer la hipótesis

nula y la alternativa (unilateral o bilateral). Debemos determinar qué estadístico es el más adecuado

para evaluar la hipótesis (cada tipo de problema tiene un estadístico adecuado).

Debemos establecer la región crítica en función del nivel de significación considerado.

Una vez establecido, se determina si las observaciones caen o no dentro de la región crítica.

Si caen dentro de la región crítica, entonces se rechaza la hipótesis nula (las diferencias respecto a los resultados esperados son significativas). En caso contrario, se concluye que las diferencias entre las observaciones y lo esperado según la hipótesis nula no son significativas.

Es conveniente calcular el grado de significación del resultado.

Pruebas de hipótesis

Documents

Transcript of Pruebas de hipótesis