Pruebas de hipótesis
description
Transcript of Pruebas de hipótesis
Pruebas de hipótesis
¿Qué son las pruebas de hipótesis?
Hipótesis (formulación coloquial) Las mujeres fuman más que los hombres
Hipótesis (en términos estadísticos) La proporción de mujeres que fuman es
superior a la proporción de hombres que fuman
Observación Proporción de mujeres y hombres fumadores
en una muestra
)/()/( HFPMFP
¿Qué son las pruebas de hipótesis?
Decisión (prueba de hipótesis) Si las observaciones son compatibles con la
hipótesis (al menos dentro de un margen razonable), decidimos aceptar la hipótesis.
En caso contrario la rechazamos. La variabilidad de las muestras determina
que debamos utilizar métodos estadísticos que permitan una evaluación adecuada de los resultados.
Definiciones Tipos de hipótesis
En el caso anterior la hipótesis de que las mujeres fuman más que los hombres
conlleva una hipótesis complementaria
También podemos considerar la hipótesis de igualdad de proporciones (es decir que hombres y mujeres fuman por igual)
)/()/( HFPMFP
)/()/( HFPMFP
)/()/( HFPMFP
Definiciones Hipótesis nula
Una hipótesis restrictiva respecto a los parámetros
Hipótesis alternativa Indica una diferencia en un determinado sentido.
P.e.:)/()/( HFPMFP )/()/( HFPMFP
)/()/( HFPMFP
)/()/( HFPMFP
Definiciones Contraste de hipótesis
En función del problema que se quiere evaluar, se define una hipótesis nula (H0) y una alternativa (H1). P.e.:
La prueba de hipótesis consiste en evaluar si los resultados observados se separan significativamente de los esperados bajo la hipótesis nula.
)/()/(:1 HFPMFPH )/()/(:0 HFPMFPH
Ejemplo introductorio Supongamos que un determinado
laboratorio ha desarrollado un tratamiento que, según ellos, tiene una efectividad de un 70%.
En un ensayo clínico con 25 individuos observamos que sólo 15 mejoran (un 60%). ¿podemos concluir que la efectividad es menor del 70%? Si la efectividad es del 70% esperamos que
mejoren 17.5 pacientes.
Ejemplo introductorio
¿Es posible observar solo 15 mejoras en un grupo de 25 pacientes si la efectividad es del 70%?
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
0
0.025
0.05
0.075
0.1
0.125
0.15
0.175
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Probabilidad de observarun número determinadode mejoras en un grupo de 25pacientes si P(M)=0.7(Distribución B(25, 0.7))
Ejemplo introductorio
¿Es posible observar solo 15 mejoras en un grupo de 25 pacientes si la efectividad es del 70%?
La probabilidad de que mejoren 15 pacientes de 25 cuando la efectividad del tratamiento es del 70% es:
Es decir, de cada 100 ensayos clínicos que realicemos, 9 tendrán un resultado de 15 mejoras. Este es un resultado que no es incompatible con el hecho de que la probabilidad de mejore sea 0.7.
092.03.07.015
25)15( 1015
XP
Ejemplo introductorio
¿Es posible observar solo 15 mejoras en un grupo de 25 pacientes si la efectividad es del 70%?
En una prueba de hipótesis calculamos cuál es la probabilidad de observar un resultado igual o peor al obtenido según lo que se espera de la hipótesis nula (grado de significación). Por lo tanto, en este caso calcularíamos:
Es decir, de cada 100 ensayos clínicos que realicemos, esperamos obtener un 19% de ensayos con 15 o menos mejoras si la efectividad es del 70%.
En este caso se interpreta que el resultado observado no se aleja significativamente de lo esperado según la hipótesis nula.
189.03.07.025
)15( 2515
0
ii
i iXP
Definiciones Estadístico de una prueba
Función muestral que permite evaluar si los resultados se comportan según lo esperado por la hipótesis nula Grado de significación
Probabilidad de haber obtenido un resultado igual al observado o más alejado que el observado según lo esperado por la hipótesis nula. Nivel de significación
Valor límite del grado de significación para considerar aceptable la hipótesis nula (en general se fija en 0.05). Región crítica
Fijado un nivel de significación, conjunto de resultados que llevan a rechazar la hipótesis nula Región crítica óptima
De todas la regiones críticas de un cierto nivel de significación, la región crítica óptima es el conjunto de resultados más probable cuando la hipótesis nula es falsa Potencia
Probabilidad de observar resultados de la región crítica cuando la hipótesis nula es falsa. La región crítica óptima es la que tiene más potencia para un cierto nivel de significación.
Ejemplo de región crítica Hipótesis: La efectividad (E) del tratamiento es inferior
al 70% Hipótesis estadísticas
Nivel de significación = 0.05. Debemos determinar un conjunto de resultados que tengan una probabilidad inferior a 0.05 si la hipótesis nula es cierta.
Estos resultados deben ser muy probables (potencia) si la hipótesis nula es falsa
Por lo tanto, como la alternativa es que la eficacia es inferior al 70%, resultados inferiores a un 70% de mejoras van en detrimento de la hipótesis nula.
7.0)(:
7.0)(:
1
0
EPH
EPH
Ejemplo de región crítica Región crítica:Si es cierta la hipótesis nula, entonces el
número de mejoras debe seguir una distribución binomial: B(n,0.7), siendo n el tamaño del grupo donde se evalúa la eficacia.
Para determinar la región crítica, buscaremos un valor x que cumpla
dado que un número bajo de mejoras va a favor de la alternativa propuesta.
Para n=25, este valor es
(como es una v.a. discreta no podemos obtener exactamente 0.05)
Por lo tanto, la región crítica queda definida por un número de mejoras igual o inferior a 13.
05.0)( xXP
044.0)13( XP
Utilización de la región crítica
Hemos visto, en el caso de n=25, que la región crítica corresponde a un número de mejoras igual o inferior a 13.
Por lo tanto, si observamos un número de mejoras igual o inferior a 13 rechazamos la hipótesis nula (ya que este suceso tiene una probabilidad baja, en este caso 0.044).
Si observamos un número de mejoras superior a 13, entonces diremos que los resultados no se desvían significativamente de lo esperado según la hipótesis nula.
El concepto de potencia La potencia de una región crítica es la probabilidad
de observar resultados dentro de dicha región cuando la hipótesis nula es falsa.
En el ejemplo que hemos estudiado, la potencia se calcularía como
Su valor depende del valor de P(E) (que si la hipótesis nula es falsa es inferior a 0.7).
1/13 HXP
El concepto de potencia
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7
0.2
0.4
0.6
0.8
1
0.7 0.04424650.6 0.2677180.5 0.6549810.4 0.9221990.3 0.9940060.2 0.9999240.1 1.
p P(X≤13)
El valor de la potencia, en el ejemplo indicado, depende de P(E)
p
P(X≤13)
El concepto de potencia Si en realidad P(E)=0.5, entonces
observaremos valores iguales o inferiores a 13 mejoras en un 65.5% de los ensayos que realicemos
Es decir, en un 34.5% de los ensayos el número de mejoras será superior a 13 y entonces aceptaremos la hipótesis nula (efectividad de un 70%) cuando es falsa.
Con 25 individuos, la potencia no es suficiente para asegurar que podemos diferenciar una eficacia del 50% y una eficacia del 70%.
Para aumentar la potencia debemos aumentar el número de individuos en el ensayo clínico.
0.7 0.04424650.6 0.2677180.5 0.6549810.4 0.9221990.3 0.9940060.2 0.9999240.1 1.
p P(X≤13)
El concepto de región crítica La potencia aumenta
al aumentar el tamaño muestral
Para n=50, la región crítica es (X≤29) con =0.048
Para n=100, la región crítica es (X≤62) con =0.053
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7
0.2
0.4
0.6
0.8
1
25
50100
El concepto de región crítica Para n=100, la región crítica
es (X≤62) con =0.053 Ahora, si P(E)=0.5, un 99%
de los ensayos producirán menos de 62 mejoras y rechazaremos la hipótesis nula
0.7 0.05304560.6 0.693190.5 0.9939840.4 0.9999970.3 1.0.2 1.0.1 1.
p P(X≤62)
El concepto de grado de significación Para la hipótesis nula que establece que la efectividad
es del 70%, la región crítica (X≤62) tiene un nivel de significación de 0.053 para muestras de 100 individuos.
Si en una muestra de 100 individuos observamos 58 mejoras, entonces rechazamos la hipótesis nula.
El grado de significación seria:
Es decir, el grado de significación corresponde a la probabilidad de haber obtenido un resultado igual al obtenido o más alejado que el obtenido según lo que se espera de la hipótesis nula.
007.0)/58( 0 HXP
El concepto de grado de significación Si el grado de significación de un resultado es inferior al
nivel de significación que se considere, entonces el resultado cae dentro de la región crítica.
En este sentido, el grado de significación permite conocer si el resultado observado es o no de la región crítica.
Por lo tanto, dado un nivel de significación , y un grado de significación p para un resultado:
0
0
HAceptar
HRechazar
p
p
Resumen En cada problema concreto debemos establecer la hipótesis
nula y la alternativa (unilateral o bilateral). Debemos determinar qué estadístico es el más adecuado
para evaluar la hipótesis (cada tipo de problema tiene un estadístico adecuado).
Debemos establecer la región crítica en función del nivel de significación considerado.
Una vez establecido, se determina si las observaciones caen o no dentro de la región crítica.
Si caen dentro de la región crítica, entonces se rechaza la hipótesis nula (las diferencias respecto a los resultados esperados son significativas). En caso contrario, se concluye que las diferencias entre las observaciones y lo esperado según la hipótesis nula no son significativas.
Es conveniente calcular el grado de significación del resultado.