Dr. Cristian Díaz VélezEpidemiólogo Clínico
Auditor Médico
Prueba de Hipótesis
Es el procedimiento que permite llegar aconclusiones acerca de una población a partirde la información que se obtiene de unamuestra seleccionada de esa población.
Se puede inferir a cerca de :
Parámetros poblacionales
Relaciones entre variables
Predicción de resultados
Cristian Díaz Vélez 3
Cristian Díaz Vélez 4
Estimación puntual: Es un solo valor numéricoutilizado para estimar el parámetrocorrespondiente de la población.
Estimación por intervalos : Consta de dos valoresnuméricos que definen un intervalo que, conun grado específico de confianza, incluye alparámetro por estimar.
Cristian Díaz Vélez 5
Se desea conocer los niveles de glicemia de los habitantes de un pueblo
Se tomo una muestra de sangre de cada habitante del pueblo
Se calcula el promedio y la desviación estándar
Cristian Díaz Vélez 6
Cristian Díaz Vélez 7
70
80
90
100
110
75
85
95
195
100
Nivel de glicemia
μ =100
σ = 35.6
Estimación puntual:
La glicemia promedio de
la población es 100 mg/dl
Estimación de intervalo:
El IC es igual a μ ± Z(σ /√n)
El IC: 100 ± 1.96 (35.6/ √100)
: (93 , 107)
Con una confianza de 95% el verdadero
valor de la glicemia promedio de los
habitantes se halla entre 93 a 107 mg/dl.
Es el intervalo que contiene con determinada confianza al valor del parámetro poblacional, que se desea estimar.
Cristian Díaz Vélez 8
XX - (Z(σ /√n) X + (Z(σ /√n)
Cristian Díaz Vélez 9
Intervalo de confianza
≠
Rango
Cristian Díaz Vélez 10
Cristian Díaz Vélez 11
Se sospecha que el Valor del Sodio sérico de lospacientes con Tuberculosis Miliar es diferente dela población general
Se sustenta esta suposición en la observación de 3 pacientes que tienen la concentración de sodio sérico menos de 140 meq/l.
El valor promedio observado de los tres pacientes fue 137.5 meq/l.
Cristian Díaz Vélez 12
Cristian Díaz Vélez 13
Los pasos solo son referenciales
No absolutos
1.- Establecer la Hipótesis (H0 y H1)
2.- Elección de la prueba estadística
3.- Nivel de significación
4.- Aplicación de la prueba
5.- Valor P
6.- La decisión
Cristian Díaz Vélez 14
Cristian Díaz Vélez 15
Las hipótesis estadísticas son expresadas como relación entre variables
Tradicionalmente se denomina:
Hipótesis Nula (H0), aquella que expresa que no hay diferencia
Hipótesis Alterna (H1), aquella que expresa que hay diferencia o asociación entre variables
Cristian Díaz Vélez 16
Ante la sospecha que el Valor del Sodio sérico de los pacientes con Tuberculosis Miliar es diferente de la población general. La hipótesis a evaluar :
H0: El nivel del sodio sérico en pacientes con tuberculosis miliar no difiere de la población general.
H1: El nivel del sodio sérico en pacientes con tuberculosis miliar difiere de la población general.
Cristian Díaz Vélez 17
Eficacia y seguridad del Tramadol
subcutáneo vs
endovenoso en el manejo del dolor
agudo post operatorio
en pacientes traumatológicos
18Cristian Díaz Vélez
La Eficacia y seguridad del Tramadol subcutáneo es igual al
endovenoso en el manejo del dolor agudo post operatorio
en pacientes traumatológicos
La Eficacia y seguridad del Tramadol subcutáneo es mayor al
endovenoso en el manejo del dolor agudo post operatorio
en pacientes traumatológicos
La Eficacia y seguridad del Tramadol subcutáneo es igual al
endovenoso en el manejo del dolor agudo post operatorio
en pacientes traumatológicos
La Eficacia y seguridad del Tramadol subcutáneo son diferentes
al endovenoso en el manejo del dolor agudo post operatorio
en pacientes traumatológicos
Contraste Unilateral
Contraste Bilateral
Nivel de significancia: 95%19Cristian Díaz Vélez
Supongamos que en estudio se obtuvo p = 0,03
Entonces es 3%, como se uso nivel de significancia 95% (p<0,05)
Vemos que el 3% (1,5% a cada lado de la cola) es menor de 5% y estaría
en el área sombreada.
Conclusión: Se rechaza la hipótesis nula, por lo tanto se acepta la hipótesis alterna
20Cristian Díaz Vélez
El “p” se interpreta
sobre la hipótesis
nula
Para tener en cuenta:
Cuanto más grande sea la diferencia entre lasdos variables, más fácil es demostrar que ladiferencia es significativa.
Cuanto más grande es el tamaño muestral másfácil es detectar diferencias entre los grupos.
21Cristian Díaz Vélez
Cristian Díaz Vélez 22
Existen más de 300 pruebas estadísticas básicas.
Hay dos clases de pruebas estadísticas: Lasparamétricas y las no paramétricas.
Cristian Díaz Vélez 23
Los valores de la variable dependiente sigan ladistribución de la curva normal en la muestra en la quese hizo la investigación.
Las varianzas de los grupos que se comparan en unavariable dependiente sean aproximadamente iguales(homogeneidad de las varianzas).
La variable dependiente esté medida en una escala quesea por lo menos de intervalo, aunque este últimorequisito no es compartido por todos los estadísticos.
Cuando los datos cumplen con los requisitos indicados,especialmente con los dos primeros, las pruebasestadísticas paramétricas exhiben su máximo poder.
Cristian Díaz Vélez 24
Las pruebas estadísticas no paramétricas, encambio, no hacen a los datos ninguna de lasexigencias que les hacen las pruebasestadísticas paramétricas; por eso se lesdenomina "pruebas estadísticas libres dedistribución".
Todas estas pruebas poseen menos poder quelas pruebas paramétricas correspondientes,pero han demostrado ser muy útiles comoalternativas cuando no se considera apropiadoel uso de pruebas paramétricas.
Cristian Díaz Vélez 25
Tipo:Categórica/cualitativaNumérica/cuantitativa
Escala:Categórica/cualitativa
Numérica/cuantitativa
Cristian Díaz Vélez 26
Nominal
Ordinal
Razón
Proporción
Intervalo
Categóricas nominales
Categóricas ordinales
Numéricas proporción
Numéricas razón
Cristian Díaz Vélez 27
Dicotómicas
Nominales ppd
Cuantitativas
Ordinales
Variable Dependiente Variable
Independiente
Prueba
Dicotómica Dicotómica z, Chi-2, Fisher
Dicotómica Nominal z, Chi-2, Metha-Patel
Dicotómica Ordinal Mann-Whitney /
Wilcoxon
Dicotómica Cuantitativa Regresión Logística
Nominal Dicotómica z, Chi-2, Metha-Patel
Nominal Cuantitativa Regresión Discriminante
Ordinal Nominal Kruskal-Wallis
Ordinal Cuantitativa Regresión Odds
Proporcional
Cuantitativa Dicotómica t de Student
Cuantitativa Nominal ANOVA
Cuantitativa Cuantitativa Regresión Lineal,
correlacionesCristian Díaz Vélez 28
Identificar una variable dependiente
Ninguna V. ind. Una V. ind. Más de una V. ind.
V. Dep.
Continua
V. Dep.
Ordinal
V. Dep.
Nominal
V. Dep.
Continua
V. Dep.
Ordinal
V. Dep.
Nominal
V. Dep.
Continua
V. Dep.
Ordinal
V. Dep.
Nominal
1 2 3 4 5 6 7 8 9
Para fines estadísticos una variable nominal solo se refiere a dos categorías de una
Característica. Si la característica tiene K categorías, se necesitan K-1 variables.
Cristian Díaz Vélez 29
V. Dependiente
Continua
1
Interés en la
posiciónInterés en la
dispersión
Media
T studentVarianza, DS
Chi2
Coef. Variación
T student
Cristian Díaz Vélez 30
2
Var. Depend.
Ordinal
Interés en la
posiciónInterés en la
dispersión
Mediana
Prueba de WillcoxonAmplitud
intercuartilica
Cristian Díaz Vélez 31
V. Dependiente
nominal
3
Interés en la
posición
Desenlace
común
Proporción Tasa
Aprox. Normal
Poisson
Desenlace
raro
Binomial Poisson
Si No
Cristian Díaz Vélez 32
V. Dependiente
Continua
4
Dif. Medias
T student
Análisis CorrelaciónRegresión lineal
Var. Indep
intencionada
Var. Indep
aleatoria
Interés en la
posiciónNo Si
T student
Prueba F
T student
Z de Fisher
Cristian Díaz Vélez 33
5
Var. Depend.
Ordinal
Var. Indep.
NominalVar. Indep
Ordinal
Mediana
Mann-Whitney
Coef. Correlación
Prueba Sperman
Cristian Díaz Vélez 34
6
Var. Depend.
Nominal
Var. Indep.
NominalVar. Indep.
Ordinal o continua
Datos
apareadosChi2 para
tendencia
Datos
Indep.
P. McNemar Dif. Medias
Chi2
Test Fisher
Cristian Díaz Vélez 35
7
Var. Depend.
Ordinal
Var. Indep.
NominalVar. Indep
Continua o nominal
ANOVA
Factorial
de una via
ANOVA
Medidas
repetidas
Var. Indep
aleatoria
Var. Indep.
continua
Datos
apareados
Datos
Indep.
Prueba F
Student
Prueba F
Student
Var. Indep
intencionada
Var. Indep
aleatoria
Var. Indep
intencionada
Análisis
Regresión
múltiple
Prueba F
F parcial
Análisis
Correlación
múltiple
Prueba F
F parcial
Análisis
Covarianza
(ANCOVA)
Análisis
Correlación
múltiple
Prueba F
F parcial
Prueba F
F parcial
Cristian Díaz Vélez 36
V. Dependiente
ordinal
8
Var. Indep
Nominal
Prueba
Kruskal-Wallis
Datos
Indep.
Datos
pareados
Prueba
Friedman
Cristian Díaz Vélez 37
9
Var. Depend.
Nominal
Var. Indep.
NominalVar. Indep
Continua o nominal
Análisis de
Tablas de vida
Análisis
estratificado
Dependiente
Del tiempo
No dependiente
Del tiempo.
Log-rank Mantel-Haenszel
chi2
Regresión
De Cox
Razón de
Máxima
probabilidad
Regresión
logística
Análisis
discriminante
Dependiente
Del tiempo
No dependiente
Del tiempo.
Razón de
Máxima
probabilidad
Razón de
Máxima
probabilidad
Cristian Díaz Vélez 38
Cristian Díaz Vélez 39
PRUEBAS DE
HIPOTESIS
PRUEBAS
PARAMETRICAS
NUMERO DE
GRUPOS
TIPO DE
VARIABLE
PRUEBAPRUEBAS NO
PARAMETRICAS
NUMERO DE
GRUPOS
TIPO DE
VARIABLE
PRUEBA
40
Número
de grupos
1 grupo
2 grupos
3 grupos
n > = 30
SiPrueba Z para la media
No
Distribución
normal
Prueba T para la media
Prueba del signo
para la mediana
Si
No
Independientes
Independientes
Sin > = 30
Prueba Z para la ≠ mediaSi
No Distribución
normal
Distribución
Normal c/varianzas
semejantes No
Si
ANVA Comparación de Ttos0
Prueba de krustal-Wallis-Comp Ttos
Si
No
Distribución
Normal c/varianzas
semejantes No
SiANVA en bloque Comparación de Ttos
Prueba de Friedman -Comp Ttos
Si
No
Varianzas
iguales
Prueba T
para ≠ de medias
Prueba T
Con ajustes de
g de libertad
Si
No
Prueba de Mann Whitney
para comparación de poblac
Non > = 30
Si
No
Prueba Z para la media
de la ≠ en datos apareados
Distribución
normal
Si
No
Prueba T para la media de
La ≠ en datos apareados
Prueba del signo ó de
Wilcoxon para datos apareados
41
Número
de grupos
1 grupo
2 grupos
3 grupos
Muestra grande
nP y n (1-P) > 5
Si
No
Independientes
Independientes
Si Frecuencias
Esperadas
pequeñas
Si
No
Frecuencias
Esperadas
pequeñas
Si
No
No
Prueba Z para la proporción poblacional
Prueba binomial p/ proporción poblacional
Prueba exacta de Fisher
Comparación de proporciones
Prueba Z o Prueba JI Cuadrado para
Comparación de proporciones
Si
No
Prueba de McNemar
Comparación de proporciones
Prueba JI Cuadrado (reunir categorías)
para comparación de proporciones
Prueba JI Cuadrado para
Comparación de proporciones
Prueba Q de Cochran
comparación de tratamientos42
Escala de
Medición
para
ambas
variables
Continua
Ordinal y/ó númerica
Nominal
Coeficiente de correlación lineal de Pearson
Cada variable
Tiene dos
Categorías
(tabla de 2x2)
Coeficiente de correlación por rangos de Spearman
Prueba JI Cuadrado (Coeficiente ǿ)
Riesgo relativo (Estudios de cohorte)
Odds ratio (Estudios de casos-control)
Coeficiente de concordancia Kappa
(Comparación de métodos)
Prueba de JI Cuadrado para independencia
de variables (Coeficiente de contingencia)
43
Cristian Díaz Vélez 44
Los valores críticos de los errores en los estudios del área biomédica:
Alfa () menor al 5%
Beta () menor al 20%
La confianza en 95% o más
La Potencia (1-β) 80% o más.
El tamaño de la muestra influye.
Cristian Díaz Vélez 45
Cristian Díaz Vélez 46
2.5%No
esperada
2.5%No
esperada
Población Esperada
Región de no rechazoR. Rechazo Ho R. Rechazo Ho
La confianza es de 95%, el error alfa se fija a lo mas en 5%.
De modo similar se fija la potencia del estudio en 80%, por tal el error beta es a lo mas 20%.
Cristian Díaz Vélez 47
La probabilidad de rechazar la hipótesis nula
cuando en realidad es verdadera y es la “p”,
por lo es un riesgo que asume el investigador
de equivocarse al rechazar la hipótesis nula,
cuando en realidad es cierta. Este riesgo se
establece normalmente en 0.05 ó 0.01
Por lo tanto “p” no es un indicador de fuerza
de la asociación ni de su importancia, sino
una probabilidad.
El error de tipo II consiste en aceptar la
hipótesis nula cuando es falsa y esto se
conoce como el error de tipo II o Beta (β ).
48Cristian Díaz Vélez
“Aceptar algo que es falso”
“Rechazar algo que en realidad es verdadero”
H0: El nivel del sodio sérico en pacientes con tuberculosis miliar no difiere de la población general.
H1: El nivel del sodio sérico en pacientes con tuberculosis miliar difiere de la población general.
Error α: Probabilidad de decir que el Sodio séricoes diferente en los pacientes con TBC miliarcuando en realidad son iguales.
Error β: Probabilidad de decir que el Sodio sérico es igual en los pacientes con TBC miliar cuando en realidad son diferentes.
Cristian Díaz Vélez 49
Probabilidad de aceptar la hipótesis alterna cuando realmente sea verdadera.
Probabilidad de rechazar la hipótesis nula cuando realmente sea falsa.
Cristian Díaz Vélez 50
1-β = Potencia
“Aceptar (hipótesis alterna)
algo que en realidad es
verdadero”
Probabilidad de rechazar la hipótesis alterna cuando realmente sea falsa.
Probabilidad de aceptar la hipótesis nula cuando realmente sea verdadera.
Cristian Díaz Vélez 51
1-α = Nivel de confianza
“Rechazar (hipótesis alterna)
algo que es falso”
Partimos con un nivel de confianza de 0,95 para la variable principal, es decir α = 0,05
Hipótesis: El nivel del sodio sérico enpacientes con tuberculosis miliar difiere de lapoblación general.
Análisis de subgrupos: Sexo, edad, nivel de instrucción.
Hipótesis: El nivel del sodio sérico enpacientes con tuberculosis miliar difiere de lapoblación general según sexo, edad.
0,95 x 0,95= 0,9025; α = 0,0975Cristian Díaz Vélez 52
53Cristian Díaz Vélez
Tolerancia de error ≠ Error tipo I
Cristian Díaz Vélez 54
Disponer de una teoría que guíe la investigación,evitando el "salir de pesca" con el ordenador buscandoasociaciones entre variables.
Disminuir el número de test estadísticos llevados acabo en el estudio.
Depurar la base de datos para evitar errores de valoresextremos que puedan producir hallazgos significativos.
Utilizar valores de “p” más reducidos (0.01 ó 0.001).
Reproducir el estudio. Si al reproducir el estudio seobtienen resultados similares, estaremos más segurosde no estar cometiendo el error de tipo I.
55Cristian Díaz Vélez
Incrementar el tamaño de la muestra.
Estimar el poder estadístico del estudio.
Incrementar el valor de “p”.
Utilizar test paramétricos (más potentes) enlugar de test no paramétricos.
56Cristian Díaz Vélez
Una vez descartado lo imposible, lo que queda, por improbable que parezca, debe ser la verdad.
Sir Arthur Conan Doyle (1859-1930)
58Cristian Díaz Vélez
El término "estadísticamente significativo"invade la literatura médica y se percibe comouna etiqueta que indicase "garantía de calidad".
Los test de hipótesis son test de significaciónestadística.
59Cristian Díaz Vélez
La significancia estadística viene dada por el nivel de Significancia que nos trazamos inicialmente.
- Un nivel de significancia del 95% llevaimplícito una p < de 0,05
- Y nivel de significancia del 99% lleva implícitauna p < 0,01.
En conclusión: cuanto más estadísticamentesignificativo sea, es menos probable de cometerel error tipo I.
Al el error tipo I el error tipo II
60Cristian Díaz Vélez
61Cristian Díaz Vélez
Disponemos de 2 tratamientos (A y B). Eltratamiento A lo reciben 25 pacientes y eltratamiento B otros 25 pacientes. 15 pacientesresponden favorablemente al tratamiento A y20 al tratamiento B. ¿Existe diferenciasignificativa entre ambos tratamientos?
Ho (hipótesis nula) = No hay diferencia entreambos tratamientos.Ha (hipótesis alternativa) = Sí existe diferenciaentre ambos tratamientos.
Nivel de significancia: 95%62Cristian Díaz Vélez
p : 0,20
Si ahora la muestra es de 900 pacientes por grupo, se tiene que:
p : 0,043
Por lo tanto los valores de la "p“ deben ser considerados solo como una guía
y no como base de conclusiones definitivas e irrevocables.
63Cristian Díaz Vélez
64Cristian Díaz Vélez
Poder estadístico o potencia estadística.
Es el complemento del error tipo II (1-β).
Es la probabilidad de rechazar la hipótesis nula cuando es realmente falsa o Probabilidad de aceptar la hipótesis alterna cuando realmente es verdadera.
Representa la capacidad de un test paradetectar como estadísticamente significativasdiferencias o asociaciones de una magnituddeterminada.
65Cristian Díaz Vélez
El tamaño del efecto a detectar:
> tamaño del efecto relevancia clínica.
> probabilidad hallazgos significativos
> poder estadístico.
Variabilidad:
A mayor variabilidad
< probabilidad obtener diferencias
< poder estadístico.
66Cristian Díaz Vélez
El tamaño de la muestra:> muestra> potencia estadística.
El nivel de significación estadística.valor α poder estadístico
Es decir, si disminuimos la probabilidad de cometer un errorde tipo I aumentamos simultáneamente la probabilidad de unerror de tipo II (por lo tanto disminuye la potencia), por loque se trata de encontrar un punto de “equilibrio” entreambas.
Generalmente, se suele trabajar con un poder en torno al 80% o al 90%.
67Cristian Díaz Vélez
68Cristian Díaz Vélez
Cristian Díaz Vélez 69
Cristian Díaz Vélez
Para EVALUAR las hipótesis establecidas sedebe realizar un estudio.
Se toma una muestra de 35 pacientes contuberculosis miliar y se realizará el dosaje deNa+ sérico.
Entonces se comparará una muestra contra unapoblación con parámetros conocidos.
70
Cristian Díaz Vélez
n
xz
71
Con los valores obtenidos, se calcula elestadístico de prueba
Se trata de evaluar cuanto se asemejan losdatos a lo que teóricamente sería la distribuciónsi la hipótesis nula es verdadera
Cristian Díaz Vélez 72
Si se tomó una muestra de 35 individuos
Se sabe que en la población el sodio tiene una tipo Normal con = 140 meq/l, y = 2.5 meq/l.
¿Qué prueba estadística se usaría?
Cristian Díaz Vélez 73
n
xz
Cristian Díaz Vélez 74
138 - 140
Z = ---------------
2.5/ √35
Z = - 4,76
El valor de la prueba
para este ejercicio es
Z = -4,76
El promedio de Sodio
sérico en la muestra es
138 meq/l
Cristian Díaz Vélez 75
El valor p , es la probabilidad de que por azarobtengamos un resultado como el tenemos enfrente o mas extremo, asumiendo que no haydiferencia entre la población y la muestraestudiada.
Cristian Díaz Vélez 76
Cristian Díaz Vélez 77
-4
La probabilidad de obtener -4 ,7 o aun menos por Azar:0.0001
Cristian Díaz Vélez 78
P
P
Se rechaza H0: =140
Y se acepta H1: 140
138X
Cristian Díaz Vélez 79
Luego de obtener los resultados se pudocalcular el valor “p,” que es la probabilidad deun resultado tanto o mas extremo que el quehemos encontrado a base de nuestros datos.
Usualmente si cae en la región de rechazo (o pes menor que ) se rechaza H0
Cristian Díaz Vélez 80
Se tomo una muestra de 35 individuos contuberculosis miliar
El promedio de Sodio de la muestra resultó en138 meq/l
¿ 138 es diferente al de la población ?
Tenemos que establecer un criterio paradecidir si 138 es un valor esperado de lapoblación general o no.
¿ Cuales son los valores esperados ?
Cristian Díaz Vélez 81
Cristian Díaz Vélez 82
Ocurrió que el valor de Z es -4,7
Lo que corresponde a un valor de p = 0,0001
Dado que ese valor es menor que el valor alfa prefijado.
Se rechaza la hipótesis nula.
ACEPTAMOS LA HÍPOTESIS ALTERNA
Cristian Díaz Vélez 83
Cristian Díaz Vélez 84
Cristian Díaz Vélez 85