Prueba de hipotesis - [Download PDF]

Dr. Cristian Díaz VélezEpidemiólogo Clínico

Auditor Médico

Prueba de Hipótesis

Es el procedimiento que permite llegar aconclusiones acerca de una población a partirde la información que se obtiene de unamuestra seleccionada de esa población.

Se puede inferir a cerca de :

Parámetros poblacionales

Relaciones entre variables

Predicción de resultados

Cristian Díaz Vélez 3

Cristian Díaz Vélez 4

Estimación puntual: Es un solo valor numéricoutilizado para estimar el parámetrocorrespondiente de la población.

Estimación por intervalos : Consta de dos valoresnuméricos que definen un intervalo que, conun grado específico de confianza, incluye alparámetro por estimar.

Cristian Díaz Vélez 5

Se desea conocer los niveles de glicemia de los habitantes de un pueblo

Se tomo una muestra de sangre de cada habitante del pueblo

Se calcula el promedio y la desviación estándar

Cristian Díaz Vélez 6

Cristian Díaz Vélez 7

70

80

90

100

110

75

85

95

195

100

Nivel de glicemia

μ =100

σ = 35.6

Estimación puntual:

La glicemia promedio de

la población es 100 mg/dl

Estimación de intervalo:

El IC es igual a μ ± Z(σ /√n)

El IC: 100 ± 1.96 (35.6/ √100)

: (93 , 107)

Con una confianza de 95% el verdadero

valor de la glicemia promedio de los

habitantes se halla entre 93 a 107 mg/dl.

Es el intervalo que contiene con determinada confianza al valor del parámetro poblacional, que se desea estimar.

Cristian Díaz Vélez 8

XX - (Z(σ /√n) X + (Z(σ /√n)

Cristian Díaz Vélez 9

Intervalo de confianza

≠

Rango

Cristian Díaz Vélez 10

Cristian Díaz Vélez 11

Se sospecha que el Valor del Sodio sérico de lospacientes con Tuberculosis Miliar es diferente dela población general

Se sustenta esta suposición en la observación de 3 pacientes que tienen la concentración de sodio sérico menos de 140 meq/l.

El valor promedio observado de los tres pacientes fue 137.5 meq/l.

Cristian Díaz Vélez 12

Cristian Díaz Vélez 13

Los pasos solo son referenciales

No absolutos

1.- Establecer la Hipótesis (H0 y H1)

2.- Elección de la prueba estadística

3.- Nivel de significación

4.- Aplicación de la prueba

5.- Valor P

6.- La decisión

Cristian Díaz Vélez 14

Cristian Díaz Vélez 15

Las hipótesis estadísticas son expresadas como relación entre variables

Tradicionalmente se denomina:

Hipótesis Nula (H0), aquella que expresa que no hay diferencia

Hipótesis Alterna (H1), aquella que expresa que hay diferencia o asociación entre variables

Cristian Díaz Vélez 16

Ante la sospecha que el Valor del Sodio sérico de los pacientes con Tuberculosis Miliar es diferente de la población general. La hipótesis a evaluar :

H0: El nivel del sodio sérico en pacientes con tuberculosis miliar no difiere de la población general.

H1: El nivel del sodio sérico en pacientes con tuberculosis miliar difiere de la población general.

Cristian Díaz Vélez 17

Eficacia y seguridad del Tramadol

subcutáneo vs

endovenoso en el manejo del dolor

agudo post operatorio

en pacientes traumatológicos

18Cristian Díaz Vélez

La Eficacia y seguridad del Tramadol subcutáneo es igual al

endovenoso en el manejo del dolor agudo post operatorio

en pacientes traumatológicos

La Eficacia y seguridad del Tramadol subcutáneo es mayor al

endovenoso en el manejo del dolor agudo post operatorio

en pacientes traumatológicos

La Eficacia y seguridad del Tramadol subcutáneo es igual al

endovenoso en el manejo del dolor agudo post operatorio

en pacientes traumatológicos

La Eficacia y seguridad del Tramadol subcutáneo son diferentes

al endovenoso en el manejo del dolor agudo post operatorio

en pacientes traumatológicos

Contraste Unilateral

Contraste Bilateral

Nivel de significancia: 95%19Cristian Díaz Vélez

Supongamos que en estudio se obtuvo p = 0,03

Entonces es 3%, como se uso nivel de significancia 95% (p<0,05)

Vemos que el 3% (1,5% a cada lado de la cola) es menor de 5% y estaría

en el área sombreada.

Conclusión: Se rechaza la hipótesis nula, por lo tanto se acepta la hipótesis alterna

20Cristian Díaz Vélez

El “p” se interpreta

sobre la hipótesis

nula

Para tener en cuenta:

Cuanto más grande sea la diferencia entre lasdos variables, más fácil es demostrar que ladiferencia es significativa.

Cuanto más grande es el tamaño muestral másfácil es detectar diferencias entre los grupos.

21Cristian Díaz Vélez

Cristian Díaz Vélez 22

Existen más de 300 pruebas estadísticas básicas.

Hay dos clases de pruebas estadísticas: Lasparamétricas y las no paramétricas.

Cristian Díaz Vélez 23

Los valores de la variable dependiente sigan ladistribución de la curva normal en la muestra en la quese hizo la investigación.

Las varianzas de los grupos que se comparan en unavariable dependiente sean aproximadamente iguales(homogeneidad de las varianzas).

La variable dependiente esté medida en una escala quesea por lo menos de intervalo, aunque este últimorequisito no es compartido por todos los estadísticos.

Cuando los datos cumplen con los requisitos indicados,especialmente con los dos primeros, las pruebasestadísticas paramétricas exhiben su máximo poder.

Cristian Díaz Vélez 24

Las pruebas estadísticas no paramétricas, encambio, no hacen a los datos ninguna de lasexigencias que les hacen las pruebasestadísticas paramétricas; por eso se lesdenomina "pruebas estadísticas libres dedistribución".

Todas estas pruebas poseen menos poder quelas pruebas paramétricas correspondientes,pero han demostrado ser muy útiles comoalternativas cuando no se considera apropiadoel uso de pruebas paramétricas.

Cristian Díaz Vélez 25

Tipo:Categórica/cualitativaNumérica/cuantitativa

Escala:Categórica/cualitativa

Numérica/cuantitativa

Cristian Díaz Vélez 26

Nominal

Ordinal

Razón

Proporción

Intervalo

Categóricas nominales

Categóricas ordinales

Numéricas proporción

Numéricas razón

Cristian Díaz Vélez 27

Dicotómicas

Nominales ppd

Cuantitativas

Ordinales

Variable Dependiente Variable

Independiente

Prueba

Dicotómica Dicotómica z, Chi-2, Fisher

Dicotómica Nominal z, Chi-2, Metha-Patel

Dicotómica Ordinal Mann-Whitney /

Wilcoxon

Dicotómica Cuantitativa Regresión Logística

Nominal Dicotómica z, Chi-2, Metha-Patel

Nominal Cuantitativa Regresión Discriminante

Ordinal Nominal Kruskal-Wallis

Ordinal Cuantitativa Regresión Odds

Proporcional

Cuantitativa Dicotómica t de Student

Cuantitativa Nominal ANOVA

Cuantitativa Cuantitativa Regresión Lineal,

correlacionesCristian Díaz Vélez 28

Identificar una variable dependiente

Ninguna V. ind. Una V. ind. Más de una V. ind.

V. Dep.

Continua

V. Dep.

Ordinal

V. Dep.

Nominal

V. Dep.

Continua

V. Dep.

Ordinal

V. Dep.

Nominal

V. Dep.

Continua

V. Dep.

Ordinal

V. Dep.

Nominal

1 2 3 4 5 6 7 8 9

Para fines estadísticos una variable nominal solo se refiere a dos categorías de una

Característica. Si la característica tiene K categorías, se necesitan K-1 variables.

Cristian Díaz Vélez 29

V. Dependiente

Continua

1

Interés en la

posiciónInterés en la

dispersión

Media

T studentVarianza, DS

Chi2

Coef. Variación

T student

Cristian Díaz Vélez 30

2

Var. Depend.

Ordinal

Interés en la

posiciónInterés en la

dispersión

Mediana

Prueba de WillcoxonAmplitud

intercuartilica

Cristian Díaz Vélez 31

V. Dependiente

nominal

3

Interés en la

posición

Desenlace

común

Proporción Tasa

Aprox. Normal

Poisson

Desenlace

raro

Binomial Poisson

Si No

Cristian Díaz Vélez 32

V. Dependiente

Continua

4

Dif. Medias

T student

Análisis CorrelaciónRegresión lineal

Var. Indep

intencionada

Var. Indep

aleatoria

Interés en la

posiciónNo Si

T student

Prueba F

T student

Z de Fisher

Cristian Díaz Vélez 33

5

Var. Depend.

Ordinal

Var. Indep.

NominalVar. Indep

Ordinal

Mediana

Mann-Whitney

Coef. Correlación

Prueba Sperman

Cristian Díaz Vélez 34

6

Var. Depend.

Nominal

Var. Indep.

NominalVar. Indep.

Ordinal o continua

Datos

apareadosChi2 para

tendencia

Datos

Indep.

P. McNemar Dif. Medias

Chi2

Test Fisher

Cristian Díaz Vélez 35

7

Var. Depend.

Ordinal

Var. Indep.

NominalVar. Indep

Continua o nominal

ANOVA

Factorial

de una via

ANOVA

Medidas

repetidas

Var. Indep

aleatoria

Var. Indep.

continua

Datos

apareados

Datos

Indep.

Prueba F

Student

Prueba F

Student

Var. Indep

intencionada

Var. Indep

aleatoria

Var. Indep

intencionada

Análisis

Regresión

múltiple

Prueba F

F parcial

Análisis

Correlación

múltiple

Prueba F

F parcial

Análisis

Covarianza

(ANCOVA)

Análisis

Correlación

múltiple

Prueba F

F parcial

Prueba F

F parcial

Cristian Díaz Vélez 36

V. Dependiente

ordinal

8

Var. Indep

Nominal

Prueba

Kruskal-Wallis

Datos

Indep.

Datos

pareados

Prueba

Friedman

Cristian Díaz Vélez 37

9

Var. Depend.

Nominal

Var. Indep.

NominalVar. Indep

Continua o nominal

Análisis de

Tablas de vida

Análisis

estratificado

Dependiente

Del tiempo

No dependiente

Del tiempo.

Log-rank Mantel-Haenszel

chi2

Regresión

De Cox

Razón de

Máxima

probabilidad

Regresión

logística

Análisis

discriminante

Dependiente

Del tiempo

No dependiente

Del tiempo.

Razón de

Máxima

probabilidad

Razón de

Máxima

probabilidad

Cristian Díaz Vélez 38

Cristian Díaz Vélez 39

PRUEBAS DE

HIPOTESIS

PRUEBAS

PARAMETRICAS

NUMERO DE

GRUPOS

TIPO DE

VARIABLE

PRUEBAPRUEBAS NO

PARAMETRICAS

NUMERO DE

GRUPOS

TIPO DE

VARIABLE

PRUEBA

40

Número

de grupos

1 grupo

2 grupos

3 grupos

n > = 30

SiPrueba Z para la media

No

Distribución

normal

Prueba T para la media

Prueba del signo

para la mediana

Si

No

Independientes

Sin > = 30

Prueba Z para la ≠ mediaSi

No Distribución

normal

Distribución

Normal c/varianzas

semejantes No

Si

ANVA Comparación de Ttos0

Prueba de krustal-Wallis-Comp Ttos

Si

No

Distribución

Normal c/varianzas

semejantes No

SiANVA en bloque Comparación de Ttos

Prueba de Friedman -Comp Ttos

Si

No

Varianzas

iguales

Prueba T

para ≠ de medias

Prueba T

Con ajustes de

g de libertad

Si

No

Prueba de Mann Whitney

para comparación de poblac

Non > = 30

Si

No

Prueba Z para la media

de la ≠ en datos apareados

Distribución

normal

Si

No

Prueba T para la media de

La ≠ en datos apareados

Prueba del signo ó de

Wilcoxon para datos apareados

41

Número

de grupos

1 grupo

2 grupos

3 grupos

Muestra grande

nP y n (1-P) > 5

Si

No

Independientes

Si Frecuencias

Esperadas

pequeñas

Si

No

Frecuencias

Esperadas

pequeñas

Si

No

Prueba Z para la proporción poblacional

Prueba binomial p/ proporción poblacional

Prueba exacta de Fisher

Comparación de proporciones

Prueba Z o Prueba JI Cuadrado para

Comparación de proporciones

Si

No

Prueba de McNemar

Comparación de proporciones

Prueba JI Cuadrado (reunir categorías)

para comparación de proporciones

Prueba JI Cuadrado para

Comparación de proporciones

Prueba Q de Cochran

comparación de tratamientos42

Escala de

Medición

para

ambas

variables

Continua

Ordinal y/ó númerica

Nominal

Coeficiente de correlación lineal de Pearson

Cada variable

Tiene dos

Categorías

(tabla de 2x2)

Coeficiente de correlación por rangos de Spearman

Prueba JI Cuadrado (Coeficiente ǿ)

Riesgo relativo (Estudios de cohorte)

Odds ratio (Estudios de casos-control)

Coeficiente de concordancia Kappa

(Comparación de métodos)

Prueba de JI Cuadrado para independencia

de variables (Coeficiente de contingencia)

43

Cristian Díaz Vélez 44

Los valores críticos de los errores en los estudios del área biomédica:

Alfa () menor al 5%

Beta () menor al 20%

La confianza en 95% o más

La Potencia (1-β) 80% o más.

El tamaño de la muestra influye.

Cristian Díaz Vélez 45

Cristian Díaz Vélez 46

2.5%No

esperada

2.5%No

esperada

Población Esperada

Región de no rechazoR. Rechazo Ho R. Rechazo Ho

La confianza es de 95%, el error alfa se fija a lo mas en 5%.

De modo similar se fija la potencia del estudio en 80%, por tal el error beta es a lo mas 20%.

Cristian Díaz Vélez 47

La probabilidad de rechazar la hipótesis nula

cuando en realidad es verdadera y es la “p”,

por lo es un riesgo que asume el investigador

de equivocarse al rechazar la hipótesis nula,

cuando en realidad es cierta. Este riesgo se

establece normalmente en 0.05 ó 0.01

Por lo tanto “p” no es un indicador de fuerza

de la asociación ni de su importancia, sino

una probabilidad.

El error de tipo II consiste en aceptar la

hipótesis nula cuando es falsa y esto se

conoce como el error de tipo II o Beta (β ).

48Cristian Díaz Vélez

“Aceptar algo que es falso”

“Rechazar algo que en realidad es verdadero”

H0: El nivel del sodio sérico en pacientes con tuberculosis miliar no difiere de la población general.

H1: El nivel del sodio sérico en pacientes con tuberculosis miliar difiere de la población general.

Error α: Probabilidad de decir que el Sodio séricoes diferente en los pacientes con TBC miliarcuando en realidad son iguales.

Error β: Probabilidad de decir que el Sodio sérico es igual en los pacientes con TBC miliar cuando en realidad son diferentes.

Cristian Díaz Vélez 49

Probabilidad de aceptar la hipótesis alterna cuando realmente sea verdadera.

Probabilidad de rechazar la hipótesis nula cuando realmente sea falsa.

Cristian Díaz Vélez 50

1-β = Potencia

“Aceptar (hipótesis alterna)

algo que en realidad es

verdadero”

Probabilidad de rechazar la hipótesis alterna cuando realmente sea falsa.

Probabilidad de aceptar la hipótesis nula cuando realmente sea verdadera.

Cristian Díaz Vélez 51

1-α = Nivel de confianza

“Rechazar (hipótesis alterna)

algo que es falso”

Partimos con un nivel de confianza de 0,95 para la variable principal, es decir α = 0,05

Hipótesis: El nivel del sodio sérico enpacientes con tuberculosis miliar difiere de lapoblación general.

Análisis de subgrupos: Sexo, edad, nivel de instrucción.

Hipótesis: El nivel del sodio sérico enpacientes con tuberculosis miliar difiere de lapoblación general según sexo, edad.

0,95 x 0,95= 0,9025; α = 0,0975Cristian Díaz Vélez 52

53Cristian Díaz Vélez

Tolerancia de error ≠ Error tipo I

Cristian Díaz Vélez 54

Disponer de una teoría que guíe la investigación,evitando el "salir de pesca" con el ordenador buscandoasociaciones entre variables.

Disminuir el número de test estadísticos llevados acabo en el estudio.

Depurar la base de datos para evitar errores de valoresextremos que puedan producir hallazgos significativos.

Utilizar valores de “p” más reducidos (0.01 ó 0.001).

Reproducir el estudio. Si al reproducir el estudio seobtienen resultados similares, estaremos más segurosde no estar cometiendo el error de tipo I.

55Cristian Díaz Vélez

Incrementar el tamaño de la muestra.

Estimar el poder estadístico del estudio.

Incrementar el valor de “p”.

Utilizar test paramétricos (más potentes) enlugar de test no paramétricos.

56Cristian Díaz Vélez

Una vez descartado lo imposible, lo que queda, por improbable que parezca, debe ser la verdad.

Sir Arthur Conan Doyle (1859-1930)

58Cristian Díaz Vélez

El término "estadísticamente significativo"invade la literatura médica y se percibe comouna etiqueta que indicase "garantía de calidad".

Los test de hipótesis son test de significaciónestadística.

59Cristian Díaz Vélez

La significancia estadística viene dada por el nivel de Significancia que nos trazamos inicialmente.

- Un nivel de significancia del 95% llevaimplícito una p < de 0,05

- Y nivel de significancia del 99% lleva implícitauna p < 0,01.

En conclusión: cuanto más estadísticamentesignificativo sea, es menos probable de cometerel error tipo I.

Al el error tipo I el error tipo II

60Cristian Díaz Vélez

61Cristian Díaz Vélez

Disponemos de 2 tratamientos (A y B). Eltratamiento A lo reciben 25 pacientes y eltratamiento B otros 25 pacientes. 15 pacientesresponden favorablemente al tratamiento A y20 al tratamiento B. ¿Existe diferenciasignificativa entre ambos tratamientos?

Ho (hipótesis nula) = No hay diferencia entreambos tratamientos.Ha (hipótesis alternativa) = Sí existe diferenciaentre ambos tratamientos.

Nivel de significancia: 95%62Cristian Díaz Vélez

p : 0,20

Si ahora la muestra es de 900 pacientes por grupo, se tiene que:

p : 0,043

Por lo tanto los valores de la "p“ deben ser considerados solo como una guía

y no como base de conclusiones definitivas e irrevocables.

63Cristian Díaz Vélez

64Cristian Díaz Vélez

Poder estadístico o potencia estadística.

Es el complemento del error tipo II (1-β).

Es la probabilidad de rechazar la hipótesis nula cuando es realmente falsa o Probabilidad de aceptar la hipótesis alterna cuando realmente es verdadera.

Representa la capacidad de un test paradetectar como estadísticamente significativasdiferencias o asociaciones de una magnituddeterminada.

65Cristian Díaz Vélez

El tamaño del efecto a detectar:

> tamaño del efecto relevancia clínica.

> probabilidad hallazgos significativos

> poder estadístico.

Variabilidad:

A mayor variabilidad

< probabilidad obtener diferencias

< poder estadístico.

66Cristian Díaz Vélez

El tamaño de la muestra:> muestra> potencia estadística.

El nivel de significación estadística.valor α poder estadístico

Es decir, si disminuimos la probabilidad de cometer un errorde tipo I aumentamos simultáneamente la probabilidad de unerror de tipo II (por lo tanto disminuye la potencia), por loque se trata de encontrar un punto de “equilibrio” entreambas.

Generalmente, se suele trabajar con un poder en torno al 80% o al 90%.

67Cristian Díaz Vélez

68Cristian Díaz Vélez

Cristian Díaz Vélez 69

Cristian Díaz Vélez

Para EVALUAR las hipótesis establecidas sedebe realizar un estudio.

Se toma una muestra de 35 pacientes contuberculosis miliar y se realizará el dosaje deNa+ sérico.

Entonces se comparará una muestra contra unapoblación con parámetros conocidos.

70

Cristian Díaz Vélez

n

xz

71

Con los valores obtenidos, se calcula elestadístico de prueba

Se trata de evaluar cuanto se asemejan losdatos a lo que teóricamente sería la distribuciónsi la hipótesis nula es verdadera

Cristian Díaz Vélez 72

Si se tomó una muestra de 35 individuos

Se sabe que en la población el sodio tiene una tipo Normal con = 140 meq/l, y = 2.5 meq/l.

¿Qué prueba estadística se usaría?

Cristian Díaz Vélez 73

n

xz

Cristian Díaz Vélez 74

138 - 140

Z = ---------------

2.5/ √35

Z = - 4,76

El valor de la prueba

para este ejercicio es

Z = -4,76

El promedio de Sodio

sérico en la muestra es

138 meq/l

Cristian Díaz Vélez 75

El valor p , es la probabilidad de que por azarobtengamos un resultado como el tenemos enfrente o mas extremo, asumiendo que no haydiferencia entre la población y la muestraestudiada.

Cristian Díaz Vélez 76

Cristian Díaz Vélez 77

-4

La probabilidad de obtener -4 ,7 o aun menos por Azar:0.0001

Cristian Díaz Vélez 78

P

Se rechaza H0: =140

Y se acepta H1: 140

138X

Cristian Díaz Vélez 79

Luego de obtener los resultados se pudocalcular el valor “p,” que es la probabilidad deun resultado tanto o mas extremo que el quehemos encontrado a base de nuestros datos.

Usualmente si cae en la región de rechazo (o pes menor que ) se rechaza H0

Cristian Díaz Vélez 80