Seminario
description
Transcript of Seminario
Ene2.01
Seminario
A.PedromingoGSK Tres Cantos, Madrid
Métodos y estrategias para el
Cálculo del Tamaño MuestralCon el programa Ene 2.0
Lugar: Fecha:
Ene2.02
Necesidad del Cálculo del Tamaño Muestral
• Ensayo Clínico• Estudio Epidemiológico• Revisión de casos• Experimento • Estudio Observacional• Encuesta• Tesis• Recogida de Datos• Proyecto de investigación
Empieza con la necesidad de saber cuantos casos
Cualquier trabajo o estudio:
Una ojeada al exterior
Ene2.03
Un ejemplo diario
Ene2.04
Poblaciones vs. Muestras
++ + + ++ + ++
+++
+ + +++ + + ++ + ++
++ +
++ + + ++ + +++
+ +
Todos Subconjunto
Población Muestra
Ene2.05
Muestra
Poblaciones vs. Muestras representativas
Representativa
Aleatoria n suficiente
Población
Calidad Cantidad (TM)
Ene2.06
El tamaño de la muestra depende en primer lugar..
Que se va a estudiar
Objetivos y estructura del estudio
Como se va a medir
Cual es la variable principal
Diseño del estudio
Ene2.07
Contraste de hipótesis
Estimación de parámetros
Poblacionales
Cuál es la prevalencia de migraña en la población ...
Cuál es el promedio de las cifras de colesterol en la población infantil...
Cuál es el riesgo relativo de padecer retinopatía en los diabéticos tipo I frente a los tipo II ...
Podría un programa de vacunación reducir la mortalidad infantil en más de un 15% ...
Es diferente la eficacia analgésica de A en relación a B ...
Está asociada la microalbuminuria con las cifras de TA ...
Objetivos y estructura de estudios
Ene2.08
Estructura y variables en el programa Ene2.0
Ene2.09
Informaciónde la
muestra
Característicasde la
población
Estudios de Estimación por ICEstudios de Estimación por IC
Estadísticos
x s p OR
Parámetros
muestra población
Ene2.010
Estimación de proporcionesEstimación de proporciones
en donde:
K = Factor relacionado con la confianza (Tabla)
p1 = Previsión del resultado
w = Imprecisión (error) admisible en la estimación
Queremos estimar una proporción en una población de origen.¿Qué tamaño de la muestra deberíamos tomar?
211
2
w
)p(1pKn
Ene2.011
-w +w
Distribución del estadístico pi en el muestreoDistribución del estadístico pi en el muestreo
|pi
2
2
w
p)(1pKn
n
)p1(p 11
n
)p1(pKKw 11
Ene2.012
KNivel de
confianza
3,29 0,999
2,8 0,995
2,58 0,99
2,32 0,98
2,24 0,97
1,96 0,95
1,64 0,90
1,28 0,80
1,03 0,70
0,84 0,60
0,67 0,50
0,52 0,40
0,38 0,30
0,25 0,20
Valores de K y niveles de confianzaValores de K y niveles de confianza
Ene2.013
Ejercicio de estimación de proporcionesEjercicio de estimación de proporciones
Cuál es el mínimo de niños en edad escolar necesario para estimar la prevalencia de la dislexia
Ene2.014
Ejemplo 1Ejemplo 1
Cuál es el número de niños en edad escolar que es necesario analizar para estimar la prevalencia de la dislexia ?
• La estimación se hará con un nivel de confianza de 0,95
• Las expectativas sitúan los resultados en un 10%
• La imprecisión máxima aceptable es de ± 3%
Calcular el tamaño de la muestra n
niños3850,03
0,90 0,101,96
w
p)(1pKn
2
2
2
2
Estimación de proporciones
Ene2.015
El cálculo del TM esta basado en imponderables
Grado de generalización - CoberturaNivel de confianza de 0,95 (k=1,96)
Expectativas- Conocimiento previoLas expectativas son de un 10% de casos
Calidad admisible - RequerimientosLa imprecisión máxima aceptable es de ±3 %
2
2
w
p)(1pKn
. . pero cuantificables
Como se analizarán los datos, terminado el estudio?
Ene2.016
Ejemplo 1 - ResultadosEjemplo 1 - Resultados
Resultados :
385/39 niños disléxicos
Tamaño Muestral : 385Prevalencia: 10%
__________Mediante técnicas de Estimación:
I.C. al 95 % para la prevalencia : [7,3% - 13,3%]
Como se analizarán los datos, terminado el estudio?
El error es del orden del 3%
Que pasaría si la realidad es diferente de nuestras expectativas ?
Ene2.017
Ejemplo 2 - - SuposiciónEjemplo 2 - - Suposición
Que pasaría si la realidad es diferente de nuestras expectativas ?
La imprecisión aumenta con resultados hacia el 50%
Disléxicos Prev. Imprec.
4 0,01 0,01
19 0,05 0,02
39 0,10 0,03
77 0,20 0,04
116 0,30 0,05
Analizamos 385 sujetos y
¿Que pasaría si se toma otro TM ?
Ene2.018
SuposiciónSuposición¿Que pasaría si se toma otro TM ?
El TM condiciona la Imprecisión de la estimación
0
0,02
0,04
0,06
0,08
0,1
0,12
0 200 400 600 800 1000 1200 1400
Tamaño Muestral
Imp
reci
sió
n
0
0,02
0,04
0,06
0,08
0,1
0,12
0 200 400 600 800 1000 1200 1400
Tamaño Muestral
Imp
reci
sió
n
IC = 0,95 p = 10% w = 3%
Ene2.019
La imprecisión varia con el TM
Intervalos, errores y decimales exóticosLa justificación aposteriori
Ene2.020
Qué hacer cuando la población es finita
Corrección por N
En el ejemplo anterior de estimación de prevalencia de la
dislexia suponiendo:
N Poblacional= 425
n = 202
2
11
2
11
2
)p1(Kp)1N(w
N)p1(pKn´
Ejemplo 3Ejemplo 3
Ene2.021
Para un IC = 0,95 p = 10% w = 3%
Cómo varía la Fracción muestral en relación a NCómo varía la Fracción muestral en relación a N
N TM
10 10
100 80
425 202
800 260
1600 310
2500 333
5000 357
10000 370
25000 379
100000 383
500000 384
100000000 385
Ene2.022
La influencia del tamaño poblacional N sobre nLa influencia del tamaño poblacional N sobre n
IC = 0,95 p = 10% w = 3%
10
80
260
310333
357370379 383 384 385
202
0
50
100
150
200
250
300
350
400
450
1 10 100 1000 10000 100000 1000000 1E+07 1E+08
Población (N)
Tam
año
Mu
estr
al (
n)
Ene2.023
¿ Que Fracción de la población se debe elegir para que la muestra sea válida ?
La muestra absoluta es mas importante que la muestra relativa
Pregunta sin respuesta:Pregunta sin respuesta:
Ene2.024
Para un IC = 0,99 p = 15% w = 3%
Cómo varía la Fracción muestral en relación a NCómo varía la Fracción muestral en relación a N
N nFracción Muestral
10 10 100,00%
100 80 80,00%
425 202 47,53%
800 260 32,50%
1600 310 19,38%
2500 333 13,32%
5000 357 7,14%
10000 370 3,70%
25000 379 1,52%
100000 383 0,38%
500000 384 0,08%
100000000 385 0,00%
Ene2.025
Tabla resumen de fórmulas en la estimación de una...Tabla resumen de fórmulas en la estimación de una...
Proporción
Diferencia de Proporciones
Media
Diferencia de Medias
2
2211/2-12
g w
)p(1p)p(1pZn
2
112/12
w
)p(1pzn
2
22/1
2
w
zn
2
22/1
2
g
2zn
w
Ene2.026
Ejemplo 4Ejemplo 4Estimación de medias
Cuál es el número casos que es necesario analizar para estimar la media de la densidad ósea en mujeres posmenopáusicas (<55 años)
2
22/1
2
w
zn
Ene2.027
Ejemplo 4Ejemplo 4Estimación de medias
Cuál es el número casos que es necesario analizar para estimar la media de la densidad ósea en mujeres posmenopáusicas (<55 años)
• Las expectativas sitúan la media en 1050 mg/ml
• La imprecisión máxima aceptable es ± 25 mg/ml
• La estimación se hace con un nivel de confianza del 0,95
• La desviación típica se asume que es 100 mg/ml
Calcular el tamaño de la muestra n
6225
10096,1zn
2
22
2
22/1
2
w
Ene2.028
Ejemplo 4Ejemplo 4Estimación de medias en estratos
Cuál es el número casos que es necesario analizar para estimar la media de la densidad ósea en mujeres posmenopáusicas (<55 años)
2
22/1
2
w
zn
Cuál es el número casos que es necesario analizar para estimar la media de la densidad ósea en mujeres (56- 65 años)
Cuál es el número casos que es necesario analizar para estimar la media de la densidad ósea en mujeres (66-75 años)
Cuál es el número casos que es necesario analizar para estimar la media de la densidad ósea en mujeres (>75 años)
Calculado 4 vecesCalculado 4 veces
Ene2.029
CTM de medidas de efecto en epidemiologíaCTM de medidas de efecto en epidemiología
2211
2
2/1g p1
1
p
1
p1
1
p
1
w
zn
Odds Ratios
wORlogww e)eOR;eOR(IC
2
2
1
1
2
2/1g p
p1
p
p1
w
zn
wRRlogww e)eRR;eRR(IC
Riesgo relativo
)RR.inf.lim/RR(LnLnRRnimprecisiów
)OR.inf.lim/OR(LnLnORnimprecisiów
Ene2.030
Ejemplo 5Ejemplo 5Estimación de OR
Qué tamaño de muestra se necesitaría en cada uno de los grupos de un estudio de casos-controles para estimar el OR con un IC de 0,95
Se asume el OR es de 2 y que la proporción de expuestos entre los controles es de p1=0,30 y entre los casos es de p2=0,46
Estimación de una medida de asociación entre un factor de riesgo y una enfermedad
Ene2.031
Ejemplo 5Ejemplo 5Estimación de OR
Qué tamaño de muestra se necesitaría en cada uno de los grupos de un estudio casos-controles para estimar el OR con un IC de 0,95
Se asume el OR es de 2 y que la proporción de expuestos entre los controles es de p1=0,30 y entre los casos es de p2=0,46
No Exp. Exp. Total Prob
Controles 70 30 100 0,30
Casos 54 46 100 0,46
OR = a·d/b·c = 2
Estimar el OR con una imprecisión de ± 0,50
Lim. inf OR Lim. sup.
1,5 2 2,5
Ene2.032
Ejemplo 5Ejemplo 5 Estimación de OR
Qué tamaño de muestra se necesitaría en cada uno de los grupos de un estudio caso-control para estimar el OR con un NC de 0,95
Se asume el OR es de 2 y que la proporción de expuestos entre los controles es de p1=0,30 y entre los casos es de p2=0,46
Estimar el OR con una imprecisión ± 0,50
2876,0)5,1/2(Ln)ORinf.lim/OR(Lnw
40954,0
1
46,0
1
7,0
1
3,0
1
2876,0
96,12
gn
Ene2.033
Hasta ahora…Hasta ahora…
TM en estimaciones Estimación de Proporciones Como influye la longitud del intervalo de confianza Como influye la imprecisión Como influyen las expectativas Como influye el acertar Como influye el Tamaño poblacional El concepto de fracción muestral Estimación de medias Como influye la variabilidad Estratos y poblaciones TM en medidas de efecto TM en OR
Ene2.034
Contraste de hipótesis
Estimación de parámetros
Poblacionales
Cuál es la prevalencia de migraña en la población ...
Cuál es el promedio de las cifras de colesterol en la población infantil...
Cuál es el riesgo relativo de padecer retinopatía en los diabéticos tipo I frente a los tipo II ...
Podría un programa de vacunación reducir la mortalidad infantil en más de un 15% ...
Es diferente la eficacia analgésica de A en relación a B ...
Está asociada la microalbuminuria con las cifras de TA ...
Objetivos y estructura de estudiosObjetivos y estructura de estudios
3535
Cómo transformar Objetivos en Hipótesis
Cómo convivir con los riesgos de la experimentación
Cómo influye el espíritu de la investigación en los resultados
Tipos de variables y muestras
Introducción al Contraste de Hipótesis
¡La Hora de la decisión!
3636
Podemos reformular los objetivos de un estudio:
Ho: Los tratamientos A y B son iguales
H1: Los tratamientos A y B no son iguales
Ho: El descenso de la T.A. con X es <= 70 mmHg / mes
H1: El descenso de la T.A. con X es > 70 mmHg / mes
Riesgos en la decisión
Ho: Dos parámetros bioquímicos no están asociados
H1: Dos parámetros bioquímicos están asociados
Cómo transformar Objetivos en HipótesisCómo transformar Objetivos en Hipótesis
INTRODUCCION AL CONTRASTE DE HIPOTESIS
3737
REALIDAD
DECISION
Ho Verdadera Ho Falsa
OK
(1-alfa)
Riesgo alfa
F +
Error tipo I
Riesgo beta
F –
Error tipo II
OK
(1-Beta )
Poder
Ho No Rechazada
H0 Rechazada
H1 Aceptada
Antes del experimento
n = f (alfa, beta)
Cómo convivir con los riesgos de la experimentaciónCómo convivir con los riesgos de la experimentación
Riesgos inevitables pero asumibles
INTRODUCCION AL CONTRASTE DE HIPOTESIS
3838
INTRODUCCION AL CONTRASTE DE HIPOTESIS
Localización y medida de riesgosLocalización y medida de riesgos
3939
Cuantificación de los riesgos α y βCuantificación de los riesgos α y β
RIESGO Alfa / Nivel de significación: Probabilidad de aceptar H1 siendo falsa (F+)
RIESGO Beta:Probabilidad de aceptar (no rechazar) Ho siendo falsa (F-)
0,01 0,02 0,05
0,05 0,10 0,20
INTRODUCCION AL CONTRASTE DE HIPOTESIS
0,95 0,90 0,80
Beta
Poder
4040
ExploratorioBuscando Diferencias
Contraste Bilateral
PragmáticoBuscando Superioridad
Contraste Unilateral
E
n= f (Tipo de Contraste)
¿Cual es el espíritu de la Investigación?¿Cual es el espíritu de la Investigación?
E E E E E EN N N N N N
Ho H1 H1Ho
o o
INTRODUCCION AL CONTRASTE DE HIPOTESIS
4141
0.05
10,813,015,817,8
0,05
8,610,813,015,9
0.100,050,020,01
0,1
8,610,513,014,9
0,1
6,68,6
10,513,0
0,2
6,27,9
10,011,7
0,2
4,56,27,9
10,0
0.5
2,73,85,46,6
0,5
1,62,73,85,4
UnilateralBilateral
TABLA DE f (α, ß)
INTRODUCCION AL CONTRASTE DE HIPOTESIS
++
-- --
++
4242
Número de Grupos
Un grupo frente a Un grupo frente a un valor teóricoun valor teórico
Dos grupos Dos grupos experimentalesexperimentales
Variable Respuesta
DicotómicaDicotómicaComparar proporcionesComparar proporciones
ContinuaContinuaCompararemos mediasCompararemos medias
Caso 6 Caso 7
Caso 8 Caso 9
n = f (G,V)
Elementos de diseño: Grupos y tipo de Variable Respuesta Elementos de diseño: Grupos y tipo de Variable Respuesta
INTRODUCCION AL CONTRASTE DE HIPOTESIS
4343
Ejemplo 6Ejemplo 6Una proporción frente a un valor teóricoUna proporción frente a un valor teórico
Se quiere encontrar una diferencia (d) entre una proporción p2 (experimental) frente a una teórica 1
Se necesita fijar :
1) 1
2) Asumir p2 tal que ...
3) d = |p2 - 1| sea relevante
4) Alfa
5) Beta
6) Diferencia o superioridad (bi o uni)
DC
1 2
,fp2
p1p1n 2
12
2211
4444
Ejemplo 6. ResoluciónEjemplo 6. Resolución
Una proporción frente a un valor teóricoUna proporción frente a un valor teórico
La eficacia probada de un medicamento estándar es del 80% (teórico).Se intenta mostrar que un nuevo derivado es al menos un 10% mas eficaz.
Se conoce:1 = 0,80p2 = 0,90d = |0,90 - 0,80| = 0,1Alfa = 0,05Beta = 0,1Unilateral
1096,88,09,02
9,019,08,018,02
n
4545
Ejemplo 7Ejemplo 7Comparación de dos proporciones independientesComparación de dos proporciones independientes
Probar al menos una diferencia entre dos proporcionesexperimentales p1 y p2
Se necesita:1- Asumir un valor de p1
2- Asumir un valor de p2
3- Confirmar que |p1-p2| = d es relevante4- Alfa5. Beta6. Diferencia o superioridad (Bi o uni)
DC
1 2
,fpp
p1pp1pgrupo/n 2
21
2211
4646
Ejemplo 7. ResoluciónEjemplo 7. ResoluciónComparación de dos proporciones independientesComparación de dos proporciones independientes
Se piensa encontrar una diferencia significativa entre dos tratamientos contra la depresión: Verum y Placebo.
Se sabe que la eficacia del Placebo es del 60% y que la del Verum podría alcanzar un 80%
4747
Ejemplo 7. ResoluciónEjemplo 7. ResoluciónComparación de dos proporciones independientesComparación de dos proporciones independientes
Se piensa encontrar una diferencia significativa entre dos tratamientos contra la depresión: Verum y Placebo. Se sabe que la eficacia del Placebo es del 60% y que la del Verum podría alcanzar un 80%
Se conoce:p1 = 0,6p2 = 0,8d = | 0,8 - 0,6 | = 0,2Alfa = 0,05Beta = 0,20 ; Potencia = 0,80Bilateral
grupogrupon /829,72,0
2,08,04,06,0/
2
4848
n
Depende
Asunción ó Conocimiento
delFUTURO
+Diferencia Relevante
Aproximación a la
Experimentación
Uni, Bi
RIESGOS que se asumen
y
Comparación de dos proporciones
4949
Elección de
Único
Elevado
Caro
Muy Conservadora
Administración
Múltiples
Bajo
Barato
Conservadora
Promotor
0,01 0,05
Ensayo
Riesgo Terapéutico Tto. Exp.
Tto. experimental
Posición
Interesado
5050
Ejemplo 8Ejemplo 8
Una media frente a un valor estándarUna media frente a un valor estándar
Comparar una media x2 (experimental ) frente a una media teórica 1,
Se requiere:1- 1 2- Asumir que x2 hará que ...
3- d= |x2- 1 | = sea relevante4- 2 Desviación típica5- Alfa6- Beta7- Diferencia o superioridad (Bi o uni)
DC
1 2
),(fx
n 2
12
2
5151
Ejemplo 8Ejemplo 8Una media frente a un valor estándarUna media frente a un valor estándar
Se sabe que un antihipertensivo estándar reduce la TAD en 1 = 4 mmHg (Basal - 1ª hora).
Se intenta mostrar que un nuevo antihipertensivo puede reducir la TAD en al menos x2 = 4 mmHg.
Se estima que la es 6 mmHg.
Calcular n
Se sabe:1- 1 = 42- x2 = 83- d = | 8 - 4 | = 44- = 65- Alfa = 0,056- Beta = 0,10 Potencia =0,907- Unilateral
216,8
48
62
2
n
5252
Ejemplo 9Ejemplo 9
Comparación de dos mediasComparación de dos medias
Se desea encontrar una diferencia significativa, si existe, entre las medias de dos tratamientos x1 y x2
Se requiere:1- Media de x1 2- Media de x2
3- Asumir que... d= |x1- x2 | = sea relevante4- 2 = desviación típica5- Alfa6- Beta7- Diferencia o superioridad (Bi o uni)
),(
22
12
2
f
xxng
DC
1 2
5353
Se sospecha que podría existir una diferencia clínicamente relevante entre las medias de la concentración sérica de calcio con dos tratamientos en gestantes para prevenir la hipocalcemia neonatal: Dieta y Suplementos de Vitamina D.
Ejemplo 9Ejemplo 9Comparación de dos mediasComparación de dos medias
5454
Se sospecha que podría existir una diferencia clínicamente relevante entre las medias de la concentración sérica de calcio con dos tratamientos en gestantes para prevenir la hipocalcemia neonatal: Dieta y Vitamina D.
Calcular n, conociendo ...1- x1 = 9 mg/dl (Dieta)2- x2 = 9,5 mg/dl (Vit D)3- d = | 9,5 - 9 | = 0,5 mg/dl
4- = 1,8 mg/dl
5- Alfa = 0,056- Beta = 0,2 Potencia = 0,807- Bilateral
ggn 2059,75,99
8,122
2
Ejemplo 9Ejemplo 9Comparación de dos mediasComparación de dos medias
5555
Tabla de opciones n para el ejemplo anterior
5087 1273 205 52 24
1571 394 64 17 9
0,1 0,2 0,5 1 1,5
Diferencia esperada
Variabilidad= 1,8
= 1,0
Como influyen nuestras expectativas en el tamaño muestral
5656
n
EXPECTATIVAS
Asunción del
FUTURO
+
Dif. Relevante
Aproximación
a la
Experimentación
Uni, Bi
RIESGOS
que se
asumen
y
VARIABILIDAD
del
fenómeno
Depende
Comparación de dos medias
5757
n
EXPECTATIVASAsunción
delFUTURO
+Dif. Relevantes
Aproximación a la
ExperimentaciónUni, Bi
RIESGOS que se asumen
y
VARIABILIDAD del
fenómeno
… y además
% Pérdidas
% Equilibrio entre grupos
Depende
5858
Tabla de opciones n para el ejemplo anterior
128 158 205 292 511
511 292 205 158 128
20% 35% 50% 65% 80%
Proporción de la muestra en el grupo de referencia
Referencia
Experimental
Como influye el desequilibrio de los gruposen el tamaño muestral
Total 639 450 410 450 639
Los diseños balanceados requieren menor TM
5959
Tabla de opciones n para el ejemplo anterior
Como influye el desequilibrio de los gruposen el tamaño muestral
0
100
200
300
400
500
600
700
20% 25% 30% 35% 40% 45% 50% 55% 60% 65% 70% 75% 80%
% en grupo de referencia
n
n1
n2
suma
6060
El ejemplo diario no es tan terrible
6161
Interpretación de Beta
Es una probabilidad de error:
• Aceptar Ho siendo falsa
• Riesgo de Falso Neg. / Riesgo de 2ª Especie
* ⇒ n
* 0,05 0,20
* (1 - ) = Poder de la prueba
•Beta = es una medida de insensibilidad del experimento.
Cuantifica la incapacidad de detectar diferencias cuando
estas existen
6262
Que hacer cuando no hay suficiente información
1ª APROXIMACIÓN para el cálculo de n
* α = 0,05
* = 0,10
* Bilateral
* = ( máximo - mínimo) / 4
* Dif. Rel. = 1 ó ¾
* p = 0,5
* IC = 0,95
* w=p/5 ó p/10
Estimación Contraste
6363
Mas sobre el CTM….Mas sobre el CTM….
TM en Estimaciones Muestreo inverso Precisión a partir del TM TM en Contraste de hipótesis Muestras relacionadas Hipótesis de no inferioridad o equivalencia Curvas de potencia Tamaño del efecto Comparación de mas de dos medias Coeficientes de correlación Regresión logística Curvas de supervivencia
fin