U2. DISEÑO Y ANÁLISIS DE ENSAYOS CLÍNICOS · DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS:...
-
Upload
trinhthien -
Category
Documents
-
view
255 -
download
0
Transcript of U2. DISEÑO Y ANÁLISIS DE ENSAYOS CLÍNICOS · DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS:...
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 1
U2. DISEÑO Y ANÁLISIS DE ENSAYOS CLÍNICOS
Albert Cobos: Doctor en Medicina. MSc Estadística Aplicada. Profesor de
Bioestadística. Departamento de Salud Pública. Facultad de Medicina.
Universidad de Barcelona.
1. INTRODUCCIÓN
Esta unidad está dedicada al diseño y análisis de ensayos clínicos (EC), entendidos
como experimentos realizados en humanos. Es importante advertir que el término EC
puede tener otras definiciones según el contexto (p.ej., desde un punto de vista legal,
un diseño no experimental (en el sentido metodológico de este término), puede ser
considerado ensayo clínico).
En tanto que experimentos, los EC pretenden establecer las consecuencias de un
tratamiento o intervención por comparación con una o más alternativas. Los términos
tratamiento e intervención se usan aquí como sinónimos, para designar cada una de
las condiciones experimentales evaluadas. Adviértase que, en este contexto, el
término tratamiento no implica necesariamente un procedimiento terapéutico: aunque
en muchos EC los tratamientos evaluados son efectivamente herramientas
terapéuticas (p.ej., un fármaco o una intervención quirúrgica), en algunos no lo son
(p.ej., intervenciones educativas, organizativas, diagnósticas, etc). Lo que distingue un
experimento de un estudio observacional es que es el investigador quien asigna los
tratamientos a las unidades experimentales, y lo hace con el propósito de evaluarlos.
Un importante complemento al texto de esta unidad es la guía CONSORT, cuya
lectura se considera obligada. Aunque se facilita una traducción de esta guía al
castellano publicada en Medicina Clínica, se aconseja al alumno interesado la lectura
de la versión larga publicada en Annals of Internal Medicine, que está disponible
libremente en el sitio web de la iniciativa CONSORT (véase el enlace al final de esta
unidad).
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 2
2. DISEÑO DE ENSAYOS CLÍNICOS
2.1. Objetivos confirmatorios y exploratorios
Al redactar un objetivo de investigación, hay que saber distinguir si éste es de
naturaleza confirmatoria o exploratoria. El objetivo será confirmatorio cuando se
pretenda demostrar una hipótesis formal pre-existente, casi siempre fundamentada en
resultados previos. En contraposición, el objetivo será exploratorio cuando no exista
conocimiento previo o éste sea indirecto (p.ej., se sospecha un posible efecto a partir
de argumentos fisiopatológicos, pero sin evidencia previa directa de tal efecto).
Es frecuente que los EC combinen un objetivo confirmatorio (el objetivo principal) con
otros exploratorios (los objetivos secundarios). De hecho, la insistencia en distinguir un
objetivo principal de otros secundarios está en gran medida motivada por la necesidad
de distinguir entre un objetivo confirmatorio, si lo hay (a veces se realizan EC
enteramente exploratorios, p.ej., un EC piloto para obtener estimaciones que permitan
diseñar adecuadamente un ensayo ulterior, posiblemente confirmatorio, o bien evaluar
la factibilidad de su realización), de otros exploratorios. La distinción entre el carácter
confirmatorio o exploratorio de un objetivo es de especial interés desde el punto de
vista metodológico, puesto que afecta a la fuerza con que se podrá establecer las
conclusiones, ya que el grado de evidencia que proporciona un resultado en favor de
una hipótesis, no es el mismo si este resultado era inesperado que si era esperado
hasta el punto de motivar el diseño y realización de un EC. Por ello, solo se
considerará que una hipótesis queda demostrada si, antes de realizar el análisis de los
datos, se estableció tanto la hipótesis como el criterio para decidir sobre su veracidad.
Esto requiere: 1) distinguir esta hipótesis de cualquier otro objetivo, 2) plantearla
formalmente (hipótesis alternativa de una prueba de hipótesis) y 3) qué resultados
permitirán darla por demostrada (estadístico empleado para resolver la prueba de
hipótesis y tamaño de la región critica o nivel de significación α).
2.2. Objetivos de superioridad, no-inferioridad o equivalencia
Durante mucho tiempo, los EC de medicamentos se diseñaron para demostrar que
cierto producto tiene una eficacia superior (diferente) a la de un placebo. Esto tenía
sentido cuando no existía ningún tratamiento demostradamente eficaz para una
enfermedad. Sin embargo, para muchas condiciones patológicas, disponemos
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 3
actualmente de un arsenal terapéutico considerablemente amplio, y cualquier nuevo
tratamiento que se proponga debería compararse, no con placebo, sino con el mejor
de los tratamientos disponibles. Ahora bien, un nuevo tratamiento puede ser
interesante porque es más eficaz que los anteriores, o porque, siendo tan eficaz como
los anteriores, tiene alguna otra ventaja, como ser más seguro, o administrarse de
forma más cómoda. En el primer caso, habrá que diseñar un ensayo para demostrar
superioridad del nuevo fármaco respecto al mejor de los disponibles hasta el
momento. Aunque estos ensayos utilizarán un control activo en lugar de un placebo,
su pretensión seguirá siendo la demostración de superioridad (lo que implica
diferente eficacia) respecto al control activo. En cambio, si la ventaja del nuevo
fármaco reside en su seguridad o en su facilidad de administración y no necesitamos
exigirle mayor eficacia para considerarlo interesante, surge entonces la necesidad de
demostrar, que su eficacia no es inferior (es no-inferior) que la del mejor tratamiento
disponible. Nótese que el concepto de no-inferioridad incluye dos posibilidades: la
superioridad del nuevo tratamiento respecto al anterior, y la equivalencia de ambos.
En algunos casos puede interesar demostrar equivalencia, en lugar de no-inferioridad.
Por ejemplo, cuando se cambia la formulación de un mismo principio activo (p.ej.,
comprimidos en lugar de suspensión oral) se considera innecesario demostrar la
eficacia terapéutica de la nueva formulación ya que el principio activo es el mismo. Sin
embargo, es necesario demostrar que la nueva formulación consigue alcanzar
concentraciones plasmáticas similares a la formulación anterior (biodisponibilidad
equivalente): en este caso podría ser tan indeseable que la nueva formulación
consiguiera una concentración plasmática inferior (porque la eficacia quedaría
comprometida), como superior (por riesgo de toxicidad), por lo que habrá que
demostrar que se alcanza una concentración plasmática equivalente.
Al redactar el objetivo principal de un EC (y, en general, cualquier objetivo de
investigación que involucre una comparación), es importante distinguir y explicitar, si
se pretende demostrar superioridad, no-inferioridad, o equivalencia de los tratamientos
comparados, porque esto tendrá implicaciones tanto en el análisis como en el diseño.
Por lo que hace referencia al análisis, la demostración de superioridad se satisface
mediante pruebas de hipótesis de homogeneidad con el planteamiento clásico de una
hipótesis nula de igualdad estricta; pero la demostración de no-inferioridad (o de
equivalencia) requiere la definición de un límite de no-inferioridad (o un intervalo de
equivalencia) y un planteamiento de las hipótesis nula y alternativa distinto del
tradicional, que se ilustra en la figura 2.1. Desde el punto de vista de la estimación, la
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 4
figura 2.2 muestra la forma en que se establecen las conclusiones, según cuál sea el
objetivo, a partir del intervalo de confianza de la diferencia entre tratamientos. En
cuanto a las implicaciones sobre el diseño, una de ellas es el diferente requerimiento
de tamaño muestral, debido a que las hipótesis formales son distintas para demostrar
superioridad, no-inferioridad o equivalencia.
2.3. Objetivos de seguridad
A menos que se haya diseñado con este objetivo principal, el EC no suele tener la
potencia necesaria para detectar problemas de seguridad de las intervenciones, salvo
en el caso de que se trate de problemas muy frecuentes (pero en tal caso es fácil que
ya se conozcan antes de hacer el EC). A pesar de ello, los EC diseñados para
demostrar eficacia o efectividad deben plantearse siempre la posibilidad de que las
intervenciones ocasionen problemas, por lo que deberían incluir un objetivo secundario
que evalúe la seguridad. De hecho, esto es un imperativo legal en los EC con
medicamentos.
2.4. Diseño experimental o configuración del EC
Por diseño esperimental o configuración del EC entendemos la forma en que se
organiza el experimento en lo referente a los tratamientos y a las unidades
experimentales (los sujetos). Como veremos, a los sujetos se les puede asignar un
tratamiento, una secuencia de tratamientos o una combinación de tratamientos.
Aunque existen muchos diseños experimentales diferentes, en investigación clínica se
tiende a utilizar un número limitado de ellos.
La configuración más utilizada en EC es la de grupos paralelos, en la que los distintos
tratamientos se asignan a pacientes diferentes, de modo que cada paciente recibe uno
sólo de los tratamientos del ensayo (figura 2.3). En este diseño, el número de
tratamientos a comparar determina el número de brazos o grupos de pacientes que
recibirán cada uno de ellos. El EC de dos grupos paralelos es posiblemente el más
frecuente de todos, pero es posible realizar EC paralelos con más de dos grupos (p.ej.,
los llamados gold standard trials, en que el tratamiento experimental se compara tanto
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 5
con un placebo como con un control activo; o los EC de búsqueda de dosis, en que
cada grupo recibe una dosis diferente de un mismo fármaco).
En algunos casos, es posible e interesante utilizar un diseño cruzado (crossover), en
que los pacientes se asignan a una secuencia de tratamientos con el propósito de
compararlos. En estos ensayos, cada paciente recibe más de un tratamiento en
sucesivos periodos. En cada periodo se administra uno de los tratamientos (p.ej, A en
el primero y B en el segundo) y se evalúa la respuesta a dicho tratamiento. Entre dos
periodos consecutivos se deja transcurrir cierto tiempo de lavado (wash-out) para
evitar que el tratamiento administrado en el primer periodo (p.ej., A) pueda influir en la
respuesta observada en el segundo (p.ej., B). Aunque puede haber otros más
complejos, el diseño cruzado más frecuente es el AB/BA (a veces llamado 2x2: 2
periodos x 2 tratamientos), en que algunos pacientes se asignan a la secuencia AB y
otros a la secuencia BA, con el fin de comparar los dos tratamientos A y B (figura 2.4).
El atractivo fundamental de los diseños cruzados es que son más eficientes que los
paralelos: requieren muchos menos individuos para conseguir la misma potencia. Sin
embargo no siempre son posibles (p.ej., cuando la indicación es reversible y el
tratamiento curativo, como en el caso de las infecciones, porque tras el primer periodo
ya no habrá nada que tratar); cuando son posibles, no siempre son interesantes (p.ej.
si los tratamientos deben prolongarse mucho en el tiempo antes de poder evaluar su
efecto; o si la enfermedad cursa por brotes muy espaciados en el tiempo); y cuando
son posibles e interesantes, tienen a pesar de todo la limitación de que las pérdidas
(pacientes que, por alguna razón abandonan tras el primer periodo) son más
problemáticas que en los ensayos paralelos. A pesar de estas limitaciones, en algunas
áreas son muy utilizados, como es el caso de los ensayos de bioequivalencia a los que
nos hemos referido en la sección anterior.
Los diseños factoriales tienen especial interés para evaluar, no sólo el efecto de
distintos tratamientos, sino también de su combinación, lo que permite estudiar
posibles fenómenos de interacción (sinergia o antagonismo). Para ello se asignan
distintas combinaciones de tratamientos a distintos pacientes (figura 2.5).
Los llamados diseños secuenciales, son en realidad EC paralelos en los que se
realizan análisis intermedios utilizando métodos de análisis especiales (que permitirían
incluso realizar un análisis tras cada nuevo paciente), adoptándose reglas para
interrumpir el EC en base a los resultados de los análisis intermedios.
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 6
2.5. Asignación de los tratamientos a los sujetos
Un punto crítico en los EC es la forma en que se asignan los tratamientos (en los EC
paralelos), las secuencias de tratamientos (en los EC cruzados) o las combinaciones
de tratamientos (en los EC factoriales). La asignación aleatoria o aleatorización
garantiza que la asignación será insesgada, y por ello se considera la forma más
segura de realizar la asignación, y la más comúnmente utilizada; así la mayoría de EC
son EC aleatorizados (ECA). Sin embargo, se han propuesto y utilizado
procedimientos alternativos a la aleatorización, algunos de los cuáles se comentan
más adelante en esta misma unidad. Dada la importancia de la aleatorización,
destinamos las siguiente secciones a ver cómo puede realizarse e implementarse
correctamente, y a comentar algunos procedimientos alternativos.
2.6. Asignación aleatoria
Para poder elaborar un plan de aleatorización es imprescindible conocer lo siguiente:
• El nº de tratamientos a comparar y el diseño experimental propuesto
• El nº de sujetos experimentales que se incluirán en el EC
La aleatorización de tratamientos, secuencias o combinaciones de tratamientos (según
proceda dada la configuración del EC) puede conseguirse mediante distintos
algoritmos. Algunos programas incluyen procedimientos altamente especializados para
generar planes de aleatorización (p.ej., PROC PLAN de SAS®). Sin embargo, muchos
otros programas (como las hojas de cálculo, o StatCrunch) incluyen rutinas de
generación de números aleatorios que pueden utilizarse para generar esquemas de
aleatorización.
El esquema de aleatorización más sencillo es el llamado esquema completamente aleatorizado, en el que cada unidad experimental se asigna aleatoriamente a uno de
los tratamientos (o secuencias, o combinaciones), con probabilidades de asignación
conocidas y constantes. Por ejemplo, en un ECA paralelo de dos tratamientos (A y B),
estas probabilidades podrían ser PA = PB = 0,5. En este caso diríamos que la razón de
asignación (allocation ratio) es 1:1. Alternativamente, podríamos optar por una razón
de asignación 3:1, y entonces PA = 0,75 y PB = 0,25. En general, es preferible utilizar
diseños equilibrados (esto es, con razón de asignación 1:1) porque son los que
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 7
maximizan la potencia para un número total dado de unidades experimentales. La
figura 2.6 muestra un esquema completamente aleatorizado para 10 unidades
experimentales asignadas a uno de dos tratamientos con razón de asignación 1:1, así
como un algoritmo que puede utilizarse para generarlo.
Nótese que el esquema completamente aleatorizado no garantiza el equilibrio perfecto
del número de unidades asignadas a cada alternativa (de hecho, en el ejemplo de la
figura 2.6 hay 6 B y 4 A). Por ello, es frecuente introducir una restricción en la
aleatorización que garantice el equilibrio en el número de unidades asignadas a las
distintas alternativas cada k pacientes (donde k es un múltiplo del número de
alternativas). El esquema resultante se denomina esquema de bloques aleatorizados, del que se muestra un ejemplo en la figura 2.7. La aleatorización por
bloques tiene la ventaja de que, no solo equilibra las unidades si se completa el
ensayo, sino que también evita desequilibrios si el EC se interrumpe prematuramente.
Además, en ensayos multicéntricos garantizará el equilibrio de tratamientos en los
distintos centros siempre que se asigne (cualquier número de) bloques completos a
cada centro.
Cuando se conoce un factor pronóstico importante, se puede considerar deseable que
los grupos de tratamiento queden equilibrados en cuanto a dicho factor pronóstico.
Esto puede conseguirse mediante la aleatorización estratificada, en la que se
prepara una lista de aleatorización (posiblemente, de bloques aleatorizados) para cada
nivel del factor pronóstico (p.ej., pacientes leves, pacientes moderados y pacientes
graves), y los pacientes se asignan utilizando la lista correspondiente al estrato al que
pertenecen.
En ocasiones, las intervenciones aleatorizadas no se asignan a pacientes de forma
individual, sino a grupos de pacientes; aunque la respuesta se evaluará en cada uno
de los pacientes individuales. Esto puede ocurrir por conveniencia logística (p.ej.,
fluoración de las aguas en comunidades) o para evitar contaminación entre
intervenciones (p.ej., intervenciones dirigidas a profesionales sanitarios). En estos
casos se utiliza el término de ensayos con aleatorización de grupos (group-
randomized trials o cluster-randomized trials). Las unidades de aleatorización suelen
constituir grupos naturales, como los habitantes de una comunidad, los niños de una
clase, los pacientes de un médico o de un centro de salud, etc. El hecho de aleatorizar
grupos de pacientes (en lugar de pacientes individuales) tiene implicaciones en el
diseño y en el análisis del ensayo. Una de las características de estos diseños es que
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 8
no se puede suponer la independencia de las observaciones porque suele existir un
efecto de grupo, de manera que dos individuos de un mismo grupo son más
parecidos entre sí que dos individuos de grupos distintos. Aunque este efecto sea muy
pequeño, puede tener un impacto importante en el análisis, por lo que no se puede
ignorar.
2.7. Alternativas a la asignación aleatoria
La importancia de la asignación aleatoria es generalmente reconocida, y existe evidencia
empírica de ella, pero este reconocimiento no es universal y se han propuesto
procedimientos alternativos a la aleatorización para asignar el tratamiento a los sujetos
de un EC.
Algunos críticos de la aleatorización defienden sistemas de asignación que tienden a
forzar el equilibrio (o a minimizar el desequilibrio) de factores pronósticos conocidos.
Dichos procedimientos se designan con el término de minimización, procedimiento que
se ilustra en el siguiente ejemplo. Supóngase un EC en el que se considera que existen
dos factores pronósticos importantes: el sexo y la administración concomitante de cierto
tratamiento T. La tabla A de la figura 2.8 muestra la distribución de estos factores cuando
se llevan reclutados 60 pacientes. Para asignar el tratamiento al paciente 61 se generan
unas puntuaciones de minimización (minimization scores) sumando de los marginales los
factores de riesgo en cada grupo de tratamiento, tal como se hace en la tabla B. El nuevo
paciente se asignará al grupo con menor puntuación, en la columna que corresponde a
sus características. Si, por ejemplo, se trata de un hombre que está en tratamiento con T,
utilizaríamos las puntuaciones de la primera columna, y asignaríamos el paciente al
grupo control. Naturalmente, este procedimiento no puede utilizarse para el primer
paciente de cada combinación de factores, cuya asignación debe aleatorizarse.
Asimismo, en caso de ligas (empates en las puntuaciones), se puede utilizar alguna regla
arbitraria (p.ej., asignar al grupo contrario al de la última decisión arbitraria) o aleatoria.
Aunque estos procedimientos pueden parecer atractivos, no proporcionan ventaja alguna
respecto de la aleatorización en relación con la validez del análisis de los datos. Sí
pueden proporcionar mayor eficiencia, aunque la ventaja se desvanece rápidamente al
aumentar el tamaño muestral. Por otra parte, la minimización tiene dos inconvenientes
potencialmente muy serios. El primero, la imposibilidad de realizar una aleatorización
oculta y de mantener el ciego (véase más adelante). El segundo, no existe base teórica
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 9
para realizar cierto tipo de análisis de los resultados (pruebas de aleatorización). Sin
embargo, no existe evidencia empírica sobre el alcance práctico de estos inconvenientes.
En los llamados diseños adaptativos, el tratamiento asignado a un paciente se
determina a partir de la respuesta obtenida en el paciente anterior. Por ejemplo, si fue
un éxito, se administra el mismo tratamiento y, si fue un fracaso, se administra el otro
tratamiento, generando secuencias de asignación como la que se muestra en la figura
2.9 (en este caso la asignación del i-ésimo paciente depende exclusivamente del
resultado del paciente i-1, desaprovechándose la información acumulada
anteriormente, pero podrían utilizarse otros procedimientos que aprovechan mejor la
información disponible). Debiera ser claro que este mecanismo de asignación tenderá
a favorecer la asignación del tratamiento con mayor probabilidad de éxito y esto puede
considerarse interesante desde el punto de vista ético. Sin embargo, no son factibles
más que en procesos agudos cuyo tratamiento sea muy corto, la respuesta inmediata
y dicotómica (éxito/fracaso), y el reclutamiento lento. Por añadidura, la aleatorización
oculta y el enmascaramiento son imposibles (véase más adelante).
2.8. Más sobre aleatorización
La aleatorización tiene dos ventajas fundamentales respecto de otros procedimientos
de asignación. La primera, es que garantiza un asignación insesgada, porque es
independiente de cualquier característica del individuo aleatorizado, y por tanto es
independiente de cualquier posible factor pronóstico, sea éste conocido o
desconocido. Esto no ocurre, por ejemplo, en la minimización. La segunda es que
proporciona el único argumento necesario para la validez cierto tipo de pruebas de
hipótesis llamado pruebas de aleatorización. Estas dos propiedades son suficientes a
juicio de muchos para preferir la aleatorización sobre cualquier otro procedimiento de
asignación.
No es raro, sin embargo, que las virtudes de la aleartorización se expresen de manera
poco acertada. Así, es frecuente la afirmación de que “la aleatorización garantiza el
equilibrio basal de los grupos”, cosa que no es cierta: es posible que dos grupos
aleatoriazados muestren cierto grado de desequilibrio en cuanto a alguna variariable
(de hecho, si el número de variables analizadas es suficientemente elevado, es
bastante probable que ocurra un desequilibrio marcado en alguna de ellas); más aún,
si se utiliza un esquema completamente aleatorizado, ni siquiera estará garantizado el
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 10
equilibrio en el tamaño de los grupos. En cualquier caso, ninguna de estas
posibilidades invalida la inferencia, a condición de que la aleatorización se haya hecho
correctamente.
Una correcta aleatorización implica dos cosas: 1) que el esquema de asignación
(también llamado lista o secuencia de aleatorización) se hay generado correctamente
(es decir, de forma realmente aleatoria) y 2) que una vez generada, se haya utilizado
correctamente. El primer punto se puede conseguir utilizando alguno de los algoritmos
presentados en secciones anteriores. El segundo se comenta en la siguiente sección.
2.9. Aleatorización oculta (concealed randomization)
La adecuada utilización de una lista de aleatorización no está garantizada por defecto
debido a que no siempre se comprende bien su importancia (véase p.ej., Martyn C,
1996). Por otra parte, las consecuencias de una aleatorización mal implementada
pueden ser nefastas, y existe evidencia empírica de su impacto sobre la estimación del
efecto tratamiento. Por ello es necesario velar por una utilización adecuada.
La eventualidad más frecuente que puede suponer sesgos en la asignación de
tratamientos debidos a una incorrecta implementación de un esquema de
aleatorización es el conocimiento del tratamiento que se asignará a un paciente, en el
momento de decidir su inclusión en el ensayo. Esto puede ocurrir en EC abiertos, si la
lista de aleatorización se facilita al investigador. Veamos como.
Supongamos que un investigador confía más en uno de los tratamientos de un EC que
en el otro. Por ejemplo, si T1 es nuevo y T2 es un tratamiento cuya eficacia es
conocida desde hace tiempo, un investigador puede confiar en T2 pero tener lógicas
reservas con T1. Supongamos que él sabe que se asignará T1 al primer paciente
incluido en el EC. Se le presenta un caso que cumple los criterios de inclusión. Si se
trata de un caso grave, puede que el investigador decida no incluirlo en el EC, porque
se le asignaría T1 y no está seguro de que vaya a funcionar. En cambio, si el caso es
leve, puede que no tenga tantos reparos y lo incluya. Esto puede suceder durante todo
el EC con consecuencias nefastas: los casos graves se derivarán sistemáticamente a
T2 y los leves a T1. Sólo por esta razón, puede que se observen mejores respuestas
con T1 que con T2.
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 11
El vicio de asignación que acabamos de ilustrar sólo puede evitarse si se toman las
medidas necesarias para que el investigador no pueda predecir el tratamiento que se
asignará a un paciente en el momento de decidir su inclusión. Cuando un
procedimiento de aleatorización se implementa con garantías de que, en el momento
de decidir la inclusión de un paciente, el investigador no podrá predecir el tratamiento
que se asignará, se dice que la aleatorización está oculta (concealed randomization).
Esto puede conseguirse centralizando la aleatorización (p.ej., aleatorización
telefónica).
Ahora hay que hacer notar algo muy importante. Si un procedimiento de asignación es
sistemático, por inofensivo que parezca (p.ej., día de nacimiento par o impar), permitirá
al investigador conocer el tratamiento que se asignará a un paciente en el momento de
decidir su inclusión y, en consecuencia, puede introducir sesgos de selección de
pacientes (esto es, una selección diferencial) por el mecanismo explicado
anteriormente. Recuerde que las apariencias engañan: un procedimiento de
asignación aparentemente inofensivo puede no serlo en absoluto.
2.10. Enmascaramiento
El enmascaramiento de los tratamientos consiste en adoptar medidas para evitar que
éstos sean reconocibles. Cuando se adoptan estas medidas decimos que se trata de
un EC enmascarado o ciego (blind). Cuando no se adoptan estas medidas y se
pueden reconocer cuál es el tratamiento administrado en cada caso, se dice que el EC
es abierto (open). Según alguno s autores, para que un EC pueda ser enmascarado,
debe ser también aleatorizado.
El enmascaramiento, que es muy frecuente en EC con medicamentos pero no tanto en
EC sobre otro tipo de intervenciones, pretende evitar que, una vez iniciado el EC,
variables extrañas desconocidas que son extrínsecas al individuo puedan introducir
diferencias entre los sujetos asignados a distintos tratamientos. Hay diversas razones
por las que esto puede ocurrir.
En primer lugar, los sujetos experimentales pueden actuar de modo distinto por el
hecho de saberse tratados con uno u otro tratamiento, especialmente si uno de ellos
es un placebo. Tanto la actitud del paciente frente al tratamiento (y su cumplimiento)
como la propia respuesta, pueden afectarse por el hecho de conocer el tratamiento
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 12
recibido. Esto último es particularmente probable en indicaciones como el dolor, en
que la respuesta es necesariamente subjetiva. El problema no se limita a los EC en
que se compara un tratamiento activo con un placebo. Cuando se compara un nuevo
tratamiento frente a uno estándar, el paciente puede tener prejuicio hacia cualquiera
de ellos y en cualquier sentido: hay pacientes que tienen más esperanzas en las
novedades terapéuticas, y pacientes con una actitud más conservadora y preferencia
hacia lo que es bien conocido.
En segundo lugar, el médico investigador que administra el tratamiento también
puede tener prejuicio. Si conoce el tratamiento asignado a cada paciente, puede
examinar más exhaustivamente a los pacientes tratados con el fármaco experimental.
Esto podría introducir diferencias en el modo de evaluar la respuesta. Por ejemplo, la
incidencia de acontecimientos adversos es muy dependiente de la insistencia en el
interrogatorio: mucha gente tiene ocasionalmente síntomas inespecíficos (náuseas,
mareo, cansancio, cefalea, etc.), pero la probabilidad de que lo declare durante una
visita médica depende de la insistencia con que se le pregunte. Además, el
investigador puede tener cierta tendencia (muchas veces inconsciente) a utilizar
medidas de apoyo terapéutico de forma distinta según el tratamiento que recibe el
paciente. Puede que frases como ‘sobre todo ¡cuide la dieta!’, ‘¿ya hace ejercicio?’ u
otras similares induzcan un distinto uso de medidas de apoyo según cual sea el
tratamiento asignado al paciente. También es posible que el entusiasmo del
investigador por uno de los tratamiento contagie al paciente y éste modifique su actitud
frente al mismo, por ejemplo mejorando la cumplimiento del tratamiento. Por último, no
debe menospreciarse la posibilidad de que ocurran fenómenos de heterosugestión: no
es lo mismo decir a un paciente ‘ya verá como con esta pastilla se le va el dolor
inmediatamente’ que decirle ‘vamos a probar con esta pastilla’.
Por último, la persona que realiza la evaluación del resultado (ya sea la misma que
administra el tratamiento, o no) juega un papel fundamental. Si la evaluación tiene un
componente de subjetividad (p.ej., gravedad de un eczema) o está sujeto a error de
medida (¡siempre presente en cierto grado!), puede también tener tendencia
inconsciente a evaluar mejor los casos sometidos al tratamiento en el que deposita
mayores esperanzas. Ante cualquier duda en la evaluación, puede tender a ‘redondear
hacia arriba’ en unos casos y ‘redondear hacia abajo’ en otros, sin darse cuenta que
está introduciendo una diferencia sistemática entre los sujetos sometidos a distinto
tratamiento.
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 13
Para evitar estas posibilidades (¡u otras en las que ni siquiera hayamos pensado!), es
muy recomendable que, quienes reciben, administran y evalúan el resultado de los
tratamientos, se mantengan ignorantes del que se utiliza en cada caso.
2.11. Dificultades con el enmascaramiento
La manera más sencilla de enmascarar los tratamientos farmacológicos es prepararlos
de forma que sean físicamente indistinguibles. Sin embargo, incluso en EC de
medicamentos, el enmascaramiento no siempre es posible, y muchas veces es difícil;
notablemente, cuando se trata de comparar dos sustancias activas (p.ej., comprimidos
en un caso y cápsulas entéricas o solución oral en el otro) y puede que sea imposible
preparar ambos principios activos de forma que tengan iguales propiedades
organolépticas (aspecto, olor, sabor). Aun siendo posible, a veces es insuficiente: si la
vía de administración (oral, i.m.) o la frecuencia de administración (od, bid) son distintas,
será fácil identificar qué tratamiento está tomando un paciente. En estos casos suele
recurrirse a una técnica denominada doble simulación (double dummy), que consiste en
preparar dos placebos, uno para cada tratamiento activo (T1 y T2), y administrar T1
activo + placebo de T2 a unos pacientes, y T2 activo + placebo de T1 a otros. De este
modo, todos los pacientes reciben aparentemente el mismo tratamiento (misma cantidad
de comprimidos, inyecciones, etc.).
Aunque la doble simulación es una estrategia útil en muchos casos, puede que sea
imposible aplicarla. Por ejemplo, en un EC en otitis media supurativa crónica se
comparaba dos tratamientos activos que se administran en forma tópica (gotas óticas).
Las soluciones tenían una apariencia diferente (color). El doble-dummy no era una
posibilidad porque la capacidad del conducto auditivo es limitada y además la solución
activa quedaría más diluida de lo debido.
Otro tipo de dificultad muy preocupante es que algunos tratamientos se delatan por sus
efectos indeseables. Por ejemplo, aunque los tratamientos se enmascaren perfectamente
(tanto para el paciente como para el investigador), en un EC para comparar la eficacia de
un IECA y un bloqueador de los canales del calcio en hipertensión, es posible que los
tratamientos se delaten: los primeros producen tos y los segundos edemas maleolares.
Cuando aparecen estos acontecimientos adversos, será fácil saber qué tratamiento se
está administrando. Casi todos los fármacos producen efectos indeseables (sobre todo,
si son realmente activos). Si la incidencia de estos efectos no es muy baja, el
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 14
enmascaramiento puede convertirse en algo utópico. En estas situaciones, puede ser
interesante investigar la efectividad del enmascaramiento, pidiendo al médico
investigador que, tras evaluar la respuesta de cada paciente, intente adivinar cuál había
sido el tratamiento administrado. Esto permite verificar si el enmascaramiento fue
efectivo (ya que entonces la proporción de aciertos no debería ser mayor que la
esperable por azar); también es posible comparar las respuestas entre los tratamientos
asignados ajustando por el tratamiento que el investigador creía que se estaba
administrando.
2.12. Nota terminológica sobre enmascaramiento
Los términos simple ciego, doble ciego y evaluación ciega, hacen referencia a quién o
quiénes ignoran el tratamiento administrado. Cuando sólo los sujetos experimentales
ignoran cuál es el tratamiento que reciben (pero quienes administran el tratamiento
saben cuál es éste), se habla de simple ciego (single blind). Aunque los tratamientos se
enmascaren los investigadores podrían conocer el tratamiento que se administra a un
paciente determinado (por ejemplo, éste sería el caso si tuvieran libre acceso a la lista de
aleatorización). Cuando se toman las debidas precauciones para mantener ignorantes
tanto al sujeto que recibe el tratamiento, como al que lo administra, se dice que el EC es
doble ciego (double blind). En algunos ensayos abiertos la evaluación del resultado
corre a cargo de una tercera persona ignorante del tratamiento. Se dice entonces que la
evaluación se realiza a ciegas y se habla de EC con evaluación a ciegas. Aunque no
son de uso corriente, se han utilizado a veces extensiones de esta terminología, como
triple ciego para indicar que quien analiza los datos no conoce el tratamiento asignado.
Los términos doble ciego y simple ciego podían ser suficientes cuando los únicos
protagonistas de un EC eran los sujetos experimetales y los médicos investigadores. Hoy
en día, en un EC interviene un elevado numero de profesionales y por ello la terminología
de simple o doble ciego resulta insuficiente y se ha recomendado evitarla. En cualquier
caso, lo que sí es imprescindible es que, tanto en el protocolo como en la comunicación
de resultados, quede claro quién conoce y quién ignora los tratamientos asignados. En
los EC con medicamentos, se recomienda mantener ignorante a toda persona que
intervenga en el EC con las únicas excepciones del estadístico que prepara la lista de
aleatorización y el responsable de preparar los contenedores de medicación numerados
según la lista.
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 15
La realización de un EC enmascarado complica considerablemente la logística. La figura
2.10 muestra de forma esquemática cómo se prepara y utiliza la medicación en un EC
enmascarado. A pesar de estas complicaciones, se considera necesario enmascarar los
tratamientos siempre que sea posible y si no se hace es necesario justificarlo.
3. ANÁLISIS DE ENSAYOS CLÍNICOS
3.1. Conjuntos de análisis
Los conjuntos de análisis utilizados en un EC pueden ser distintos según el objetivo.
Por ejemplo, para un objetivo de superioridad de eficacia conviene retener en el
análisis a todos los pacientes aleatorizados (si es posible), estrategia que se conoce
como análisis por intención de tratar (intention-to-treat analysis). La exclusión de
casos debido a seguimiento incompleto o a violaciones del protocolo es peligrosa, tal
como iustrará el siguiente ejemplo. En la tabla A de la figura 2.11 se muestran los
resultados de un EC que comparaba un nuevo antidepresivo administrado a dos dosis
distintas (B1 y B2) con Amitriptilina (A). Aunque se aleatorizaron 50 pacientes, 15 de
ellos abandonaron, posiblemente debido a efectos secundarios del tratamiento. En la
tabla B de esta misma ilustración se muestran las proporciones de casos en que el
tratamiento se consideró muy eficaz, incluyendo sólo los casos evaluados o incluyendo
todos los pacientes aleatorizados. En el primer caso, el mejor resultado se observa en
el grupo B2. En el segundo caso, B2 y A presentan un resultado idéntico.
Evidentemente, el primer análisis ignora el fracaso implícito en el abandono del
tratamiento.
Sin embargo, cuando el objetivo de un EC es demostrar equivalencia o no-inferioridad,
puede ser más recomendable realizar el análisis con los pacientes que han seguido el
protocolo (per-protocol analysis). En los pacientes que no han cumplido
adecuadamente el protocolo (sobre todo, la duración y la cumplimentación del
tratamiento), las diferencias entre los tratamientos pueden manifestarse de forma
menos marcada, induciendo una aparente equivalencia y, por tanto, distorsionando los
resultados en el sentido de lo que se pretende demostrar.
Por lo que se refiere a los objetivos de evaluación de seguridad, lo razonable es limitar
el análisis a los pacientes que hayan recibido realmente tratamiento en estudio. En los
EC con fármacos, el conjunto de análisis de seguridad suele definirse como el
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 16
conjunto de todos los pacientes que han recibido al menos una dosis del tratamiento
asignado.
La predefinición de los conjuntos de análisis que se utilizará en cada objetivo es
imprescindible para evitar problemas de multiplicidad, sobre todo en el caso de
objetivos confirmatorios.
3.2. Pre-especificación del análisis principal confirmatorio
Es muy importante especificar de antemano el análisis principal de los objetivos
confirmatorios y hacerlo de manera que se evite cualquier posible fuente de
multiplicidad. Como ya se comentó en la unidad anterior, una pre-especificación
completa incluye la especificación de: 1) el conjunto de análisis, 2) la variable
analizada, 3) el método de análisis y el nivel de significación, 4) el número de
ocasiones en que se realizará el análisis (sólo al final o análisis intermedios).
La especificación de cada uno de estos puntos puede ser más complicada de lo que
parece. En cuanto a la especificación de la variable principal, frases como “la variable
principal será la presión arterial” son muy ambiguas, ya que hay muy diversas
variables compatibles con esta definición (PAS o PAD expresadas en mm Hg; o
disminución de PAS o PAD respecto del valor basal; o control de la PAS o de la PAD o
de ambas, expresado como variable dicotómica; etc.), que por lo demás no menciona
el momento de la determinación y probablemente se hará en distintas visitas. La
deseable inclusión del tiempo de evaluación en la definición de la variable principal
(p.ej., “el buen control de la PA (sí/no) en base a la PAS y la PAD medidas en la última
visita de seguimiento; se considerará buen control si PAS<140 y PAD<90”) suele exigir
la previsión de métodos para sustituir datos faltantes, al menos en el caso de que el
conjunto de análisis sea el de todos los sujetos aleatorizados (p.ej., “en los sujetos que
no realicen la última visita de seguimiento, se utilizará la última disponible, incluso si se
trata de la visita basal”) .
Por lo que se refiere al método de análisis, frases como “el análisis principal se
realizará mediante un análisis de la varianza (ANOVA)” son también ambiguas a
menos que se especifique el modelo concreto (p.ej. “un ANOVA de dos vías: el
tratamiento asignado y el centro, así como su interacción; ésta se retirará del modelo
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 17
si no resulta estadísticamente significativa, antes de evaluar la significación del efecto
tratamiento; se utilizará un nivel de significación bilateral del 5%”).
La pre-especificación del análisis debe hacerse en primera aproximación al redactar el
protocolo del EC, y debe quedar absolutamente cerrada en el plan de análisis. En los
EC a ciegas, el plan de análisis debe finalizarse antes de desvelar el ciego para
realizar el análisis.
3.3. Organización del análisis
Una forma conveniente y frecuente de organizar el análisis de los datos de un EC es
distinguiendo tres grandes bloques o secciones: análisis de características basales,
análisis de resultados de eficacia y análisis de resultados de seguridad. Cada una de
éstos análisis tiene propósitos diferentes y por ello no es raro que involucre técnicas
de análisis diferentes.
Las características demográficas y clínicas de los sujetos al inicio del estudio
(características basales) son importantes para dar una idea de la población a la que
podrían generalizarse los resultados del EC o, como diría un epidemiólogo, para juzgar
la validez externa de los resultados del EC. Además permiten juzgar la comparabilidad
de los grupos.
Las características basales deben analizarse de forma descriptiva y la descripción
debe hacerse por grupo de tratamiento. A pesar de que es una práctica común (¡y de
que algunas revistas pueden exigirlo!), no es recomendable hacer comparaciones
formales de las características basales para juzgar la comparabilidad de los grupos.
Hay tres razones para ello. La primera es que la significación estadística de las
diferencias basales, no informa necesariamente sobre la significación clínica de tales
diferencias, que por otra parte puede juzgarse perfectamente mediante una simple
descriptiva. La segunda, que el resultado (en términos de significación estadística) de
las comparaciones basales no determina la validez de los análisis de eficacia, ya que
ésta descansa exclusivamente en la aleatorización. La tercera es que la necesidad de
preespecificar el análisis de eficacia implica que la decisión de ajustar o no por
determinadas variables no puede condicionarse a ningún resultado del estudio.
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 18
En las siguientes secciones trataremos separadamente de los dos bloques restantes:
el análisis de eficacia y el análisis de seguridad.
3.4. Análisis de eficacia en EC paralelos
Los análisis de eficacia (o efectividad) de los EC tienen por objeto evaluar el efecto tratamiento. Es importante advertir que por efecto tratamiento entendemos una
medida de la discrepancia de resultados obtenidos con cada tratamiento. Así, una
medida de efecto tratamiento puede ser la diferencia de medias (en el caso de
respuesta continua) o la diferencia de proporciones (en el caso de respuesta
dicotómica, como éxito / fracaso) entre los dos tratamientos del ensayo. En
consecuencia, las pruebas de comparación de medias o de proporciones son
frecuentemente utilizadas, y en algunos casos son suficientes para analizar los datos
de eficacia. Este tipo de análisis, en los que no se ajusta por ninguna variable (análisis
no ajustados) tienen la virtud de la simplicidad y de la robustez.
Sin embargo, es posible que convenga realizar análisis algo más sofisticados, que
permitan evaluar el efecto tratamiento ajustando por ciertas variables (análisis
ajustados). Dos situaciones muy frecuentes en que esto es aconsejable son los EC
multicéntricos y la disponibilidad de valores basales de la variable respuesta. En los
EC multicéntricos, puede existir un efecto centro, a veces marcado, y si es así
conviene incluirlo en el análisis para reducir variabilidad residual de las respuestas y
aumentar la potencia. Además, si el efecto tratamiento y el efecto centro no están
perfectamente equilibrados (p.ej. debido a pérdidas), entonces en un análisis no
ajustado por centro éste puede actuar como variable de confusión. En cuanto a la
disponibilidad de valores basales, que es muy frecuente en el caso de respuestas
continuas, los valores basales suelen ser muy predictivos del valor final y al ajustar por
ellos se consigue una reducción muy importante de la variabilidad residual con el
consiguiente aumento de la potencia.
Cuando haya necesidad de ajustar por ciertas variables (como el centro o el valor
basal de la respuesta), los modelos lineales generalizados ofrecen la flexibilidad
necesaria para realizar una evaluación ajustada del efecto tratamiento ajustando por
variables cualitativas, cuantitativas, o de ambos tipos. El tipo de de modelo lineal
generalizado dependerá de las características de la variable respuesta. Posiblemente,
los dos casos más frecuentes son el de respuesta continua y el de respuesta
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 19
dicotómica, que pueden analizarse mediante el modelo lineal general (ANCOVA) y el
modelo de regresión logística, respectivamente. Cuando la variable respuesta es
dicotómica, si sólo hace falta ajustar por el efecto centro (p.ej., si no se dispone de
valores basales), pueden utilizarse también métodos de análisis estratificado, como el
estadístico Chi-cuadrado de Mantel-Haenszel o el Odds Ratio ajustado de Mantel-
Haenszel (al final de la unidad se ofrece un enlace que explica esto métodos). Cuando
la respuesta es continua, a veces se utiliza una forma sencilla de ajustar por el valor
basal que consiste en analizar el cambio observado desde la situación basal hasta la
final. Aunque esto no es necesariamente incorrecto, tampoco es óptimo. En la
siguientes secciones se comenta esta forma de análisis y la que se considera más
más adecuada.
3.5. Ajuste por valores basales en EC paralelos: análisis del cambio
Cuando se dispone de valores basales de la variable respuesta, a veces se utiliza una
forma intuitiva y sencilla de ajustar por dichos valores basales que consiste en
analizar el cambio absoluto (CA) observado desde el valor basal (B) hasta la el final
(F), es decir CA = F – B. Otras veces se analiza el cambio porcentual CP = (F – B) / B
en lugar del cambio absoluto (CA). Un problema habitual es la falta de justificación
para analizar uno u otro: la elección suele responder a los “usos y costumbres” y es
caprichosamente variable en distintas áreas de investigación.
Se han propuesto criterios racionales y sencillos para adoptar CA o CP, que se basan
en la inspección de la relación entre F y B en ambos grupos. En el infrecuente caso de
que F y B sean independientes (figura 2.12), ajustar por B no tendría más sentido del
que ajustar por un número escogido al azar. Por el contrario, si F y B están
relacionados (figura 2.13), entonces interesará ajustar por el valor basal escogiendo la
medida de cambio (CA o CP) que resulte menos dependiente del valor basal, lo que se
puede hacer inspeccionando los dos diagramas de dispersión de la figura 2.14: es
claro que CP es menos dependiente de B que CA, por lo que representa un mejor
ajuste.
Aunque las estrategias consistentes en analizar el cambio (absoluto o porcentual,
según convenga) son aceptables, no son óptimas. La forma óptima de realizar el
ajuste es mediante un modelo lineal de tipo ANCOVA, por las razones que se ilustran
en la siguiente sección.
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 20
3.6. Ajuste por valores basales en EC paralelos: ANCOVA
El ANCOVA es posiblemente la forma más satisfactoria de ajustar por los valores
basales. Comparado con las alternativas comentadas en la sección anterior,
proporciona un sistema de ajuste más flexible porque estima la relación entre los
valores finales y basales. Es fácil ver esto considerando el modelo lineal utilizado en
un ANCOVA, en el que el valor final (XF) se expresa como una función (lineal) del valor
basal (XB) y del efecto tratamiento (τ), además de un término independiente (α) y de
un error aleatorio (e):
XF = α + β XB + τ + e
y en consecuencia,
XF - (α + β XB) = τ + e
Es fácil ver que el primer término de la igualdad coincide con el cambio absoluto sólo
en el caso de que α = 0 y β = 1. Efectivamente, en este caso no hay que esperar
diferencia entre un ANCOVA o el análisis del cambio absoluto. Sin embargo, es muy
frecuente que la pendiente del valor basal sea inferior a 1 (β<1) y entonces los dos
análisis ya no son equivalentes. En general, es preferible el ANCOVA porque ajusta
según los valores estimados de α y de β, que describen cómo es la dependencia
(regresión lineal) entre los valores finales y los basales.
Una ventaja adicional de este análisis es que permite evaluar la posible existencia de
una interacción entre los valores basales y el tratamiento (mediante la ampliación del
modelo anterior con el correspondiente término de interacción). Si dicha interacción
resulta significativa, el efecto tratamiento depende del valor basal, y es posible
estimarlo para distintos valores basales pero, en general, no tendría mucho sentido
facilitar una única estimación de dicho efecto.
La única limitación del ANCOVA es que la inferencia se basa en un modelo, lo que
obliga a verificar que se cumplen las condiciones en las que descansa la validez de
dicha inferencia (las habituales del modelo lineal general). Si no se cumplen
(heterocedasticidad, outliers, no-normalidad, etc...), la estimación del efecto
tratamiento puede ser ineficiente o incluso sesgada. Por el contrario, el análisis
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 21
análisis del cambio (absoluto o porcentual) C o CP, permite utilizar pruebas de
aleatorización (p.ej., Mann-Whitney) que no requieren de ninguna suposición.
3.7. Otros usos de los valores basales en EC paralelos
Con cierta frecuencia se utiliza una estrategia de análisis consistente en decidir si vale
la pena realizar un análisis ajustado de los valores finales en base a la existencia o no
de diferencias significativas en la comparación de los valores basales. Esta estrategia
es totalmente inadecuada porque la comparación formal de los valores basales no
proporciona ninguna información útil para decidir merece la pena ajustar. El hecho de
que existan diferencias basales significativas entre los grupos de tratamiento, no
implica que un análisis no ajustado de los valores finales sea inválido, a condición de
que la aleatorización se haya realizado correctamente (y es posible que se produzcan
diferencias basales significativas tras una aleatorización correcta). Por otra parte, el
hecho de que no existan diferencias basales estadísticamente significativas, ni implica
que no exista cierto grado de diferencia, ni sobre todo, que no se gane potencia al
realizar un análisis ajustando por los valores basales. Además, esta estrategia es
incompatible con la preespecificación del análisis. Por lo tanto, no hay ningún motivo
que justifique utilizar el resultado de la comparación de valores basales para decidir si
se debe realizar un análisis ajustado o no ajustado. En cualquier situación en la que se
disponga de valores basales y éstos estén relacionados con los finales, el análisis
ajustado es preferible.
3.8. Uso de medidas intermedias en EC paralelos
Con mucha frecuencia, no sólo se dispone de valores basales sino que se tienen
diversas evaluaciones intermedias de la variable principal entre la medición basal y la
final. En estos casos se pueden utilizar diversas estrategias de análisis que
comentamos seguidamente.
La primera posibilidad es ignorar las medidas intermedias. Aunque pueda parecer que
al hacerlo perdemos información, en muchos casos esta información no será
relevante. La razón es que, cuando se diseña un EC, la duración del tratamiento hasta
la evaluación final suele ser la que se considera necesaria para que el tratamiento
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 22
pueda desarrollar su presunto efecto, por lo que las medidas intermedias son
demasiado precoces, y lo que interesa es evaluar el estado final. Sin embargo, en
algunos casos puede tener interés, no sólo el estado final, sino también ciertos
aspectos del recorrido, como por ejemplo la rapidez con que se ha desarrollado el
efecto de los tratamientos. Si éste es el caso, no podremos ignorar las medidas
intermedias.
La segunda posibilidad es utilizar métodos de análisis que permiten analizar medidas
repetidas. Algunos de estos métodos son poco recomendables porque se basan en
suposiciones que pueden ser poco razonables y difíciles de evaluar (p.ej., el llamado
análisis multivariante de la varianza o MANOVA, o un caso particular conocido a veces
como análisis de perfiles). Más recomendables son los modelos mixtos, una variante
de los modelos lineales generalizados que permite especificar modelos en que la
respuesta se expresa como una función de una serie de efectos fijos o aleatorios. Este
tipo de análisis, que es muy flexible, es relativamente complejo y cae fuera de lo que
sería razonable explicar en este curso, pero supone una posibilidad excelente, si no
para el análisis principal (en el que conviene utilizar métodos simples y robustos que
no dependan de demasiadas suposiciones), sí al menos para realizar análisis
secundarios de carácter exploratorio.
Una tercera posibilidad es la de analizar medidas resumen que conserven la
información interesante de la evolución de la variable respuesta a lo largo del
seguimiento. Por ejemplo, si interesa ver la rapidez con que decae un dolor a partir de
diversas medidas realizadas a lo largo del tiempo, se puede calcular la pendiente
(como medida de cambio por unidad de tiempo) de cada individuo mediante un modelo
de regresión simple (Y=medida del dolor; X=tiempo) y analizar los valores de las
pendientes (esto es de hecho equivalente a algunos modelos mixtos conocidos a
veces como modelos de coeficientes aleatorios). En los ensayos de farmacocinética,
se utiliza el área bajo la curva que describe la evolución de la concentración
plasmática del fármaco a través del tiempo como medida resúmen de la
biodisponibilidad del fármaco, así como otros resúmenes (Cmax, tmax). Las medidas
resumen tienen la virtud de simplificar los datos a analizar una medida por unidad
experimental, en lugar de un vector o serie de medidas a lo largo del tiempo). Además
dan una idea realista de la cantidad de información disponible (algunos investigadores
piensan que, por el hecho de disponer de muchas medidas repetidas, tienen mucha
información, aunque el número de unidades experimentales se muy escaso). Por
último, al tratarse de un único valor para cada paciente, puede analizarse mediante
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 23
técnicas sencillas, incluyendo las no-paramétricas si es necesario (p.ej. U de Mann-
Whitney).
3.9. Análisis de eficacia en EC cruzados AB/BA
En los EC cruzados cada individuo ofrece una respuesta bajo cada unos de los
tratamientos a comparar y, por lo tanto, desde el punto de vista del análisis, se trata de
comparar series de datos pareados. Pero es importante recordar que se ha
aleatorizado la secuencia de administración de los tratamientos: en el diseño AB/BA
algunos individuos se tratan con A en primer lugar (primer periodo) y luego con B
(segundo periodo), mientras que otros individuos comienzan con B (primer periodo) y
luego A (segundo periodo).
La forma más simple de análisis sería utilizar métodos para datos apareados, como
por ejemplo la prueba de McNemar si la respuesta es dicotómica, o la t de Student
para datos pareados si es continua. Sin embargo, estos métodos de análisis no tienen
en cuenta la posible existencia de un efecto período, esto es (en un diseo AB/BA)
diferencias entre el primer y el segundo periodo de tratamiento.
En caso de que dicho efecto periodo esté presente (p.ej, mejoría espontánea de la
condición patológica problema), ignorarlo supondrá siempre una cierta pérdida de
potencia y de precisión en la estimación del efecto tratamiento. Además, si el diseño
no está equilibrado, es decir, si hay más individuos en una secuencia (p.ej., AB) que
en la otra (BA), la estimación del efecto estará sesgada porque existirá cierto grado de
confusión entre el efecto periodo y el efecto tratamiento (la confusión será tanto mayor
cuanto mayor sea el desequilibrio del diseño). Para evitar estos inconvenientes, se han
propuesto distintas formas de análisis que permiten evaluar el efecto tratamiento
ajustando por el efecto periodo. En la siguiente sección presentamos una de ellas para
el diseo AB/BA.
3.10. Análisis ajustando por el efecto periodo en diseos AB/BA
Cuando la respuesta es continua, el análisis de Hills-Armitage es una opción sencilla
para evaluar el efecto tratamiento ajustando por el efecto periodo. Un procedimiento
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 24
más sofisticado es el llamado modelo de Grizzle, un modelo lineal que no Ilustraremos
aquí pero que puede encontrarse en la bibliografía referenciada al final de esta unidad.
Para ilustrar el análisis de Hills-Armitage analizaremos un ejemplo extraído de Senn
(1993), en que se evalúa el efecto de dos broncodilatadores (Salbutamol vs
Formoterol) sobre el flujo espiratorio máximo (FEM) en el asma bronquial infantil. Los
pacientes se asignaron aleatorimente a una de dos secuencias de tratamiento: F/S o
S/F. Los datos del FEM y el resultado de un análisis sin ajustar por periodo el se
presentan en la figura 2.15.
El análisis de Hills-Armitage se basa en la idea de que promedio de las diferencias
cruzadas (diferencias entre tratamientos) de una secuencia estará afectado por el
efecto tratamiento y por el efecto periodo, si existe. Si se promedian los promedios de
cada secuencia, el efecto periodo desaparece, debido a que tiene signos distintos en
las dos secuencias. Por lo tanto, el promedio de las medias de las diferencias
cruzadas de cada secuencia queda libre del efecto periodo pero retiene el efecto
tratamiento. Si éste no existe (es decir, si los tratamientos son iguales), este promedio
no debe diferir significativamente de cero. Este análisis se ilustra en la figura 2.16. En
este caso, el resultado de la estimación del efecto tratamiento ajustando por periodo
(46,61 l/min) es muy similar al que se obtiene en el análisis no ajustado (45,38 l/min).
Asimismo, los grados de significación (p) son también muy similares (aunque el del
análisis ajustado es algo inferior, debido al aumento de potencia). La similitud de
resultados se debe a que, en este ensayo, tanto el efecto periodo como el
desequilibrio el diseño son muy pequeños. Sin embargo, las diferencias pueden ser
muy importantes cuando el efecto periodo sea marcado.
3.11. Respuestas binarias
Una aproximación sencilla al análisis de respuestas binarias puede realizarse una
prueba de McNemar, despreciando los casos no informativos para el efecto
tratamiento (los que han ofrecido igual resultado con cada tratamiento) y reteniendo
aquellos con distinto resultado, que podrán clasificarse como ‘mejor resultado con A’ o
bien ‘mejor resultado con B’. Este sería un análisis no ajustado por periodo.
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 25
Para realizar un análisis del efecto tratamiento ajustando por el efecto periodo se
puede utilizar la prueba de Mainland-Gart. Esta prueba consiste en analizar la relación
entre secuencias y periodos, es decir, la asociación en la siguiente tabla:
Mejor en
periodo 1
Mejor en
periodo 2
AB c d
BA e f
Un efecto tratamiento tenderá a producir asociación en esta tabla. Por ejemplo, un
predominio de casos en las casillas e y f sería indicativo de superioridad del
tratamiento A. La asociación evaluarse mediante el estadístico Chi-cuadrado de
Pearson o mediante la prueba de Fisher.
3.12. Análisis de seguridad
En general, el propósito del análisisis de seguridad difiere considerablemente del que
es propio del análisis de eficacia, como se verá en el siguiente ejemplo. Se trata de un
EC aleatorizado, doble ciego, paralelo, que comparó dos preparados tópicos en el
tratamiento de una afección cutánea. El número de pacientes que presentaron
acontecimientos adversos (AA) se muestra en la figura 2.17. El resultado de una
prueba de hipótesis para comparar la proporción de pacientes con AA entre ambos
tratamientos es p=0,114, con lo que no podemos rechazar la hipótesis nula de
igualdad. Por tanto, el resultado de esta prueba de hipótesis no llama la atención sobre
posibles desventajas de un tratamiento en lo referente a seguridad.
Sin embargo, la mera inspección de los AA registrados, así como la atribución de
causalidad según el juicio subjetivo del investigador, sugiere lo contrario, tal como se
muestra en la figura 2.18: aunque sólo se presentaron en 4 pacientes, los AA son del
mismo tipo (desarrollo o agravamiento de afecciones cutáneas), ocurrieron poco
después y en el lugar de la aplicación del tratamiento tópico. Sin duda, esta
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 26
información es suficiente para sospechar que el tratamiento A puede inducir
reacciones cutáneas en el lugar de la aplicación.
El ejemplo anterior pretende ilustrar el escaso o nulo interés de las pruebas de
significación en los análisis de seguridad y lo informativo que resulta en cambio el
análisis descriptivo, incluso si es tan simple como un listado de características de los
AA. Efectivamente, las técnicas descriptivas son el pilar de los análisis de seguridad
en los EC y la razón de ello es que, mientras que el análisis de eficacia pretende
demostrar algo, y para ello necesita evidencia suficiente (p<0,05), el análisis de
seguridad pretende alertar sobre posibles problemas, y para ello no hace falta tener
un alto grado de evidencia sino que basta con la mera sospecha.
Además de los listados y tablas de frecuencias de AA, el análisis de los signos vitales
y de las analíticas, fundamentalmente graficos, constituyen el pilar del análisis de
seguridad.
3.13. Criterios de evaluación de seguridad
Los criterios que se utilizarán para evaluar la seguridad pueden variar según la
indicación y los tratamientos del EC pero el criterio más importante es siempre la
aparición de acontecimientos adversos (AA). Estos se definen como cualquier
condición indeseable en la que pueda incurrir un paciente durante un EC,
independientemente de que se la considere relacionada o no con el tratamiento en
estudio (p.ej., caída fortuita).
En los EC de medicamentos, es frecuente también la evaluación de las constantes
vitales (pulso, presión arterial y frecuencia respiratoria) y de variables de laboratorio o
analíticas como parte del análisis de seguridad. En cuanto a estas últimas, se utilizan
con frecuencia la hematología básica, los iones plasmáticos y los enzimas que
permiten evaluar la función hepática y renal.
En algunos EC se incluyen exploraciones complementarias, como electrocardiogamas
(ECG) o pruebas de imagen, si se piensa que pueden poner de manifiesto problemas
de seguridad del fármaco.
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 27
3.14. Análisis de AA
En general, el análisis de seguridad suele ser mucho más laborioso que el análisis de
eficacia. Esto se debe tanto a ciertas particularidades de los datos de seguridad como
al objetivo de dicho análisis, que es exploratorio.
Los AA se capturan en forma textual y su carácter heterogéneo y diverso hace difícil el
análisis. Incluso en EC de muestra relativamente pequeña, si la incidencia de AA es
alta, se hace imprescindible codificar los AA para poder describirlos de forma
inteligible. Para ello se utilizan diccionarios específicos (MEDDRA).
Un problema importante es la falta de independencia de los AA registrados en un EC,
puesto que un paciente puede presentar más de un AA. Por ello es importante
describir el número de pacientes con AA, además del número de AA.
Las técnicas más recomendables para describir los AA dependen de su número. Si en
un EC se han presentado muy pocos AA lo más práctico será un listado de todos ellos,
por grupo de tratamiento. Cuando el número de AA sea elevado, convendrá generar
tablas de frecuencias. Para que sean de alguna utilidad, habrá que generar dichas
tablas usando los términos del diccionario utilizado para codificar los AA en lugar de
usar los textos de las descripciones originales escritos por el investigador.
También puede ser interesante analizar algunas características de los AA, como el
tiempo en que se presentaron (expresado en forma de días relativos respecto del inicio
del tratamiento), su duración, su gravedad, o la atribución de causalidad al tratamiento
del estudio según el juicio subjetivo del médico investigador.
Por último, si el tiempo de seguimiento de los pacientes es variable (p.ej., EC de
supervivencia), convendrá utilizar técnicas de análisis de supervivencia para estimar la
incidencia de AA.
3.15. Análisis de datos de laboratorio
Como en el caso de los AA, el análisis de datos de laboratorio debe perseguir la
detección de casos individuales con posibles desviaciones, más que la detección de
fenómenos generales, y por ello los análisis de datos agregados (como medias)
pueden ser menos útil que ciertos análisis descriptivos. En la figura 2.19 se muestra un
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 28
gráfico especialmente útil para detectar alteraciones individuales en una variable de
laboratorio. Se trata de un diagrama de dispersión en el que se representan los sujetos
(que se identifican por el número de aleatorización) en función del valores basal y final
de un analito (en este caso, la glucosa), y se incluyen líneas de referencia para el
rango de valores normales y para la recta identidad. Ello permite identificar
rápidamente casos que muestran valores fuera de la normalidad. Por ejemplo, en
ambos grupos se observan casos con un valor final elevado, pero esta elevación ya
estaba presente al inicio del estudio. Sin embargo, en el grupo tratado aparece un
sujeto (22) con un valor basal dentro de los límites de normalidad, pero que presentó
hipoglucemia al final del estudio.
Aunque lo más habitual es determinar los datos de laboratorio en dos ocasiones (al
inicio y al final del tratamiento), si se han realizado determinaciones en visitas
intermedias se puede optar por un diagrama de perfiles individuales, marcando
también las líneas de referencia de los límites de normalidad, como el de la figura
2.20.
3.16. Comunicación de resultados (CONSORT)
Por lo que se refiere a la comunicación de resultados, además de la guía CONSORT
incluida como parte de esta unidad, conviene conocer que existen versiones
adaptadas a ciertos casos especiales. En el momento de redactar esta unidad, están
disponibles las siguientes extensiones de la guía CONSORT:
• Ensayos que pretenden demostrar no-inferioridad o equivalencia
• Ensayos con aleatorización de clusters
• Ensayos sobre intervenciones no farmacológicas
• Evaluación del dao
• Redacción de resumenes de ensayos clínicos
Todas estas extensiones pueden conseguirse gratuitamente en la página web de la
iniciativa CONSORT.
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 29
4. LECTURAS RECOMENDABLES
• Web de la iniciativa CONSORT : http://www.consort-statement.org/
en el que se puede encontrar, entre otras muchas cosas interesantes, la versión
larga de la guía, y extensiones de la guía adaptándola a ensayos de no-
inferioridad, ensayos con aleatorización de clusters, ensayos de intervenciones no
farmacológicas.
• Traducción de la guía CONSORT al castellano.
• Calculadora de tamaño muestral para ensayos con diseño paralelo.
• Explicación de los métodos de Mantel-Haenzsel para el análisis estratificado de
respuestas dicotómicas.
• Un libro excelente sobre diseo y análisis de ensayos clínicos cruzados, donde
encontrará el análisis de Hills-Armitage, el modelo de Grizzle y mucho más...
Senn 2002. Crossover trials in clinical research. 2ª ed. John Wiley & Sons.
Chichester (UK)
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 30
5. RESUMEN
En esta unidad hemos tratado del diseo y análisis de EC. Hemos comenzado
distinguiendo distintos tipos de objetivos confirmatorios como la demostración de
superioridad, la demostración de no-inferioridad y la demostración de equivalencia.
Hemos comentado las configuraciones más habitualmente utilizadas en EC - el diseo
de (dos) grupos paralelos, el diseo cruzado AB/BA y los diseos factoriales – y hemos
ofrecido para cada una de ellas un algoritmo para generar una secuencia aleatoria de
asignación de tratamientos, secuencias de tratamientos o combinaciones de
tratamientos.
La forma en que se asignan los tratamientos a las unidades experimentales es una de
las cuestiones metodológicas más importantes del EC. En general, se considera que la
asignación aleatoria o aleatorización, es el método de asignación más seguro para
evitar sesgos en la evaluación del efecto tratamiento, pero es necesario generarla e
implementarla correctamente (aleatorización oculta). Hemos comentado brevemente
algunos métodos de asignación alternativos a la aleatorización, como la minimización
o los diseos adaptativos.
El enmascaramiento de los tratamientos es posiblemente la segunda medida de
prudencia más importante para evitar sesgos, particularmente sesgos de evaluación.
Según cuáles sean los tratamientos, el enmascaramiento puede ser difícil y requerir
técnicas especiales (como el doble dummy), o imposible.
En relación con el análisis de EC, hemos insistido en la importancia de dejar
completamente definido el análisis principal de los objetivos confirmatorios, y hemos
comentado las estrategias de análisis más recomendables para el análisis de eficacia
o de efectividad en EC paralelos y en EC cruzados AB/BA. Por último hemos
comentado algunas cuestiones muy generales sobre en análisis de seguridad que
siempre debería incluirse como objetivo, posiblemente secundario, en los EC.
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 31
6. EJERCICIOS
Ejercicio 1
¿Cuál de las siguientes es una ventaja fundamental de la aleatorización?
1. Consigue grupos comparables en cuanto a factores pronósticos
2. Consigue grupos de igual tamaño
3. Consigue que la asignación sea insesgada
4. Todas las anteriores
5. Ninguna de las anteriores
Nota: Para ver y contestar la pregunta de este caso, debe acceder a la versión on line
del curso, que encontrará en el Campus del CEC.
Ejercicio 2
¿En cuál de los siguientes casos podría utilizarse un diseo AB/BA para comparar la
eficacia de dos fármacos? (se indica la patología y la respuesta a evaluar)
1. Infección del tracto urinario: curación a los 7 días
2. Dolor post-quirúrgico agudo: desaparición del dolor a las 24h
3. Dismenorrea primaria: número de días con dolor
4. Todas las anteriores
5. Ninguna de las anteriores
Nota: Para ver y contestar la pregunta de este caso, debe acceder a la versión on line
del curso, que encontrará en el Campus del CEC.
Ejercicio 3
¿En cuál de los siguientes objetivos de investigación es apropiado realizar el análisis
con todos los pacientes aleatorizados, sin excluir desviaciones del protocolo (como no
haber tomado correctamente la medicación)?
1. Demostrar que A es más efectivo que B
2. Demostrar que A y B son equivalentes en eficacia
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 32
3. Establecer la relación entre dosis y respuesta de un fármaco
4. En todos los anteriores
5. En ninguno de los anteriores
Nota: Para ver y contestar la pregunta de este caso, debe acceder a la versión on line
del curso, que encontrará en el Campus del CEC.
Ejercicio 4
Un EC paralelo compara dos fármacos hipolipemiantes y utiliza como respuesta el
colesterol total (mg/dl) a los 6 meses de tratamiento. Se dispone de una medida basal
de colesterol. ¿Qué análisis es más adecuado?
1. Análisis del colesterol a los 6 meses mediante t de Student
2. Análisis de la reducción absoluta desde el inicio hasta los 6 meses, mediante t
de Student
3. Análisis de la reducción porcentual desde el inicio hasta los 6 meses, mediante
t de Student
4. ANCOVA del valor a los 6 meses ajustando por el valor basal
5. Ninguno de los anteriores
Nota: Para ver y contestar la pregunta de este caso, debe acceder a la versión on line
del curso, que encontrará en el Campus del CEC.
Ejercicio 5
¿Que es cierto en relación con el análisis de eficacia en un EC cruzado?
1. Una t de Student para datos apareados implica no ajustar el efecto periodo
2. El análisis de Hills-Armitage ajusta un posible efecto periodo
3. El análisis de varianza mediante el modelo de Grizzle ajusta el efecto periodo
4. Todas las anteriores son correctas
5. Ninguna de las anteriores es correcta
Nota: Para ver y contestar la pregunta de este caso, debe acceder a la versión on line
del curso, que encontrará en el Campus del CEC.
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 33
7. FIGURAS
F 2·1 Hipótesis formales según el tipo de objetivo
En los objetivos de no inferioridad se persigue demostrar que el tratamiento control no aventaja al experimental en más de una cierta cantidad, que representa diferencias poco relevantes y que se adopta como límite de no inferioridad ( ).
En los objetivos de no inferioridad se persigue demostrar que, si existe alguna diferencia entre ambos tratamientos, está confinada en un intervalo que representa diferencias poco relevantes y que se adopta como intervalo de equivalencia ( 1 , 2).
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 34
F 2·2 IC(1- ) y conclusión según el tipo de objetivo
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 35
F 2·3 Diseño paralelo de 2 grupos
F 2·4 Diseño cruzado 2 x 2 (AB/BA)
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 36
F 2·5 Diseño factorial 2 x 2
F 2·6 Diseño completamente aleatorizado para asignar n=10 pacientes a uno de dos tratamientos con razón de asignación 1:1
Orden de inclusión Nº aleatorio Tratamiento
1 0.90533744 B
2 0.11472337 A
3 0.78921733 B
4 0.92033173 B
5 0.29607056 A
6 0.90256438 B
7 0.67698719 B
8 0.13811889 A
9 0.30342397 A
10 0.53030161 B
Algoritmo implementable en cualquier hoja de cálculo
1. Identificar las n unidades mediante el nº de orden de inclusión en el ECA
2. Asignar un número aleatorio entre 0 y 1 (x) a cada observación*
3. Si x < 0,5 asignar A y si x > 0,5 asignar B
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 37
* En Microsoft Excel puede utilizarse la función ALEATORIO(). En otras hojas de cálculo habrá que utilizar una función análoga que genere un valor entre 0 y 1 con distribución uniforme.
Algoritmo para StatCrunch
1. Identificar las n unidades mediante el nº de orden de inclusión en el ECA
2. Generar n números aleatorios en una única columna (x), utilizando la opción Data>Simulate data>Bernoulli, con parámetros Rows=n Columns=1 y p=0,5
3. Si x=1 asignar A y si x=0 asignar B
F 2·7 Diseño de bloques (de tamaño k=4) aleatorizados para asignar n=12 pacientes a uno de dos tratamientos con razón de asignación 1:1
Orden de inclusión Nº de bloque
Nº orden dentro del bloque Nº aleatorio Tratamiento
1 1 0.35217175 A
2 2 0.53076959 B
3 3 0.49007545 A
4
1
4 0.89951541 B
5 1 0.06543855 A
6 2 0.49178842 B
7 3 0.64405666 B
8
2
4 0.38334380 A
9 1 0.17422751 A
10 2 0.29970805 A
11 3 0.40023484 B
12
3
4 0.91772354 B
Algoritmo implementable en cualquier hoja de cálculo
1. Identificar las n unidades mediante el nº de orden de inclusión en el ECA
2. Asignar el número de bloque
3. Asignar un número aleatorio entre 0 y 1 (x) a cada observación*
4. Ordenar por bloque y, dentro de cada bloque, por x
5. En cada bloque, asignar A a las dos primeras y B a las restantes unidades
6. Reordenar por número de orden de inclusión
* En Microsoft Excel puede utilizarse la función ALEATORIO(). En otras hojas de cálculo habrá que utilizar una función análoga que genere un valor entre 0 y 1 con distribución uniforme.
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 38
Algoritmo para StatCrunch
1. Identificar las n unidades mediante el nº de orden de inclusión en el ECA
2. Generar n números aleatorios en una única columna (x), utilizando la opción Data>Simulate data>Bernoulli, con parámetros Rows=n Columns=1 y p=0,5
3. Si x=1 asignar A y si x=0 asignar B
F 2·8 Minimización
para procurar equilibrio en dos factores pronósticos: sexo (H, M) y tratamiento concomitante (T , noT)
Tabla A. Distribución de factores pronósticos tras reclutar 60 pacientes
Factores Pronósticos
Niveles de los factores
Grupo Experimental
Grupo Control
Total
Sexo Hombres (H) 16 14 30
Mujeres (M) 14 16 30
Tratamiento T Sí (T) 20 19 39
No (noT) 10 11 21
Tabla B. Puntuaciones de minimización para los cuatro posibles tipos de pacientes, a partir de la situación de la tabla A
Grupo H T H noT M T M noT
Experimental 36 26 34 24
Control 33 25 35 27
F 2·9 Diseño Play-the-Winner
Se aleatoriza el tratamiento del primer paciente (A o B). Si tiene éxito (E), se le asigna el mismo tratamiento al siguiente paciente; si fracasa (F) se administra el otro tratamiento.
Paciente: 1 2 3 4 5 6 7 8 9 10 11
Tratamiento: A A B A B A B B B B A
Resultado: E F F F F F E E E F F
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 39
F 2·10 Preparación de la medicación en un EC enmascarado
• 1. El estadístico responsable del diseo genera la lista de aleatorización y sobres cerrados identificados con el un nº de aleatorización que contienen la información del tratamiento asignado.
• 2. El director técnico del laboratorio promotor del EC recibe la lista de aleatorización y prepara la medicación, identificando los contenedores con los números de aleatorización.
• 3. El médico investigador recibe tanto los contedores numerados, como los sobres cerrados, con las siguientes instrucciones:
o Asignar los contenedores de medicación según el orden de inclusión de los pacientes en el EC: el contenedor nº1 al primer paciente incluído, el nº2 al segundo, y así sucesivamente.
o No abrir los sobres excepto si se produce una situación de urgencia clínica con un paciente.
F 2·11 Impacto de las pérdidas de casos en el análisis
Tabla A. Resultados de un EC que compara tres tratamientos (B1, B2 y A).
Respuesta B1 B2 A
Muy eficaz
Eficaz
Ineficaz
Total evaluados
2
4
3
9
8
2
2
12
6
8
0
14
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 40
Retirados
Total aleatorizados
6
15
8
20
1
15
Tabla B. Análisis incluyendo y excluyendo los casos retirados
Proporción de casos con
Respuesta = Muy eficaz B1 B2 A
Sobre los evaluados
Sobre los aleatorizados
2/9 = 0,22
2/15 = 0,13
8/12 = 0,66
8/20 = 0,40
6/14 = 0,43
6/15 = 0,40
F 2·12 Independencia entre valores finales (F) y basales (B)
F 2·13 Dependencia entre valores finales (F) y basales (B)
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 41
F 2·14 Selección de cambio absoluto (CA) o cambio porcentual (CP)
Cambio absoluto (CA)
Cambio porcentual (CP)
F 2·15 Flujo espiratorio máximo (FEM) (l/min)
(Fuente: Senn 1993)
F = Formoterol S = Salbutamol
Secuencia Paciente Periodo 1
Periodo 2
Diferencia entre Periodos
(P1-P2)
Diferencia Cruzada
(F-S)
Total
(P1+P2)
F/S 1 310 270 40 40 580
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 42
4
6
7
10
11
14
310
370
410
250
380
330
260
300
390
210
350
365
50
70
20
40
30
-35
50
70
20
40
30
-35
570
670
800
460
730
695
S/F
2
3
5
9
12
13
370
310
380
290
260
90
385
400
410
320
340
220
-15
-90
-30
-30
-80
-130
15
90
30
30
80
130
755
710
790
610
600
310
Resultados del análisis no ajustado t de Student (para datos pareados)
basado en la diferencia cruzada (F-S)
Media
desviación estándar
error estandar de la media
t
Valor crítico bilateral ( =0.05)
p
45.38
40.59
11.26
4.031
2.179
0.0017
F 2·16 Análisis de Hills-Armitage (ajustado por periodo)
Análisis de las diferencias cruzadas
Media en la secuencia F/S
30.71
Media en la secuencia S/F 62.50
Varianza común ( 2) 1500.8
Media de las medias (mm) 46.61
Varianza de mm (*): 2 { (1/n1) + (1/n2) } / 4 116.13
Error estándar de mm 10.777
T 4.325
Valor crítico bilateral ( =0.05) 2.201
p 0.0012
Límite inferior IC95% 23
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 43
Límite superior IC95% 70
(*) Si la varianza de las diferencias cruzadas es 2 y hay
• n1 pacientes en la secuencia AB
• n2 pacientes en la secuencia BA
Entonces,
• las medias de las diferencias cruzadas (diferencias entre tratamientos) en las secuencias AB y BA tendrán varianzas 2/n1 y 2/n2 respectivamente.
• La media de estas dos medias tendrá varianza 2{ (1/n1) + (1/n2) } / 4.
F 2·17 Nº de pacientes que presentaron Acontecimientos Adversos en un EC paralelo para comparar dos tratamientos activos
Tratamiento A Tratamiento B
Presentaron AA 4 0
NO presentaron AA 29 32
F 2·18 Acontecimientos Adversos en un EC paralelo para comparar dos tratamientos activos
Paciente Descripción del AA Instensidad Relación con el tto.
1 Reacción eritemato-escamosa severa probable
2 Eczema agudo severa probable
3 Eczema, eritema y prúrito severa probable
4 Agravamiento del eczema moderada probable
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV
U2– Diseño y análisis de ensayos clínicos
© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 44
F 2·19 Análisis descriptivo de datos de laboratorio – Diagramas de dispersión
F 2·20 Análisis descriptivo de datos de laboratorio – Perfiles individuales