U2. DISEÑO Y ANÁLISIS DE ENSAYOS CLÍNICOS · DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS:...

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO IV

U2– Diseño y análisis de ensayos clínicos

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 1

U2. DISEÑO Y ANÁLISIS DE ENSAYOS CLÍNICOS

Albert Cobos: Doctor en Medicina. MSc Estadística Aplicada. Profesor de

Bioestadística. Departamento de Salud Pública. Facultad de Medicina.

Universidad de Barcelona.

1. INTRODUCCIÓN

Esta unidad está dedicada al diseño y análisis de ensayos clínicos (EC), entendidos

como experimentos realizados en humanos. Es importante advertir que el término EC

puede tener otras definiciones según el contexto (p.ej., desde un punto de vista legal,

un diseño no experimental (en el sentido metodológico de este término), puede ser

considerado ensayo clínico).

En tanto que experimentos, los EC pretenden establecer las consecuencias de un

tratamiento o intervención por comparación con una o más alternativas. Los términos

tratamiento e intervención se usan aquí como sinónimos, para designar cada una de

las condiciones experimentales evaluadas. Adviértase que, en este contexto, el

término tratamiento no implica necesariamente un procedimiento terapéutico: aunque

en muchos EC los tratamientos evaluados son efectivamente herramientas

terapéuticas (p.ej., un fármaco o una intervención quirúrgica), en algunos no lo son

(p.ej., intervenciones educativas, organizativas, diagnósticas, etc). Lo que distingue un

experimento de un estudio observacional es que es el investigador quien asigna los

tratamientos a las unidades experimentales, y lo hace con el propósito de evaluarlos.

Un importante complemento al texto de esta unidad es la guía CONSORT, cuya

lectura se considera obligada. Aunque se facilita una traducción de esta guía al

castellano publicada en Medicina Clínica, se aconseja al alumno interesado la lectura

de la versión larga publicada en Annals of Internal Medicine, que está disponible

libremente en el sitio web de la iniciativa CONSORT (véase el enlace al final de esta

unidad).




2. DISEÑO DE ENSAYOS CLÍNICOS

2.1. Objetivos confirmatorios y exploratorios

Al redactar un objetivo de investigación, hay que saber distinguir si éste es de

naturaleza confirmatoria o exploratoria. El objetivo será confirmatorio cuando se

pretenda demostrar una hipótesis formal pre-existente, casi siempre fundamentada en

resultados previos. En contraposición, el objetivo será exploratorio cuando no exista

conocimiento previo o éste sea indirecto (p.ej., se sospecha un posible efecto a partir

de argumentos fisiopatológicos, pero sin evidencia previa directa de tal efecto).

Es frecuente que los EC combinen un objetivo confirmatorio (el objetivo principal) con

otros exploratorios (los objetivos secundarios). De hecho, la insistencia en distinguir un

objetivo principal de otros secundarios está en gran medida motivada por la necesidad

de distinguir entre un objetivo confirmatorio, si lo hay (a veces se realizan EC

enteramente exploratorios, p.ej., un EC piloto para obtener estimaciones que permitan

diseñar adecuadamente un ensayo ulterior, posiblemente confirmatorio, o bien evaluar

la factibilidad de su realización), de otros exploratorios. La distinción entre el carácter

confirmatorio o exploratorio de un objetivo es de especial interés desde el punto de

vista metodológico, puesto que afecta a la fuerza con que se podrá establecer las

conclusiones, ya que el grado de evidencia que proporciona un resultado en favor de

una hipótesis, no es el mismo si este resultado era inesperado que si era esperado

hasta el punto de motivar el diseño y realización de un EC. Por ello, solo se

considerará que una hipótesis queda demostrada si, antes de realizar el análisis de los

datos, se estableció tanto la hipótesis como el criterio para decidir sobre su veracidad.

Esto requiere: 1) distinguir esta hipótesis de cualquier otro objetivo, 2) plantearla

formalmente (hipótesis alternativa de una prueba de hipótesis) y 3) qué resultados

permitirán darla por demostrada (estadístico empleado para resolver la prueba de

hipótesis y tamaño de la región critica o nivel de significación α).

2.2. Objetivos de superioridad, no-inferioridad o equivalencia

Durante mucho tiempo, los EC de medicamentos se diseñaron para demostrar que

cierto producto tiene una eficacia superior (diferente) a la de un placebo. Esto tenía

sentido cuando no existía ningún tratamiento demostradamente eficaz para una

enfermedad. Sin embargo, para muchas condiciones patológicas, disponemos




actualmente de un arsenal terapéutico considerablemente amplio, y cualquier nuevo

tratamiento que se proponga debería compararse, no con placebo, sino con el mejor

de los tratamientos disponibles. Ahora bien, un nuevo tratamiento puede ser

interesante porque es más eficaz que los anteriores, o porque, siendo tan eficaz como

los anteriores, tiene alguna otra ventaja, como ser más seguro, o administrarse de

forma más cómoda. En el primer caso, habrá que diseñar un ensayo para demostrar

superioridad del nuevo fármaco respecto al mejor de los disponibles hasta el

momento. Aunque estos ensayos utilizarán un control activo en lugar de un placebo,

su pretensión seguirá siendo la demostración de superioridad (lo que implica

diferente eficacia) respecto al control activo. En cambio, si la ventaja del nuevo

fármaco reside en su seguridad o en su facilidad de administración y no necesitamos

exigirle mayor eficacia para considerarlo interesante, surge entonces la necesidad de

demostrar, que su eficacia no es inferior (es no-inferior) que la del mejor tratamiento

disponible. Nótese que el concepto de no-inferioridad incluye dos posibilidades: la

superioridad del nuevo tratamiento respecto al anterior, y la equivalencia de ambos.

En algunos casos puede interesar demostrar equivalencia, en lugar de no-inferioridad.

Por ejemplo, cuando se cambia la formulación de un mismo principio activo (p.ej.,

comprimidos en lugar de suspensión oral) se considera innecesario demostrar la

eficacia terapéutica de la nueva formulación ya que el principio activo es el mismo. Sin

embargo, es necesario demostrar que la nueva formulación consigue alcanzar

concentraciones plasmáticas similares a la formulación anterior (biodisponibilidad

equivalente): en este caso podría ser tan indeseable que la nueva formulación

consiguiera una concentración plasmática inferior (porque la eficacia quedaría

comprometida), como superior (por riesgo de toxicidad), por lo que habrá que

demostrar que se alcanza una concentración plasmática equivalente.

Al redactar el objetivo principal de un EC (y, en general, cualquier objetivo de

investigación que involucre una comparación), es importante distinguir y explicitar, si

se pretende demostrar superioridad, no-inferioridad, o equivalencia de los tratamientos

comparados, porque esto tendrá implicaciones tanto en el análisis como en el diseño.

Por lo que hace referencia al análisis, la demostración de superioridad se satisface

mediante pruebas de hipótesis de homogeneidad con el planteamiento clásico de una

hipótesis nula de igualdad estricta; pero la demostración de no-inferioridad (o de

equivalencia) requiere la definición de un límite de no-inferioridad (o un intervalo de

equivalencia) y un planteamiento de las hipótesis nula y alternativa distinto del

tradicional, que se ilustra en la figura 2.1. Desde el punto de vista de la estimación, la




figura 2.2 muestra la forma en que se establecen las conclusiones, según cuál sea el

objetivo, a partir del intervalo de confianza de la diferencia entre tratamientos. En

cuanto a las implicaciones sobre el diseño, una de ellas es el diferente requerimiento

de tamaño muestral, debido a que las hipótesis formales son distintas para demostrar

superioridad, no-inferioridad o equivalencia.

2.3. Objetivos de seguridad

A menos que se haya diseñado con este objetivo principal, el EC no suele tener la

potencia necesaria para detectar problemas de seguridad de las intervenciones, salvo

en el caso de que se trate de problemas muy frecuentes (pero en tal caso es fácil que

ya se conozcan antes de hacer el EC). A pesar de ello, los EC diseñados para

demostrar eficacia o efectividad deben plantearse siempre la posibilidad de que las

intervenciones ocasionen problemas, por lo que deberían incluir un objetivo secundario

que evalúe la seguridad. De hecho, esto es un imperativo legal en los EC con

medicamentos.

2.4. Diseño experimental o configuración del EC

Por diseño esperimental o configuración del EC entendemos la forma en que se

organiza el experimento en lo referente a los tratamientos y a las unidades

experimentales (los sujetos). Como veremos, a los sujetos se les puede asignar un

tratamiento, una secuencia de tratamientos o una combinación de tratamientos.

Aunque existen muchos diseños experimentales diferentes, en investigación clínica se

tiende a utilizar un número limitado de ellos.

La configuración más utilizada en EC es la de grupos paralelos, en la que los distintos

tratamientos se asignan a pacientes diferentes, de modo que cada paciente recibe uno

sólo de los tratamientos del ensayo (figura 2.3). En este diseño, el número de

tratamientos a comparar determina el número de brazos o grupos de pacientes que

recibirán cada uno de ellos. El EC de dos grupos paralelos es posiblemente el más

frecuente de todos, pero es posible realizar EC paralelos con más de dos grupos (p.ej.,

los llamados gold standard trials, en que el tratamiento experimental se compara tanto




con un placebo como con un control activo; o los EC de búsqueda de dosis, en que

cada grupo recibe una dosis diferente de un mismo fármaco).

En algunos casos, es posible e interesante utilizar un diseño cruzado (crossover), en

que los pacientes se asignan a una secuencia de tratamientos con el propósito de

compararlos. En estos ensayos, cada paciente recibe más de un tratamiento en

sucesivos periodos. En cada periodo se administra uno de los tratamientos (p.ej, A en

el primero y B en el segundo) y se evalúa la respuesta a dicho tratamiento. Entre dos

periodos consecutivos se deja transcurrir cierto tiempo de lavado (wash-out) para

evitar que el tratamiento administrado en el primer periodo (p.ej., A) pueda influir en la

respuesta observada en el segundo (p.ej., B). Aunque puede haber otros más

complejos, el diseño cruzado más frecuente es el AB/BA (a veces llamado 2x2: 2

periodos x 2 tratamientos), en que algunos pacientes se asignan a la secuencia AB y

otros a la secuencia BA, con el fin de comparar los dos tratamientos A y B (figura 2.4).

El atractivo fundamental de los diseños cruzados es que son más eficientes que los

paralelos: requieren muchos menos individuos para conseguir la misma potencia. Sin

embargo no siempre son posibles (p.ej., cuando la indicación es reversible y el

tratamiento curativo, como en el caso de las infecciones, porque tras el primer periodo

ya no habrá nada que tratar); cuando son posibles, no siempre son interesantes (p.ej.

si los tratamientos deben prolongarse mucho en el tiempo antes de poder evaluar su

efecto; o si la enfermedad cursa por brotes muy espaciados en el tiempo); y cuando

son posibles e interesantes, tienen a pesar de todo la limitación de que las pérdidas

(pacientes que, por alguna razón abandonan tras el primer periodo) son más

problemáticas que en los ensayos paralelos. A pesar de estas limitaciones, en algunas

áreas son muy utilizados, como es el caso de los ensayos de bioequivalencia a los que

nos hemos referido en la sección anterior.

Los diseños factoriales tienen especial interés para evaluar, no sólo el efecto de

distintos tratamientos, sino también de su combinación, lo que permite estudiar

posibles fenómenos de interacción (sinergia o antagonismo). Para ello se asignan

distintas combinaciones de tratamientos a distintos pacientes (figura 2.5).

Los llamados diseños secuenciales, son en realidad EC paralelos en los que se

realizan análisis intermedios utilizando métodos de análisis especiales (que permitirían

incluso realizar un análisis tras cada nuevo paciente), adoptándose reglas para

interrumpir el EC en base a los resultados de los análisis intermedios.




2.5. Asignación de los tratamientos a los sujetos

Un punto crítico en los EC es la forma en que se asignan los tratamientos (en los EC

paralelos), las secuencias de tratamientos (en los EC cruzados) o las combinaciones

de tratamientos (en los EC factoriales). La asignación aleatoria o aleatorización

garantiza que la asignación será insesgada, y por ello se considera la forma más

segura de realizar la asignación, y la más comúnmente utilizada; así la mayoría de EC

son EC aleatorizados (ECA). Sin embargo, se han propuesto y utilizado

procedimientos alternativos a la aleatorización, algunos de los cuáles se comentan

más adelante en esta misma unidad. Dada la importancia de la aleatorización,

destinamos las siguiente secciones a ver cómo puede realizarse e implementarse

correctamente, y a comentar algunos procedimientos alternativos.

2.6. Asignación aleatoria

Para poder elaborar un plan de aleatorización es imprescindible conocer lo siguiente:

• El nº de tratamientos a comparar y el diseño experimental propuesto

• El nº de sujetos experimentales que se incluirán en el EC

La aleatorización de tratamientos, secuencias o combinaciones de tratamientos (según

proceda dada la configuración del EC) puede conseguirse mediante distintos

algoritmos. Algunos programas incluyen procedimientos altamente especializados para

generar planes de aleatorización (p.ej., PROC PLAN de SAS®). Sin embargo, muchos

otros programas (como las hojas de cálculo, o StatCrunch) incluyen rutinas de

generación de números aleatorios que pueden utilizarse para generar esquemas de

aleatorización.

El esquema de aleatorización más sencillo es el llamado esquema completamente aleatorizado, en el que cada unidad experimental se asigna aleatoriamente a uno de

los tratamientos (o secuencias, o combinaciones), con probabilidades de asignación

conocidas y constantes. Por ejemplo, en un ECA paralelo de dos tratamientos (A y B),

estas probabilidades podrían ser PA = PB = 0,5. En este caso diríamos que la razón de

asignación (allocation ratio) es 1:1. Alternativamente, podríamos optar por una razón

de asignación 3:1, y entonces PA = 0,75 y PB = 0,25. En general, es preferible utilizar

diseños equilibrados (esto es, con razón de asignación 1:1) porque son los que




maximizan la potencia para un número total dado de unidades experimentales. La

figura 2.6 muestra un esquema completamente aleatorizado para 10 unidades

experimentales asignadas a uno de dos tratamientos con razón de asignación 1:1, así

como un algoritmo que puede utilizarse para generarlo.

Nótese que el esquema completamente aleatorizado no garantiza el equilibrio perfecto

del número de unidades asignadas a cada alternativa (de hecho, en el ejemplo de la

figura 2.6 hay 6 B y 4 A). Por ello, es frecuente introducir una restricción en la

aleatorización que garantice el equilibrio en el número de unidades asignadas a las

distintas alternativas cada k pacientes (donde k es un múltiplo del número de

alternativas). El esquema resultante se denomina esquema de bloques aleatorizados, del que se muestra un ejemplo en la figura 2.7. La aleatorización por

bloques tiene la ventaja de que, no solo equilibra las unidades si se completa el

ensayo, sino que también evita desequilibrios si el EC se interrumpe prematuramente.

Además, en ensayos multicéntricos garantizará el equilibrio de tratamientos en los

distintos centros siempre que se asigne (cualquier número de) bloques completos a

cada centro.

Cuando se conoce un factor pronóstico importante, se puede considerar deseable que

los grupos de tratamiento queden equilibrados en cuanto a dicho factor pronóstico.

Esto puede conseguirse mediante la aleatorización estratificada, en la que se

prepara una lista de aleatorización (posiblemente, de bloques aleatorizados) para cada

nivel del factor pronóstico (p.ej., pacientes leves, pacientes moderados y pacientes

graves), y los pacientes se asignan utilizando la lista correspondiente al estrato al que

pertenecen.

En ocasiones, las intervenciones aleatorizadas no se asignan a pacientes de forma

individual, sino a grupos de pacientes; aunque la respuesta se evaluará en cada uno

de los pacientes individuales. Esto puede ocurrir por conveniencia logística (p.ej.,

fluoración de las aguas en comunidades) o para evitar contaminación entre

intervenciones (p.ej., intervenciones dirigidas a profesionales sanitarios). En estos

casos se utiliza el término de ensayos con aleatorización de grupos (group-

randomized trials o cluster-randomized trials). Las unidades de aleatorización suelen

constituir grupos naturales, como los habitantes de una comunidad, los niños de una

clase, los pacientes de un médico o de un centro de salud, etc. El hecho de aleatorizar

grupos de pacientes (en lugar de pacientes individuales) tiene implicaciones en el

diseño y en el análisis del ensayo. Una de las características de estos diseños es que




no se puede suponer la independencia de las observaciones porque suele existir un

efecto de grupo, de manera que dos individuos de un mismo grupo son más

parecidos entre sí que dos individuos de grupos distintos. Aunque este efecto sea muy

pequeño, puede tener un impacto importante en el análisis, por lo que no se puede

ignorar.

2.7. Alternativas a la asignación aleatoria

La importancia de la asignación aleatoria es generalmente reconocida, y existe evidencia

empírica de ella, pero este reconocimiento no es universal y se han propuesto

procedimientos alternativos a la aleatorización para asignar el tratamiento a los sujetos

de un EC.

Algunos críticos de la aleatorización defienden sistemas de asignación que tienden a

forzar el equilibrio (o a minimizar el desequilibrio) de factores pronósticos conocidos.

Dichos procedimientos se designan con el término de minimización, procedimiento que

se ilustra en el siguiente ejemplo. Supóngase un EC en el que se considera que existen

dos factores pronósticos importantes: el sexo y la administración concomitante de cierto

tratamiento T. La tabla A de la figura 2.8 muestra la distribución de estos factores cuando

se llevan reclutados 60 pacientes. Para asignar el tratamiento al paciente 61 se generan

unas puntuaciones de minimización (minimization scores) sumando de los marginales los

factores de riesgo en cada grupo de tratamiento, tal como se hace en la tabla B. El nuevo

paciente se asignará al grupo con menor puntuación, en la columna que corresponde a

sus características. Si, por ejemplo, se trata de un hombre que está en tratamiento con T,

utilizaríamos las puntuaciones de la primera columna, y asignaríamos el paciente al

grupo control. Naturalmente, este procedimiento no puede utilizarse para el primer

paciente de cada combinación de factores, cuya asignación debe aleatorizarse.

Asimismo, en caso de ligas (empates en las puntuaciones), se puede utilizar alguna regla

arbitraria (p.ej., asignar al grupo contrario al de la última decisión arbitraria) o aleatoria.

Aunque estos procedimientos pueden parecer atractivos, no proporcionan ventaja alguna

respecto de la aleatorización en relación con la validez del análisis de los datos. Sí

pueden proporcionar mayor eficiencia, aunque la ventaja se desvanece rápidamente al

aumentar el tamaño muestral. Por otra parte, la minimización tiene dos inconvenientes

potencialmente muy serios. El primero, la imposibilidad de realizar una aleatorización

oculta y de mantener el ciego (véase más adelante). El segundo, no existe base teórica




para realizar cierto tipo de análisis de los resultados (pruebas de aleatorización). Sin

embargo, no existe evidencia empírica sobre el alcance práctico de estos inconvenientes.

En los llamados diseños adaptativos, el tratamiento asignado a un paciente se

determina a partir de la respuesta obtenida en el paciente anterior. Por ejemplo, si fue

un éxito, se administra el mismo tratamiento y, si fue un fracaso, se administra el otro

tratamiento, generando secuencias de asignación como la que se muestra en la figura

2.9 (en este caso la asignación del i-ésimo paciente depende exclusivamente del

resultado del paciente i-1, desaprovechándose la información acumulada

anteriormente, pero podrían utilizarse otros procedimientos que aprovechan mejor la

información disponible). Debiera ser claro que este mecanismo de asignación tenderá

a favorecer la asignación del tratamiento con mayor probabilidad de éxito y esto puede

considerarse interesante desde el punto de vista ético. Sin embargo, no son factibles

más que en procesos agudos cuyo tratamiento sea muy corto, la respuesta inmediata

y dicotómica (éxito/fracaso), y el reclutamiento lento. Por añadidura, la aleatorización

oculta y el enmascaramiento son imposibles (véase más adelante).

2.8. Más sobre aleatorización

La aleatorización tiene dos ventajas fundamentales respecto de otros procedimientos

de asignación. La primera, es que garantiza un asignación insesgada, porque es

independiente de cualquier característica del individuo aleatorizado, y por tanto es

independiente de cualquier posible factor pronóstico, sea éste conocido o

desconocido. Esto no ocurre, por ejemplo, en la minimización. La segunda es que

proporciona el único argumento necesario para la validez cierto tipo de pruebas de

hipótesis llamado pruebas de aleatorización. Estas dos propiedades son suficientes a

juicio de muchos para preferir la aleatorización sobre cualquier otro procedimiento de

asignación.

No es raro, sin embargo, que las virtudes de la aleartorización se expresen de manera

poco acertada. Así, es frecuente la afirmación de que “la aleatorización garantiza el

equilibrio basal de los grupos”, cosa que no es cierta: es posible que dos grupos

aleatoriazados muestren cierto grado de desequilibrio en cuanto a alguna variariable

(de hecho, si el número de variables analizadas es suficientemente elevado, es

bastante probable que ocurra un desequilibrio marcado en alguna de ellas); más aún,

si se utiliza un esquema completamente aleatorizado, ni siquiera estará garantizado el




equilibrio en el tamaño de los grupos. En cualquier caso, ninguna de estas

posibilidades invalida la inferencia, a condición de que la aleatorización se haya hecho

correctamente.

Una correcta aleatorización implica dos cosas: 1) que el esquema de asignación

(también llamado lista o secuencia de aleatorización) se hay generado correctamente

(es decir, de forma realmente aleatoria) y 2) que una vez generada, se haya utilizado

correctamente. El primer punto se puede conseguir utilizando alguno de los algoritmos

presentados en secciones anteriores. El segundo se comenta en la siguiente sección.

2.9. Aleatorización oculta (concealed randomization)

La adecuada utilización de una lista de aleatorización no está garantizada por defecto

debido a que no siempre se comprende bien su importancia (véase p.ej., Martyn C,

1996). Por otra parte, las consecuencias de una aleatorización mal implementada

pueden ser nefastas, y existe evidencia empírica de su impacto sobre la estimación del

efecto tratamiento. Por ello es necesario velar por una utilización adecuada.

La eventualidad más frecuente que puede suponer sesgos en la asignación de

tratamientos debidos a una incorrecta implementación de un esquema de

aleatorización es el conocimiento del tratamiento que se asignará a un paciente, en el

momento de decidir su inclusión en el ensayo. Esto puede ocurrir en EC abiertos, si la

lista de aleatorización se facilita al investigador. Veamos como.

Supongamos que un investigador confía más en uno de los tratamientos de un EC que

en el otro. Por ejemplo, si T1 es nuevo y T2 es un tratamiento cuya eficacia es

conocida desde hace tiempo, un investigador puede confiar en T2 pero tener lógicas

reservas con T1. Supongamos que él sabe que se asignará T1 al primer paciente

incluido en el EC. Se le presenta un caso que cumple los criterios de inclusión. Si se

trata de un caso grave, puede que el investigador decida no incluirlo en el EC, porque

se le asignaría T1 y no está seguro de que vaya a funcionar. En cambio, si el caso es

leve, puede que no tenga tantos reparos y lo incluya. Esto puede suceder durante todo

el EC con consecuencias nefastas: los casos graves se derivarán sistemáticamente a

T2 y los leves a T1. Sólo por esta razón, puede que se observen mejores respuestas

con T1 que con T2.




El vicio de asignación que acabamos de ilustrar sólo puede evitarse si se toman las

medidas necesarias para que el investigador no pueda predecir el tratamiento que se

asignará a un paciente en el momento de decidir su inclusión. Cuando un

procedimiento de aleatorización se implementa con garantías de que, en el momento

de decidir la inclusión de un paciente, el investigador no podrá predecir el tratamiento

que se asignará, se dice que la aleatorización está oculta (concealed randomization).

Esto puede conseguirse centralizando la aleatorización (p.ej., aleatorización

telefónica).

Ahora hay que hacer notar algo muy importante. Si un procedimiento de asignación es

sistemático, por inofensivo que parezca (p.ej., día de nacimiento par o impar), permitirá

al investigador conocer el tratamiento que se asignará a un paciente en el momento de

decidir su inclusión y, en consecuencia, puede introducir sesgos de selección de

pacientes (esto es, una selección diferencial) por el mecanismo explicado

anteriormente. Recuerde que las apariencias engañan: un procedimiento de

asignación aparentemente inofensivo puede no serlo en absoluto.

2.10. Enmascaramiento

El enmascaramiento de los tratamientos consiste en adoptar medidas para evitar que

éstos sean reconocibles. Cuando se adoptan estas medidas decimos que se trata de

un EC enmascarado o ciego (blind). Cuando no se adoptan estas medidas y se

pueden reconocer cuál es el tratamiento administrado en cada caso, se dice que el EC

es abierto (open). Según alguno s autores, para que un EC pueda ser enmascarado,

debe ser también aleatorizado.

El enmascaramiento, que es muy frecuente en EC con medicamentos pero no tanto en

EC sobre otro tipo de intervenciones, pretende evitar que, una vez iniciado el EC,

variables extrañas desconocidas que son extrínsecas al individuo puedan introducir

diferencias entre los sujetos asignados a distintos tratamientos. Hay diversas razones

por las que esto puede ocurrir.

En primer lugar, los sujetos experimentales pueden actuar de modo distinto por el

hecho de saberse tratados con uno u otro tratamiento, especialmente si uno de ellos

es un placebo. Tanto la actitud del paciente frente al tratamiento (y su cumplimiento)

como la propia respuesta, pueden afectarse por el hecho de conocer el tratamiento




recibido. Esto último es particularmente probable en indicaciones como el dolor, en

que la respuesta es necesariamente subjetiva. El problema no se limita a los EC en

que se compara un tratamiento activo con un placebo. Cuando se compara un nuevo

tratamiento frente a uno estándar, el paciente puede tener prejuicio hacia cualquiera

de ellos y en cualquier sentido: hay pacientes que tienen más esperanzas en las

novedades terapéuticas, y pacientes con una actitud más conservadora y preferencia

hacia lo que es bien conocido.

En segundo lugar, el médico investigador que administra el tratamiento también

puede tener prejuicio. Si conoce el tratamiento asignado a cada paciente, puede

examinar más exhaustivamente a los pacientes tratados con el fármaco experimental.

Esto podría introducir diferencias en el modo de evaluar la respuesta. Por ejemplo, la

incidencia de acontecimientos adversos es muy dependiente de la insistencia en el

interrogatorio: mucha gente tiene ocasionalmente síntomas inespecíficos (náuseas,

mareo, cansancio, cefalea, etc.), pero la probabilidad de que lo declare durante una

visita médica depende de la insistencia con que se le pregunte. Además, el

investigador puede tener cierta tendencia (muchas veces inconsciente) a utilizar

medidas de apoyo terapéutico de forma distinta según el tratamiento que recibe el

paciente. Puede que frases como ‘sobre todo ¡cuide la dieta!’, ‘¿ya hace ejercicio?’ u

otras similares induzcan un distinto uso de medidas de apoyo según cual sea el

tratamiento asignado al paciente. También es posible que el entusiasmo del

investigador por uno de los tratamiento contagie al paciente y éste modifique su actitud

frente al mismo, por ejemplo mejorando la cumplimiento del tratamiento. Por último, no

debe menospreciarse la posibilidad de que ocurran fenómenos de heterosugestión: no

es lo mismo decir a un paciente ‘ya verá como con esta pastilla se le va el dolor

inmediatamente’ que decirle ‘vamos a probar con esta pastilla’.

Por último, la persona que realiza la evaluación del resultado (ya sea la misma que

administra el tratamiento, o no) juega un papel fundamental. Si la evaluación tiene un

componente de subjetividad (p.ej., gravedad de un eczema) o está sujeto a error de

medida (¡siempre presente en cierto grado!), puede también tener tendencia

inconsciente a evaluar mejor los casos sometidos al tratamiento en el que deposita

mayores esperanzas. Ante cualquier duda en la evaluación, puede tender a ‘redondear

hacia arriba’ en unos casos y ‘redondear hacia abajo’ en otros, sin darse cuenta que

está introduciendo una diferencia sistemática entre los sujetos sometidos a distinto

tratamiento.




Para evitar estas posibilidades (¡u otras en las que ni siquiera hayamos pensado!), es

muy recomendable que, quienes reciben, administran y evalúan el resultado de los

tratamientos, se mantengan ignorantes del que se utiliza en cada caso.

2.11. Dificultades con el enmascaramiento

La manera más sencilla de enmascarar los tratamientos farmacológicos es prepararlos

de forma que sean físicamente indistinguibles. Sin embargo, incluso en EC de

medicamentos, el enmascaramiento no siempre es posible, y muchas veces es difícil;

notablemente, cuando se trata de comparar dos sustancias activas (p.ej., comprimidos

en un caso y cápsulas entéricas o solución oral en el otro) y puede que sea imposible

preparar ambos principios activos de forma que tengan iguales propiedades

organolépticas (aspecto, olor, sabor). Aun siendo posible, a veces es insuficiente: si la

vía de administración (oral, i.m.) o la frecuencia de administración (od, bid) son distintas,

será fácil identificar qué tratamiento está tomando un paciente. En estos casos suele

recurrirse a una técnica denominada doble simulación (double dummy), que consiste en

preparar dos placebos, uno para cada tratamiento activo (T1 y T2), y administrar T1

activo + placebo de T2 a unos pacientes, y T2 activo + placebo de T1 a otros. De este

modo, todos los pacientes reciben aparentemente el mismo tratamiento (misma cantidad

de comprimidos, inyecciones, etc.).

Aunque la doble simulación es una estrategia útil en muchos casos, puede que sea

imposible aplicarla. Por ejemplo, en un EC en otitis media supurativa crónica se

comparaba dos tratamientos activos que se administran en forma tópica (gotas óticas).

Las soluciones tenían una apariencia diferente (color). El doble-dummy no era una

posibilidad porque la capacidad del conducto auditivo es limitada y además la solución

activa quedaría más diluida de lo debido.

Otro tipo de dificultad muy preocupante es que algunos tratamientos se delatan por sus

efectos indeseables. Por ejemplo, aunque los tratamientos se enmascaren perfectamente

(tanto para el paciente como para el investigador), en un EC para comparar la eficacia de

un IECA y un bloqueador de los canales del calcio en hipertensión, es posible que los

tratamientos se delaten: los primeros producen tos y los segundos edemas maleolares.

Cuando aparecen estos acontecimientos adversos, será fácil saber qué tratamiento se

está administrando. Casi todos los fármacos producen efectos indeseables (sobre todo,

si son realmente activos). Si la incidencia de estos efectos no es muy baja, el




enmascaramiento puede convertirse en algo utópico. En estas situaciones, puede ser

interesante investigar la efectividad del enmascaramiento, pidiendo al médico

investigador que, tras evaluar la respuesta de cada paciente, intente adivinar cuál había

sido el tratamiento administrado. Esto permite verificar si el enmascaramiento fue

efectivo (ya que entonces la proporción de aciertos no debería ser mayor que la

esperable por azar); también es posible comparar las respuestas entre los tratamientos

asignados ajustando por el tratamiento que el investigador creía que se estaba

administrando.

2.12. Nota terminológica sobre enmascaramiento

Los términos simple ciego, doble ciego y evaluación ciega, hacen referencia a quién o

quiénes ignoran el tratamiento administrado. Cuando sólo los sujetos experimentales

ignoran cuál es el tratamiento que reciben (pero quienes administran el tratamiento

saben cuál es éste), se habla de simple ciego (single blind). Aunque los tratamientos se

enmascaren los investigadores podrían conocer el tratamiento que se administra a un

paciente determinado (por ejemplo, éste sería el caso si tuvieran libre acceso a la lista de

aleatorización). Cuando se toman las debidas precauciones para mantener ignorantes

tanto al sujeto que recibe el tratamiento, como al que lo administra, se dice que el EC es

doble ciego (double blind). En algunos ensayos abiertos la evaluación del resultado

corre a cargo de una tercera persona ignorante del tratamiento. Se dice entonces que la

evaluación se realiza a ciegas y se habla de EC con evaluación a ciegas. Aunque no

son de uso corriente, se han utilizado a veces extensiones de esta terminología, como

triple ciego para indicar que quien analiza los datos no conoce el tratamiento asignado.

Los términos doble ciego y simple ciego podían ser suficientes cuando los únicos

protagonistas de un EC eran los sujetos experimetales y los médicos investigadores. Hoy

en día, en un EC interviene un elevado numero de profesionales y por ello la terminología

de simple o doble ciego resulta insuficiente y se ha recomendado evitarla. En cualquier

caso, lo que sí es imprescindible es que, tanto en el protocolo como en la comunicación

de resultados, quede claro quién conoce y quién ignora los tratamientos asignados. En

los EC con medicamentos, se recomienda mantener ignorante a toda persona que

intervenga en el EC con las únicas excepciones del estadístico que prepara la lista de

aleatorización y el responsable de preparar los contenedores de medicación numerados

según la lista.




La realización de un EC enmascarado complica considerablemente la logística. La figura

2.10 muestra de forma esquemática cómo se prepara y utiliza la medicación en un EC

enmascarado. A pesar de estas complicaciones, se considera necesario enmascarar los

tratamientos siempre que sea posible y si no se hace es necesario justificarlo.

3. ANÁLISIS DE ENSAYOS CLÍNICOS

3.1. Conjuntos de análisis

Los conjuntos de análisis utilizados en un EC pueden ser distintos según el objetivo.

Por ejemplo, para un objetivo de superioridad de eficacia conviene retener en el

análisis a todos los pacientes aleatorizados (si es posible), estrategia que se conoce

como análisis por intención de tratar (intention-to-treat analysis). La exclusión de

casos debido a seguimiento incompleto o a violaciones del protocolo es peligrosa, tal

como iustrará el siguiente ejemplo. En la tabla A de la figura 2.11 se muestran los

resultados de un EC que comparaba un nuevo antidepresivo administrado a dos dosis

distintas (B1 y B2) con Amitriptilina (A). Aunque se aleatorizaron 50 pacientes, 15 de

ellos abandonaron, posiblemente debido a efectos secundarios del tratamiento. En la

tabla B de esta misma ilustración se muestran las proporciones de casos en que el

tratamiento se consideró muy eficaz, incluyendo sólo los casos evaluados o incluyendo

todos los pacientes aleatorizados. En el primer caso, el mejor resultado se observa en

el grupo B2. En el segundo caso, B2 y A presentan un resultado idéntico.

Evidentemente, el primer análisis ignora el fracaso implícito en el abandono del

tratamiento.

Sin embargo, cuando el objetivo de un EC es demostrar equivalencia o no-inferioridad,

puede ser más recomendable realizar el análisis con los pacientes que han seguido el

protocolo (per-protocol analysis). En los pacientes que no han cumplido

adecuadamente el protocolo (sobre todo, la duración y la cumplimentación del

tratamiento), las diferencias entre los tratamientos pueden manifestarse de forma

menos marcada, induciendo una aparente equivalencia y, por tanto, distorsionando los

resultados en el sentido de lo que se pretende demostrar.

Por lo que se refiere a los objetivos de evaluación de seguridad, lo razonable es limitar

el análisis a los pacientes que hayan recibido realmente tratamiento en estudio. En los

EC con fármacos, el conjunto de análisis de seguridad suele definirse como el




conjunto de todos los pacientes que han recibido al menos una dosis del tratamiento

asignado.

La predefinición de los conjuntos de análisis que se utilizará en cada objetivo es

imprescindible para evitar problemas de multiplicidad, sobre todo en el caso de

objetivos confirmatorios.

3.2. Pre-especificación del análisis principal confirmatorio

Es muy importante especificar de antemano el análisis principal de los objetivos

confirmatorios y hacerlo de manera que se evite cualquier posible fuente de

multiplicidad. Como ya se comentó en la unidad anterior, una pre-especificación

completa incluye la especificación de: 1) el conjunto de análisis, 2) la variable

analizada, 3) el método de análisis y el nivel de significación, 4) el número de

ocasiones en que se realizará el análisis (sólo al final o análisis intermedios).

La especificación de cada uno de estos puntos puede ser más complicada de lo que

parece. En cuanto a la especificación de la variable principal, frases como “la variable

principal será la presión arterial” son muy ambiguas, ya que hay muy diversas

variables compatibles con esta definición (PAS o PAD expresadas en mm Hg; o

disminución de PAS o PAD respecto del valor basal; o control de la PAS o de la PAD o

de ambas, expresado como variable dicotómica; etc.), que por lo demás no menciona

el momento de la determinación y probablemente se hará en distintas visitas. La

deseable inclusión del tiempo de evaluación en la definición de la variable principal

(p.ej., “el buen control de la PA (sí/no) en base a la PAS y la PAD medidas en la última

visita de seguimiento; se considerará buen control si PAS<140 y PAD<90”) suele exigir

la previsión de métodos para sustituir datos faltantes, al menos en el caso de que el

conjunto de análisis sea el de todos los sujetos aleatorizados (p.ej., “en los sujetos que

no realicen la última visita de seguimiento, se utilizará la última disponible, incluso si se

trata de la visita basal”) .

Por lo que se refiere al método de análisis, frases como “el análisis principal se

realizará mediante un análisis de la varianza (ANOVA)” son también ambiguas a

menos que se especifique el modelo concreto (p.ej. “un ANOVA de dos vías: el

tratamiento asignado y el centro, así como su interacción; ésta se retirará del modelo




si no resulta estadísticamente significativa, antes de evaluar la significación del efecto

tratamiento; se utilizará un nivel de significación bilateral del 5%”).

La pre-especificación del análisis debe hacerse en primera aproximación al redactar el

protocolo del EC, y debe quedar absolutamente cerrada en el plan de análisis. En los

EC a ciegas, el plan de análisis debe finalizarse antes de desvelar el ciego para

realizar el análisis.

3.3. Organización del análisis

Una forma conveniente y frecuente de organizar el análisis de los datos de un EC es

distinguiendo tres grandes bloques o secciones: análisis de características basales,

análisis de resultados de eficacia y análisis de resultados de seguridad. Cada una de

éstos análisis tiene propósitos diferentes y por ello no es raro que involucre técnicas

de análisis diferentes.

Las características demográficas y clínicas de los sujetos al inicio del estudio

(características basales) son importantes para dar una idea de la población a la que

podrían generalizarse los resultados del EC o, como diría un epidemiólogo, para juzgar

la validez externa de los resultados del EC. Además permiten juzgar la comparabilidad

de los grupos.

Las características basales deben analizarse de forma descriptiva y la descripción

debe hacerse por grupo de tratamiento. A pesar de que es una práctica común (¡y de

que algunas revistas pueden exigirlo!), no es recomendable hacer comparaciones

formales de las características basales para juzgar la comparabilidad de los grupos.

Hay tres razones para ello. La primera es que la significación estadística de las

diferencias basales, no informa necesariamente sobre la significación clínica de tales

diferencias, que por otra parte puede juzgarse perfectamente mediante una simple

descriptiva. La segunda, que el resultado (en términos de significación estadística) de

las comparaciones basales no determina la validez de los análisis de eficacia, ya que

ésta descansa exclusivamente en la aleatorización. La tercera es que la necesidad de

preespecificar el análisis de eficacia implica que la decisión de ajustar o no por

determinadas variables no puede condicionarse a ningún resultado del estudio.




En las siguientes secciones trataremos separadamente de los dos bloques restantes:

el análisis de eficacia y el análisis de seguridad.

3.4. Análisis de eficacia en EC paralelos

Los análisis de eficacia (o efectividad) de los EC tienen por objeto evaluar el efecto tratamiento. Es importante advertir que por efecto tratamiento entendemos una

medida de la discrepancia de resultados obtenidos con cada tratamiento. Así, una

medida de efecto tratamiento puede ser la diferencia de medias (en el caso de

respuesta continua) o la diferencia de proporciones (en el caso de respuesta

dicotómica, como éxito / fracaso) entre los dos tratamientos del ensayo. En

consecuencia, las pruebas de comparación de medias o de proporciones son

frecuentemente utilizadas, y en algunos casos son suficientes para analizar los datos

de eficacia. Este tipo de análisis, en los que no se ajusta por ninguna variable (análisis

no ajustados) tienen la virtud de la simplicidad y de la robustez.

Sin embargo, es posible que convenga realizar análisis algo más sofisticados, que

permitan evaluar el efecto tratamiento ajustando por ciertas variables (análisis

ajustados). Dos situaciones muy frecuentes en que esto es aconsejable son los EC

multicéntricos y la disponibilidad de valores basales de la variable respuesta. En los

EC multicéntricos, puede existir un efecto centro, a veces marcado, y si es así

conviene incluirlo en el análisis para reducir variabilidad residual de las respuestas y

aumentar la potencia. Además, si el efecto tratamiento y el efecto centro no están

perfectamente equilibrados (p.ej. debido a pérdidas), entonces en un análisis no

ajustado por centro éste puede actuar como variable de confusión. En cuanto a la

disponibilidad de valores basales, que es muy frecuente en el caso de respuestas

continuas, los valores basales suelen ser muy predictivos del valor final y al ajustar por

ellos se consigue una reducción muy importante de la variabilidad residual con el

consiguiente aumento de la potencia.

Cuando haya necesidad de ajustar por ciertas variables (como el centro o el valor

basal de la respuesta), los modelos lineales generalizados ofrecen la flexibilidad

necesaria para realizar una evaluación ajustada del efecto tratamiento ajustando por

variables cualitativas, cuantitativas, o de ambos tipos. El tipo de de modelo lineal

generalizado dependerá de las características de la variable respuesta. Posiblemente,

los dos casos más frecuentes son el de respuesta continua y el de respuesta




dicotómica, que pueden analizarse mediante el modelo lineal general (ANCOVA) y el

modelo de regresión logística, respectivamente. Cuando la variable respuesta es

dicotómica, si sólo hace falta ajustar por el efecto centro (p.ej., si no se dispone de

valores basales), pueden utilizarse también métodos de análisis estratificado, como el

estadístico Chi-cuadrado de Mantel-Haenszel o el Odds Ratio ajustado de Mantel-

Haenszel (al final de la unidad se ofrece un enlace que explica esto métodos). Cuando

la respuesta es continua, a veces se utiliza una forma sencilla de ajustar por el valor

basal que consiste en analizar el cambio observado desde la situación basal hasta la

final. Aunque esto no es necesariamente incorrecto, tampoco es óptimo. En la

siguientes secciones se comenta esta forma de análisis y la que se considera más

más adecuada.

3.5. Ajuste por valores basales en EC paralelos: análisis del cambio

Cuando se dispone de valores basales de la variable respuesta, a veces se utiliza una

forma intuitiva y sencilla de ajustar por dichos valores basales que consiste en

analizar el cambio absoluto (CA) observado desde el valor basal (B) hasta la el final

(F), es decir CA = F – B. Otras veces se analiza el cambio porcentual CP = (F – B) / B

en lugar del cambio absoluto (CA). Un problema habitual es la falta de justificación

para analizar uno u otro: la elección suele responder a los “usos y costumbres” y es

caprichosamente variable en distintas áreas de investigación.

Se han propuesto criterios racionales y sencillos para adoptar CA o CP, que se basan

en la inspección de la relación entre F y B en ambos grupos. En el infrecuente caso de

que F y B sean independientes (figura 2.12), ajustar por B no tendría más sentido del

que ajustar por un número escogido al azar. Por el contrario, si F y B están

relacionados (figura 2.13), entonces interesará ajustar por el valor basal escogiendo la

medida de cambio (CA o CP) que resulte menos dependiente del valor basal, lo que se

puede hacer inspeccionando los dos diagramas de dispersión de la figura 2.14: es

claro que CP es menos dependiente de B que CA, por lo que representa un mejor

ajuste.

Aunque las estrategias consistentes en analizar el cambio (absoluto o porcentual,

según convenga) son aceptables, no son óptimas. La forma óptima de realizar el

ajuste es mediante un modelo lineal de tipo ANCOVA, por las razones que se ilustran

en la siguiente sección.




3.6. Ajuste por valores basales en EC paralelos: ANCOVA

El ANCOVA es posiblemente la forma más satisfactoria de ajustar por los valores

basales. Comparado con las alternativas comentadas en la sección anterior,

proporciona un sistema de ajuste más flexible porque estima la relación entre los

valores finales y basales. Es fácil ver esto considerando el modelo lineal utilizado en

un ANCOVA, en el que el valor final (XF) se expresa como una función (lineal) del valor

basal (XB) y del efecto tratamiento (τ), además de un término independiente (α) y de

un error aleatorio (e):

XF = α + β XB + τ + e

y en consecuencia,

XF - (α + β XB) = τ + e

Es fácil ver que el primer término de la igualdad coincide con el cambio absoluto sólo

en el caso de que α = 0 y β = 1. Efectivamente, en este caso no hay que esperar

diferencia entre un ANCOVA o el análisis del cambio absoluto. Sin embargo, es muy

frecuente que la pendiente del valor basal sea inferior a 1 (β<1) y entonces los dos

análisis ya no son equivalentes. En general, es preferible el ANCOVA porque ajusta

según los valores estimados de α y de β, que describen cómo es la dependencia

(regresión lineal) entre los valores finales y los basales.

Una ventaja adicional de este análisis es que permite evaluar la posible existencia de

una interacción entre los valores basales y el tratamiento (mediante la ampliación del

modelo anterior con el correspondiente término de interacción). Si dicha interacción

resulta significativa, el efecto tratamiento depende del valor basal, y es posible

estimarlo para distintos valores basales pero, en general, no tendría mucho sentido

facilitar una única estimación de dicho efecto.

La única limitación del ANCOVA es que la inferencia se basa en un modelo, lo que

obliga a verificar que se cumplen las condiciones en las que descansa la validez de

dicha inferencia (las habituales del modelo lineal general). Si no se cumplen

(heterocedasticidad, outliers, no-normalidad, etc...), la estimación del efecto

tratamiento puede ser ineficiente o incluso sesgada. Por el contrario, el análisis




análisis del cambio (absoluto o porcentual) C o CP, permite utilizar pruebas de

aleatorización (p.ej., Mann-Whitney) que no requieren de ninguna suposición.

3.7. Otros usos de los valores basales en EC paralelos

Con cierta frecuencia se utiliza una estrategia de análisis consistente en decidir si vale

la pena realizar un análisis ajustado de los valores finales en base a la existencia o no

de diferencias significativas en la comparación de los valores basales. Esta estrategia

es totalmente inadecuada porque la comparación formal de los valores basales no

proporciona ninguna información útil para decidir merece la pena ajustar. El hecho de

que existan diferencias basales significativas entre los grupos de tratamiento, no

implica que un análisis no ajustado de los valores finales sea inválido, a condición de

que la aleatorización se haya realizado correctamente (y es posible que se produzcan

diferencias basales significativas tras una aleatorización correcta). Por otra parte, el

hecho de que no existan diferencias basales estadísticamente significativas, ni implica

que no exista cierto grado de diferencia, ni sobre todo, que no se gane potencia al

realizar un análisis ajustando por los valores basales. Además, esta estrategia es

incompatible con la preespecificación del análisis. Por lo tanto, no hay ningún motivo

que justifique utilizar el resultado de la comparación de valores basales para decidir si

se debe realizar un análisis ajustado o no ajustado. En cualquier situación en la que se

disponga de valores basales y éstos estén relacionados con los finales, el análisis

ajustado es preferible.

3.8. Uso de medidas intermedias en EC paralelos

Con mucha frecuencia, no sólo se dispone de valores basales sino que se tienen

diversas evaluaciones intermedias de la variable principal entre la medición basal y la

final. En estos casos se pueden utilizar diversas estrategias de análisis que

comentamos seguidamente.

La primera posibilidad es ignorar las medidas intermedias. Aunque pueda parecer que

al hacerlo perdemos información, en muchos casos esta información no será

relevante. La razón es que, cuando se diseña un EC, la duración del tratamiento hasta

la evaluación final suele ser la que se considera necesaria para que el tratamiento




pueda desarrollar su presunto efecto, por lo que las medidas intermedias son

demasiado precoces, y lo que interesa es evaluar el estado final. Sin embargo, en

algunos casos puede tener interés, no sólo el estado final, sino también ciertos

aspectos del recorrido, como por ejemplo la rapidez con que se ha desarrollado el

efecto de los tratamientos. Si éste es el caso, no podremos ignorar las medidas

intermedias.

La segunda posibilidad es utilizar métodos de análisis que permiten analizar medidas

repetidas. Algunos de estos métodos son poco recomendables porque se basan en

suposiciones que pueden ser poco razonables y difíciles de evaluar (p.ej., el llamado

análisis multivariante de la varianza o MANOVA, o un caso particular conocido a veces

como análisis de perfiles). Más recomendables son los modelos mixtos, una variante

de los modelos lineales generalizados que permite especificar modelos en que la

respuesta se expresa como una función de una serie de efectos fijos o aleatorios. Este

tipo de análisis, que es muy flexible, es relativamente complejo y cae fuera de lo que

sería razonable explicar en este curso, pero supone una posibilidad excelente, si no

para el análisis principal (en el que conviene utilizar métodos simples y robustos que

no dependan de demasiadas suposiciones), sí al menos para realizar análisis

secundarios de carácter exploratorio.

Una tercera posibilidad es la de analizar medidas resumen que conserven la

información interesante de la evolución de la variable respuesta a lo largo del

seguimiento. Por ejemplo, si interesa ver la rapidez con que decae un dolor a partir de

diversas medidas realizadas a lo largo del tiempo, se puede calcular la pendiente

(como medida de cambio por unidad de tiempo) de cada individuo mediante un modelo

de regresión simple (Y=medida del dolor; X=tiempo) y analizar los valores de las

pendientes (esto es de hecho equivalente a algunos modelos mixtos conocidos a

veces como modelos de coeficientes aleatorios). En los ensayos de farmacocinética,

se utiliza el área bajo la curva que describe la evolución de la concentración

plasmática del fármaco a través del tiempo como medida resúmen de la

biodisponibilidad del fármaco, así como otros resúmenes (Cmax, tmax). Las medidas

resumen tienen la virtud de simplificar los datos a analizar una medida por unidad

experimental, en lugar de un vector o serie de medidas a lo largo del tiempo). Además

dan una idea realista de la cantidad de información disponible (algunos investigadores

piensan que, por el hecho de disponer de muchas medidas repetidas, tienen mucha

información, aunque el número de unidades experimentales se muy escaso). Por

último, al tratarse de un único valor para cada paciente, puede analizarse mediante




técnicas sencillas, incluyendo las no-paramétricas si es necesario (p.ej. U de Mann-

Whitney).

3.9. Análisis de eficacia en EC cruzados AB/BA

En los EC cruzados cada individuo ofrece una respuesta bajo cada unos de los

tratamientos a comparar y, por lo tanto, desde el punto de vista del análisis, se trata de

comparar series de datos pareados. Pero es importante recordar que se ha

aleatorizado la secuencia de administración de los tratamientos: en el diseño AB/BA

algunos individuos se tratan con A en primer lugar (primer periodo) y luego con B

(segundo periodo), mientras que otros individuos comienzan con B (primer periodo) y

luego A (segundo periodo).

La forma más simple de análisis sería utilizar métodos para datos apareados, como

por ejemplo la prueba de McNemar si la respuesta es dicotómica, o la t de Student

para datos pareados si es continua. Sin embargo, estos métodos de análisis no tienen

en cuenta la posible existencia de un efecto período, esto es (en un diseo AB/BA)

diferencias entre el primer y el segundo periodo de tratamiento.

En caso de que dicho efecto periodo esté presente (p.ej, mejoría espontánea de la

condición patológica problema), ignorarlo supondrá siempre una cierta pérdida de

potencia y de precisión en la estimación del efecto tratamiento. Además, si el diseño

no está equilibrado, es decir, si hay más individuos en una secuencia (p.ej., AB) que

en la otra (BA), la estimación del efecto estará sesgada porque existirá cierto grado de

confusión entre el efecto periodo y el efecto tratamiento (la confusión será tanto mayor

cuanto mayor sea el desequilibrio del diseño). Para evitar estos inconvenientes, se han

propuesto distintas formas de análisis que permiten evaluar el efecto tratamiento

ajustando por el efecto periodo. En la siguiente sección presentamos una de ellas para

el diseo AB/BA.

3.10. Análisis ajustando por el efecto periodo en diseos AB/BA

Cuando la respuesta es continua, el análisis de Hills-Armitage es una opción sencilla

para evaluar el efecto tratamiento ajustando por el efecto periodo. Un procedimiento




más sofisticado es el llamado modelo de Grizzle, un modelo lineal que no Ilustraremos

aquí pero que puede encontrarse en la bibliografía referenciada al final de esta unidad.

Para ilustrar el análisis de Hills-Armitage analizaremos un ejemplo extraído de Senn

(1993), en que se evalúa el efecto de dos broncodilatadores (Salbutamol vs

Formoterol) sobre el flujo espiratorio máximo (FEM) en el asma bronquial infantil. Los

pacientes se asignaron aleatorimente a una de dos secuencias de tratamiento: F/S o

S/F. Los datos del FEM y el resultado de un análisis sin ajustar por periodo el se

presentan en la figura 2.15.

El análisis de Hills-Armitage se basa en la idea de que promedio de las diferencias

cruzadas (diferencias entre tratamientos) de una secuencia estará afectado por el

efecto tratamiento y por el efecto periodo, si existe. Si se promedian los promedios de

cada secuencia, el efecto periodo desaparece, debido a que tiene signos distintos en

las dos secuencias. Por lo tanto, el promedio de las medias de las diferencias

cruzadas de cada secuencia queda libre del efecto periodo pero retiene el efecto

tratamiento. Si éste no existe (es decir, si los tratamientos son iguales), este promedio

no debe diferir significativamente de cero. Este análisis se ilustra en la figura 2.16. En

este caso, el resultado de la estimación del efecto tratamiento ajustando por periodo

(46,61 l/min) es muy similar al que se obtiene en el análisis no ajustado (45,38 l/min).

Asimismo, los grados de significación (p) son también muy similares (aunque el del

análisis ajustado es algo inferior, debido al aumento de potencia). La similitud de

resultados se debe a que, en este ensayo, tanto el efecto periodo como el

desequilibrio el diseño son muy pequeños. Sin embargo, las diferencias pueden ser

muy importantes cuando el efecto periodo sea marcado.

3.11. Respuestas binarias

Una aproximación sencilla al análisis de respuestas binarias puede realizarse una

prueba de McNemar, despreciando los casos no informativos para el efecto

tratamiento (los que han ofrecido igual resultado con cada tratamiento) y reteniendo

aquellos con distinto resultado, que podrán clasificarse como ‘mejor resultado con A’ o

bien ‘mejor resultado con B’. Este sería un análisis no ajustado por periodo.




Para realizar un análisis del efecto tratamiento ajustando por el efecto periodo se

puede utilizar la prueba de Mainland-Gart. Esta prueba consiste en analizar la relación

entre secuencias y periodos, es decir, la asociación en la siguiente tabla:

Mejor en

periodo 1

Mejor en

periodo 2

AB c d

BA e f

Un efecto tratamiento tenderá a producir asociación en esta tabla. Por ejemplo, un

predominio de casos en las casillas e y f sería indicativo de superioridad del

tratamiento A. La asociación evaluarse mediante el estadístico Chi-cuadrado de

Pearson o mediante la prueba de Fisher.

3.12. Análisis de seguridad

En general, el propósito del análisisis de seguridad difiere considerablemente del que

es propio del análisis de eficacia, como se verá en el siguiente ejemplo. Se trata de un

EC aleatorizado, doble ciego, paralelo, que comparó dos preparados tópicos en el

tratamiento de una afección cutánea. El número de pacientes que presentaron

acontecimientos adversos (AA) se muestra en la figura 2.17. El resultado de una

prueba de hipótesis para comparar la proporción de pacientes con AA entre ambos

tratamientos es p=0,114, con lo que no podemos rechazar la hipótesis nula de

igualdad. Por tanto, el resultado de esta prueba de hipótesis no llama la atención sobre

posibles desventajas de un tratamiento en lo referente a seguridad.

Sin embargo, la mera inspección de los AA registrados, así como la atribución de

causalidad según el juicio subjetivo del investigador, sugiere lo contrario, tal como se

muestra en la figura 2.18: aunque sólo se presentaron en 4 pacientes, los AA son del

mismo tipo (desarrollo o agravamiento de afecciones cutáneas), ocurrieron poco

después y en el lugar de la aplicación del tratamiento tópico. Sin duda, esta




información es suficiente para sospechar que el tratamiento A puede inducir

reacciones cutáneas en el lugar de la aplicación.

El ejemplo anterior pretende ilustrar el escaso o nulo interés de las pruebas de

significación en los análisis de seguridad y lo informativo que resulta en cambio el

análisis descriptivo, incluso si es tan simple como un listado de características de los

AA. Efectivamente, las técnicas descriptivas son el pilar de los análisis de seguridad

en los EC y la razón de ello es que, mientras que el análisis de eficacia pretende

demostrar algo, y para ello necesita evidencia suficiente (p<0,05), el análisis de

seguridad pretende alertar sobre posibles problemas, y para ello no hace falta tener

un alto grado de evidencia sino que basta con la mera sospecha.

Además de los listados y tablas de frecuencias de AA, el análisis de los signos vitales

y de las analíticas, fundamentalmente graficos, constituyen el pilar del análisis de

seguridad.

3.13. Criterios de evaluación de seguridad

Los criterios que se utilizarán para evaluar la seguridad pueden variar según la

indicación y los tratamientos del EC pero el criterio más importante es siempre la

aparición de acontecimientos adversos (AA). Estos se definen como cualquier

condición indeseable en la que pueda incurrir un paciente durante un EC,

independientemente de que se la considere relacionada o no con el tratamiento en

estudio (p.ej., caída fortuita).

En los EC de medicamentos, es frecuente también la evaluación de las constantes

vitales (pulso, presión arterial y frecuencia respiratoria) y de variables de laboratorio o

analíticas como parte del análisis de seguridad. En cuanto a estas últimas, se utilizan

con frecuencia la hematología básica, los iones plasmáticos y los enzimas que

permiten evaluar la función hepática y renal.

En algunos EC se incluyen exploraciones complementarias, como electrocardiogamas

(ECG) o pruebas de imagen, si se piensa que pueden poner de manifiesto problemas

de seguridad del fármaco.




3.14. Análisis de AA

En general, el análisis de seguridad suele ser mucho más laborioso que el análisis de

eficacia. Esto se debe tanto a ciertas particularidades de los datos de seguridad como

al objetivo de dicho análisis, que es exploratorio.

Los AA se capturan en forma textual y su carácter heterogéneo y diverso hace difícil el

análisis. Incluso en EC de muestra relativamente pequeña, si la incidencia de AA es

alta, se hace imprescindible codificar los AA para poder describirlos de forma

inteligible. Para ello se utilizan diccionarios específicos (MEDDRA).

Un problema importante es la falta de independencia de los AA registrados en un EC,

puesto que un paciente puede presentar más de un AA. Por ello es importante

describir el número de pacientes con AA, además del número de AA.

Las técnicas más recomendables para describir los AA dependen de su número. Si en

un EC se han presentado muy pocos AA lo más práctico será un listado de todos ellos,

por grupo de tratamiento. Cuando el número de AA sea elevado, convendrá generar

tablas de frecuencias. Para que sean de alguna utilidad, habrá que generar dichas

tablas usando los términos del diccionario utilizado para codificar los AA en lugar de

usar los textos de las descripciones originales escritos por el investigador.

También puede ser interesante analizar algunas características de los AA, como el

tiempo en que se presentaron (expresado en forma de días relativos respecto del inicio

del tratamiento), su duración, su gravedad, o la atribución de causalidad al tratamiento

del estudio según el juicio subjetivo del médico investigador.

Por último, si el tiempo de seguimiento de los pacientes es variable (p.ej., EC de

supervivencia), convendrá utilizar técnicas de análisis de supervivencia para estimar la

incidencia de AA.

3.15. Análisis de datos de laboratorio

Como en el caso de los AA, el análisis de datos de laboratorio debe perseguir la

detección de casos individuales con posibles desviaciones, más que la detección de

fenómenos generales, y por ello los análisis de datos agregados (como medias)

pueden ser menos útil que ciertos análisis descriptivos. En la figura 2.19 se muestra un




gráfico especialmente útil para detectar alteraciones individuales en una variable de

laboratorio. Se trata de un diagrama de dispersión en el que se representan los sujetos

(que se identifican por el número de aleatorización) en función del valores basal y final

de un analito (en este caso, la glucosa), y se incluyen líneas de referencia para el

rango de valores normales y para la recta identidad. Ello permite identificar

rápidamente casos que muestran valores fuera de la normalidad. Por ejemplo, en

ambos grupos se observan casos con un valor final elevado, pero esta elevación ya

estaba presente al inicio del estudio. Sin embargo, en el grupo tratado aparece un

sujeto (22) con un valor basal dentro de los límites de normalidad, pero que presentó

hipoglucemia al final del estudio.

Aunque lo más habitual es determinar los datos de laboratorio en dos ocasiones (al

inicio y al final del tratamiento), si se han realizado determinaciones en visitas

intermedias se puede optar por un diagrama de perfiles individuales, marcando

también las líneas de referencia de los límites de normalidad, como el de la figura

2.20.

3.16. Comunicación de resultados (CONSORT)

Por lo que se refiere a la comunicación de resultados, además de la guía CONSORT

incluida como parte de esta unidad, conviene conocer que existen versiones

adaptadas a ciertos casos especiales. En el momento de redactar esta unidad, están

disponibles las siguientes extensiones de la guía CONSORT:

• Ensayos que pretenden demostrar no-inferioridad o equivalencia

• Ensayos con aleatorización de clusters

• Ensayos sobre intervenciones no farmacológicas

• Evaluación del dao

• Redacción de resumenes de ensayos clínicos

Todas estas extensiones pueden conseguirse gratuitamente en la página web de la

iniciativa CONSORT.




4. LECTURAS RECOMENDABLES

• Web de la iniciativa CONSORT : http://www.consort-statement.org/

en el que se puede encontrar, entre otras muchas cosas interesantes, la versión

larga de la guía, y extensiones de la guía adaptándola a ensayos de no-

inferioridad, ensayos con aleatorización de clusters, ensayos de intervenciones no

farmacológicas.

• Traducción de la guía CONSORT al castellano.

• Calculadora de tamaño muestral para ensayos con diseño paralelo.

• Explicación de los métodos de Mantel-Haenzsel para el análisis estratificado de

respuestas dicotómicas.

• Un libro excelente sobre diseo y análisis de ensayos clínicos cruzados, donde

encontrará el análisis de Hills-Armitage, el modelo de Grizzle y mucho más...

Senn 2002. Crossover trials in clinical research. 2ª ed. John Wiley & Sons.

Chichester (UK)




5. RESUMEN

En esta unidad hemos tratado del diseo y análisis de EC. Hemos comenzado

distinguiendo distintos tipos de objetivos confirmatorios como la demostración de

superioridad, la demostración de no-inferioridad y la demostración de equivalencia.

Hemos comentado las configuraciones más habitualmente utilizadas en EC - el diseo

de (dos) grupos paralelos, el diseo cruzado AB/BA y los diseos factoriales – y hemos

ofrecido para cada una de ellas un algoritmo para generar una secuencia aleatoria de

asignación de tratamientos, secuencias de tratamientos o combinaciones de

tratamientos.

La forma en que se asignan los tratamientos a las unidades experimentales es una de

las cuestiones metodológicas más importantes del EC. En general, se considera que la

asignación aleatoria o aleatorización, es el método de asignación más seguro para

evitar sesgos en la evaluación del efecto tratamiento, pero es necesario generarla e

implementarla correctamente (aleatorización oculta). Hemos comentado brevemente

algunos métodos de asignación alternativos a la aleatorización, como la minimización

o los diseos adaptativos.

El enmascaramiento de los tratamientos es posiblemente la segunda medida de

prudencia más importante para evitar sesgos, particularmente sesgos de evaluación.

Según cuáles sean los tratamientos, el enmascaramiento puede ser difícil y requerir

técnicas especiales (como el doble dummy), o imposible.

En relación con el análisis de EC, hemos insistido en la importancia de dejar

completamente definido el análisis principal de los objetivos confirmatorios, y hemos

comentado las estrategias de análisis más recomendables para el análisis de eficacia

o de efectividad en EC paralelos y en EC cruzados AB/BA. Por último hemos

comentado algunas cuestiones muy generales sobre en análisis de seguridad que

siempre debería incluirse como objetivo, posiblemente secundario, en los EC.




6. EJERCICIOS

Ejercicio 1

¿Cuál de las siguientes es una ventaja fundamental de la aleatorización?

1. Consigue grupos comparables en cuanto a factores pronósticos

2. Consigue grupos de igual tamaño

3. Consigue que la asignación sea insesgada

4. Todas las anteriores

5. Ninguna de las anteriores

Nota: Para ver y contestar la pregunta de este caso, debe acceder a la versión on line

del curso, que encontrará en el Campus del CEC.

Ejercicio 2

¿En cuál de los siguientes casos podría utilizarse un diseo AB/BA para comparar la

eficacia de dos fármacos? (se indica la patología y la respuesta a evaluar)

1. Infección del tracto urinario: curación a los 7 días

2. Dolor post-quirúrgico agudo: desaparición del dolor a las 24h

3. Dismenorrea primaria: número de días con dolor

4. Todas las anteriores

5. Ninguna de las anteriores



Ejercicio 3

¿En cuál de los siguientes objetivos de investigación es apropiado realizar el análisis

con todos los pacientes aleatorizados, sin excluir desviaciones del protocolo (como no

haber tomado correctamente la medicación)?

1. Demostrar que A es más efectivo que B

2. Demostrar que A y B son equivalentes en eficacia




3. Establecer la relación entre dosis y respuesta de un fármaco

4. En todos los anteriores

5. En ninguno de los anteriores



Ejercicio 4

Un EC paralelo compara dos fármacos hipolipemiantes y utiliza como respuesta el

colesterol total (mg/dl) a los 6 meses de tratamiento. Se dispone de una medida basal

de colesterol. ¿Qué análisis es más adecuado?

1. Análisis del colesterol a los 6 meses mediante t de Student

2. Análisis de la reducción absoluta desde el inicio hasta los 6 meses, mediante t

de Student

3. Análisis de la reducción porcentual desde el inicio hasta los 6 meses, mediante

t de Student

4. ANCOVA del valor a los 6 meses ajustando por el valor basal

5. Ninguno de los anteriores



Ejercicio 5

¿Que es cierto en relación con el análisis de eficacia en un EC cruzado?

1. Una t de Student para datos apareados implica no ajustar el efecto periodo

2. El análisis de Hills-Armitage ajusta un posible efecto periodo

3. El análisis de varianza mediante el modelo de Grizzle ajusta el efecto periodo

4. Todas las anteriores son correctas

5. Ninguna de las anteriores es correcta






7. FIGURAS

F 2·1 Hipótesis formales según el tipo de objetivo

En los objetivos de no inferioridad se persigue demostrar que el tratamiento control no aventaja al experimental en más de una cierta cantidad, que representa diferencias poco relevantes y que se adopta como límite de no inferioridad ( ).

En los objetivos de no inferioridad se persigue demostrar que, si existe alguna diferencia entre ambos tratamientos, está confinada en un intervalo que representa diferencias poco relevantes y que se adopta como intervalo de equivalencia ( 1 , 2).




F 2·2 IC(1- ) y conclusión según el tipo de objetivo




F 2·3 Diseño paralelo de 2 grupos

F 2·4 Diseño cruzado 2 x 2 (AB/BA)




F 2·5 Diseño factorial 2 x 2

F 2·6 Diseño completamente aleatorizado para asignar n=10 pacientes a uno de dos tratamientos con razón de asignación 1:1

Orden de inclusión Nº aleatorio Tratamiento

1 0.90533744 B

2 0.11472337 A

3 0.78921733 B

4 0.92033173 B

5 0.29607056 A

6 0.90256438 B

7 0.67698719 B

8 0.13811889 A

9 0.30342397 A

10 0.53030161 B

Algoritmo implementable en cualquier hoja de cálculo

1. Identificar las n unidades mediante el nº de orden de inclusión en el ECA

2. Asignar un número aleatorio entre 0 y 1 (x) a cada observación*

3. Si x < 0,5 asignar A y si x > 0,5 asignar B




* En Microsoft Excel puede utilizarse la función ALEATORIO(). En otras hojas de cálculo habrá que utilizar una función análoga que genere un valor entre 0 y 1 con distribución uniforme.

Algoritmo para StatCrunch


2. Generar n números aleatorios en una única columna (x), utilizando la opción Data>Simulate data>Bernoulli, con parámetros Rows=n Columns=1 y p=0,5

3. Si x=1 asignar A y si x=0 asignar B

F 2·7 Diseño de bloques (de tamaño k=4) aleatorizados para asignar n=12 pacientes a uno de dos tratamientos con razón de asignación 1:1

Orden de inclusión Nº de bloque

Nº orden dentro del bloque Nº aleatorio Tratamiento

1 1 0.35217175 A

2 2 0.53076959 B

3 3 0.49007545 A

4

1

4 0.89951541 B

5 1 0.06543855 A

6 2 0.49178842 B

7 3 0.64405666 B

8

2

4 0.38334380 A

9 1 0.17422751 A

10 2 0.29970805 A

11 3 0.40023484 B

12

3

4 0.91772354 B

Algoritmo implementable en cualquier hoja de cálculo


2. Asignar el número de bloque

3. Asignar un número aleatorio entre 0 y 1 (x) a cada observación*

4. Ordenar por bloque y, dentro de cada bloque, por x

5. En cada bloque, asignar A a las dos primeras y B a las restantes unidades

6. Reordenar por número de orden de inclusión

* En Microsoft Excel puede utilizarse la función ALEATORIO(). En otras hojas de cálculo habrá que utilizar una función análoga que genere un valor entre 0 y 1 con distribución uniforme.




Algoritmo para StatCrunch


2. Generar n números aleatorios en una única columna (x), utilizando la opción Data>Simulate data>Bernoulli, con parámetros Rows=n Columns=1 y p=0,5

3. Si x=1 asignar A y si x=0 asignar B

F 2·8 Minimización

para procurar equilibrio en dos factores pronósticos: sexo (H, M) y tratamiento concomitante (T , noT)

Tabla A. Distribución de factores pronósticos tras reclutar 60 pacientes

Factores Pronósticos

Niveles de los factores

Grupo Experimental

Grupo Control

Total

Sexo Hombres (H) 16 14 30

Mujeres (M) 14 16 30

Tratamiento T Sí (T) 20 19 39

No (noT) 10 11 21

Tabla B. Puntuaciones de minimización para los cuatro posibles tipos de pacientes, a partir de la situación de la tabla A

Grupo H T H noT M T M noT

Experimental 36 26 34 24

Control 33 25 35 27

F 2·9 Diseño Play-the-Winner

Se aleatoriza el tratamiento del primer paciente (A o B). Si tiene éxito (E), se le asigna el mismo tratamiento al siguiente paciente; si fracasa (F) se administra el otro tratamiento.

Paciente: 1 2 3 4 5 6 7 8 9 10 11

Tratamiento: A A B A B A B B B B A

Resultado: E F F F F F E E E F F




F 2·10 Preparación de la medicación en un EC enmascarado

• 1. El estadístico responsable del diseo genera la lista de aleatorización y sobres cerrados identificados con el un nº de aleatorización que contienen la información del tratamiento asignado.

• 2. El director técnico del laboratorio promotor del EC recibe la lista de aleatorización y prepara la medicación, identificando los contenedores con los números de aleatorización.

• 3. El médico investigador recibe tanto los contedores numerados, como los sobres cerrados, con las siguientes instrucciones:

o Asignar los contenedores de medicación según el orden de inclusión de los pacientes en el EC: el contenedor nº1 al primer paciente incluído, el nº2 al segundo, y así sucesivamente.

o No abrir los sobres excepto si se produce una situación de urgencia clínica con un paciente.

F 2·11 Impacto de las pérdidas de casos en el análisis

Tabla A. Resultados de un EC que compara tres tratamientos (B1, B2 y A).

Respuesta B1 B2 A

Muy eficaz

Eficaz

Ineficaz

Total evaluados

2

4

3

9

8

2

2

12

6

8

0

14




Retirados

Total aleatorizados

6

15

8

20

1

15

Tabla B. Análisis incluyendo y excluyendo los casos retirados

Proporción de casos con

Respuesta = Muy eficaz B1 B2 A

Sobre los evaluados

Sobre los aleatorizados

2/9 = 0,22

2/15 = 0,13

8/12 = 0,66

8/20 = 0,40

6/14 = 0,43

6/15 = 0,40

F 2·12 Independencia entre valores finales (F) y basales (B)

F 2·13 Dependencia entre valores finales (F) y basales (B)




F 2·14 Selección de cambio absoluto (CA) o cambio porcentual (CP)

Cambio absoluto (CA)

Cambio porcentual (CP)

F 2·15 Flujo espiratorio máximo (FEM) (l/min)

(Fuente: Senn 1993)

F = Formoterol S = Salbutamol

Secuencia Paciente Periodo 1

Periodo 2

Diferencia entre Periodos

(P1-P2)

Diferencia Cruzada

(F-S)

Total

(P1+P2)

F/S 1 310 270 40 40 580




4

6

7

10

11

14

310

370

410

250

380

330

260

300

390

210

350

365

50

70

20

40

30

-35

50

70

20

40

30

-35

570

670

800

460

730

695

S/F

2

3

5

9

12

13

370

310

380

290

260

90

385

400

410

320

340

220

-15

-90

-30

-30

-80

-130

15

90

30

30

80

130

755

710

790

610

600

310

Resultados del análisis no ajustado t de Student (para datos pareados)

basado en la diferencia cruzada (F-S)

Media

desviación estándar

error estandar de la media

t

Valor crítico bilateral ( =0.05)

p

45.38

40.59

11.26

4.031

2.179

0.0017

F 2·16 Análisis de Hills-Armitage (ajustado por periodo)

Análisis de las diferencias cruzadas

Media en la secuencia F/S

30.71

Media en la secuencia S/F 62.50

Varianza común ( 2) 1500.8

Media de las medias (mm) 46.61

Varianza de mm (*): 2 { (1/n1) + (1/n2) } / 4 116.13

Error estándar de mm 10.777

T 4.325

Valor crítico bilateral ( =0.05) 2.201

p 0.0012

Límite inferior IC95% 23




Límite superior IC95% 70

(*) Si la varianza de las diferencias cruzadas es 2 y hay

• n1 pacientes en la secuencia AB

• n2 pacientes en la secuencia BA

Entonces,

• las medias de las diferencias cruzadas (diferencias entre tratamientos) en las secuencias AB y BA tendrán varianzas 2/n1 y 2/n2 respectivamente.

• La media de estas dos medias tendrá varianza 2{ (1/n1) + (1/n2) } / 4.

F 2·17 Nº de pacientes que presentaron Acontecimientos Adversos en un EC paralelo para comparar dos tratamientos activos

Tratamiento A Tratamiento B

Presentaron AA 4 0

NO presentaron AA 29 32

F 2·18 Acontecimientos Adversos en un EC paralelo para comparar dos tratamientos activos

Paciente Descripción del AA Instensidad Relación con el tto.

1 Reacción eritemato-escamosa severa probable

2 Eczema agudo severa probable

3 Eczema, eritema y prúrito severa probable

4 Agravamiento del eczema moderada probable




F 2·19 Análisis descriptivo de datos de laboratorio – Diagramas de dispersión

F 2·20 Análisis descriptivo de datos de laboratorio – Perfiles individuales

U2. DISEÑO Y ANÁLISIS DE ENSAYOS CLÍNICOS · DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS:...

Documents

Transcript of U2. DISEÑO Y ANÁLISIS DE ENSAYOS CLÍNICOS · DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS:...