4.4. La Psicometría de Las Demencias a Debate.desbloqueado

11
Neurología 2007;22(5):301-311 El diagnóstico preciso de las demencias, así como el cri- bado de los trastornos cognitivos, es una clave para atender las necesidades de la realidad sociodemográfica. En este ar- tículo se plantean los objetivos del cribado y del diagnóstico, los instrumentos que se utilizan y sus características psico- métricas esenciales, especialmente la fiabilidad y la validez. Se destaca la necesidad de evaluar críticamente las publica- ciones sobre el tema y se refieren los Standards for Repor- ting of Diagnostic Accuracy (STARD). Además se citan y re- visan propuestas y recomendaciones de la literatura. Por último se comentan los tests más estudiados y usados por neurólogos españoles. Destacan el MMSE (Mini-Mental Sta- te Examination), el MIS (Memory Impairmet Screen) y el Eu- rotest. Palabras clave: Psicometría. Demencia. Tests. Neurología 2007;22(5):301-311 Psychometry of dementias at debate The accurate diagnosis of dementias and the scre- ening of cognitive impairment constitute a key to attend to the sociodemographical needs. This paper states the aims of screening and diagnosis, the tools used and their main psychometric features, especially, reliability and validity. The need to critically review the publications on this subject is highlighted and the Standards for Repor- ting of Diagnostic Accuracy (STARD) are mentioned. In addition, some proposals and recommendations from li- terature are cited and reviewed. Finally, the tests studied and used most by Spanish neurologists are commented on. The MMSE (Mini-Mental Status Examination), the MIS (Memory Impairment Screen) and the Eurotest stand out. Key words: Psychometry. Dementias. Tests. INTRODUCCIÓN La demencia se define como un síndrome adquirido ca- racterizado por un déficit cognitivo múltiple suficientemen- te importante como para interferir en la actividad cotidiana del individuo 1 . El diagnóstico se realiza habitualmente en dos pasos: en primer lugar se efectúa el reconocimiento del síndrome demencia y en segundo lugar se realiza el diag- nóstico nosológico 2-5 . La serie de enfermedades que cursan con demencia es realmente amplia (v. la clasificación de la Sociedad Española de Neurología) 6 , aunque la realidad epi- demiológica conduce a los cuadros más frecuentes: enfer- medad de Alzheimer, demencia frontotemporal, demencia con cuerpos de Lewy y demencia vascular 7 . Una buena historia clínica constituye el elemento más importante en el diagnóstico de las demencias, ya que per- mite reconocer los trastornos del sujeto, la naturaleza de los síntomas y su progresión 5,8 . Por consiguiente, la historia de- be ser cuidadosa, detallada y metódica. En este punto es fundamental el papel de un informador fiable. La historia permite reconocer el binomio del deterioro: por un lado, de las capacidades cognitivas, y por otro, de las actividades funcionales desarrolladas en el contexto de la vida diaria 3,5 . Esta información se integra con el resto de los datos del pa- ciente: antecedentes, exploración neurológica y general, pruebas complementarias (analítica, neuroimagen, etc.), así como un examen del estado mental que permita constatar y graduar el deterioro de las capacidades cognitivas del indi- viduo 4 . A partir de la historia clínica y de datos de la entre- vista, obviamente compatibles con el diagnóstico de de- mencia, se puede recurrir a categorías descriptivas y situar a los pacientes en distintos grados de posible deterioro. Este es el caso de las categorías de las Global Deterioration Sca- 69 301 Revisiones La psicometría de las demencias a debate J. Peña-Casanova 1,2 A. Monllau 1,2 N. Gramunt Fombuena 1,2 1 Sección de Neurología de la Conducta y Demencias Servicio de Neurología Hospital del Mar Instituto Municipal de Asistencia Sanitaria Barcelona 2 Unidad de Investigación en Servicios Sanitarios Instituto Municipal de Investigación Médica Barcelona Correspondencia: Jordi Peña-Casanova Sección de Neurología de la Conducta y Demencias Hospital del Mar Instituto Municipal de Asistencia Sanitaria Passeig Marítim, 25-29 08003 Barcelona Correo electrónico: [email protected] Recibido el 1-6-06 Aceptado el 7-6-06

description

La psicometría de las demencias a debate. La psicometría de las demencias a debate. La psicometría de las demencias a debate. La psicometría de las demencias a debate. La psicometría de las demencias a debate. La psicometría de las demencias a debate. La psicometría de las demencias a debate. La psicometría de las demencias a debate. La psicometría de las demencias a debate. La psicometría de las demencias a debate. La psicometría de las demencias a debate. La psicometría de las demencias a debate. La psicometría de las demencias a debate. La psicometría de las demencias a debate.

Transcript of 4.4. La Psicometría de Las Demencias a Debate.desbloqueado

  • Neu

    rolo

    ga

    2007

    ;22(

    5):3

    01-3

    11

    El diagnstico preciso de las demencias, as como el cri-bado de los trastornos cognitivos, es una clave para atenderlas necesidades de la realidad sociodemogrfica. En este ar-tculo se plantean los objetivos del cribado y del diagnstico,los instrumentos que se utilizan y sus caractersticas psico-mtricas esenciales, especialmente la fiabilidad y la validez.Se destaca la necesidad de evaluar crticamente las publica-ciones sobre el tema y se refieren los Standards for Repor-ting of Diagnostic Accuracy (STARD). Adems se citan y re-visan propuestas y recomendaciones de la literatura. Porltimo se comentan los tests ms estudiados y usados porneurlogos espaoles. Destacan el MMSE (Mini-Mental Sta-te Examination), el MIS (Memory Impairmet Screen) y el Eu-rotest.

    Palabras clave: Psicometra. Demencia. Tests.

    Neurologa 2007;22(5):301-311

    Psychometry of dementias at debateThe accurate diagnosis of dementias and the scre-

    ening of cognitive impairment constitute a key to attendto the sociodemographical needs. This paper states theaims of screening and diagnosis, the tools used and theirmain psychometric features, especially, reliability andvalidity. The need to critically review the publications onthis subject is highlighted and the Standards for Repor-ting of Diagnostic Accuracy (STARD) are mentioned. Inaddition, some proposals and recommendations from li-terature are cited and reviewed. Finally, the tests studiedand used most by Spanish neurologists are commented

    on. The MMSE (Mini-Mental Status Examination), the MIS(Memory Impairment Screen) and the Eurotest stand out.

    Key words:Psychometry. Dementias. Tests.

    INTRODUCCIN

    La demencia se define como un sndrome adquirido ca-racterizado por un dficit cognitivo mltiple suficientemen-te importante como para interferir en la actividad cotidianadel individuo1. El diagnstico se realiza habitualmente endos pasos: en primer lugar se efecta el reconocimiento delsndrome demencia y en segundo lugar se realiza el diag-nstico nosolgico2-5. La serie de enfermedades que cursancon demencia es realmente amplia (v. la clasificacin de laSociedad Espaola de Neurologa)6, aunque la realidad epi-demiolgica conduce a los cuadros ms frecuentes: enfer-medad de Alzheimer, demencia frontotemporal, demenciacon cuerpos de Lewy y demencia vascular7.

    Una buena historia clnica constituye el elemento msimportante en el diagnstico de las demencias, ya que per-mite reconocer los trastornos del sujeto, la naturaleza de lossntomas y su progresin5,8. Por consiguiente, la historia de-be ser cuidadosa, detallada y metdica. En este punto esfundamental el papel de un informador fiable. La historiapermite reconocer el binomio del deterioro: por un lado, delas capacidades cognitivas, y por otro, de las actividadesfuncionales desarrolladas en el contexto de la vida diaria3,5.Esta informacin se integra con el resto de los datos del pa-ciente: antecedentes, exploracin neurolgica y general,pruebas complementarias (analtica, neuroimagen, etc.), ascomo un examen del estado mental que permita constatar ygraduar el deterioro de las capacidades cognitivas del indi-viduo4. A partir de la historia clnica y de datos de la entre-vista, obviamente compatibles con el diagnstico de de-mencia, se puede recurrir a categoras descriptivas y situar alos pacientes en distintos grados de posible deterioro. Estees el caso de las categoras de las Global Deterioration Sca-69 301

    Revisiones

    La psicometra de las demencias a debate

    J. Pea-Casanova1,2

    A. Monllau1,2

    N. Gramunt Fombuena1,2

    1 Seccin de Neurologa de la Conducta y DemenciasServicio de NeurologaHospital del MarInstituto Municipal de Asistencia SanitariaBarcelona

    2 Unidad de Investigacin en Servicios SanitariosInstituto Municipal de Investigacin MdicaBarcelona

    Correspondencia:Jordi Pea-CasanovaSeccin de Neurologa de la Conducta yDemenciasHospital del MarInstituto Municipal de Asistencia SanitariaPasseig Martim, 25-2908003 BarcelonaCorreo electrnico: [email protected]

    Recibido el 1-6-06Aceptado el 7-6-06

    301-311.qxd 10/5/07 10:56 Pgina 301

  • les9 o de la escala CDR (Clinical Dementia Rating)10. Pero,con independencia de la posibilidad de usar categoras ge-nerales, la medicin del deterioro se realiza, como se ha co-mentado anteriormente, en los mbitos cognitivo y funcio-nal (vida diaria)11.

    Las pruebas diagnsticas tienen como objetivo deducirel problema de la existencia o no de una enfermedad deter-minada. En el caso de que se sepa de antemano que el pa-ciente est afecto o no de la enfermedad estudiada, el re-sultado de la prueba complementaria en cuestin no esrelevante para el proceso de diagnstico. En este punto sur-ge la siguiente pregunta: Cmo realizar adecuadamente laevaluacin del trastorno cognitivo?

    OBJETIVOS

    El presente artculo pretende discutir los estndaresmetodolgicos de la psicometra de las demencias en elcontexto del conjunto de escenarios y de datos clnicos queconducen a su diagnstico. Como se reconoce en un libroreciente sobre tests neuropsicolgicos, se trata de incidir enuna de las grandes preguntas relacionadas con la metodolo-ga: Conoce usted bien sus herramientas? (How well do youknow your tools?) 12. Adems es tambin crucial responder alo siguiente: Conoce usted bien los estndares metodolgi-cos de su funcionamiento? Para responder a estas preguntasel presente trabajo seguir el esquema de un artculo deopinin, en forma de preguntas y respuestas. Por este moti-vo no se realizar una revisin sistemtica del tema en cues-tin.

    DESARROLLO

    Para organizar un debate sobre el tema de la psicome-tra en el estudio de las demencias conviene empezar defi-niendo los objetivos de la misma para pasar, posteriormen-te, al tema de las caractersticas de los instrumentos demedicin en el contexto clnico. En funcin de esta caracte-rizacin y definicin de los estndares metodolgicos bsi-cos el lector tendr, consecuentemente, criterios para anali-zar si los instrumentos que usa son los ms adecuados13.

    Cules son los objetivos del diagnstico? Qu papeltienen las pruebas diagnsticas ante las incertidumbres? Elobjetivo del diagnstico es establecer la existencia o la pro-babilidad de la existencia de una enfermedad en funcin deun conjunto de signos y sntomas que constituyen un perfilclnico14,15. En el mbito de la neurologa de la conducta, yespecficamente de las demencias, el aspecto central es eltrastorno cognitivo. Consecuentemente, las pruebas diag-nsticas en este mbito se realizarn para verificar el tras-torno cognitivo en pacientes bajo sospecha de enferme-dad pretendiendo modificar el grado de incertidumbreplanteado por un perfil clnico determinado15. El contra-punto se puede encontrar en los casos en que el deterioro es

    obvio a travs de la historia clnica. La prueba no aportardisminucin de incertidumbres, pero s permitir definir ungrado de deterioro que servir de ndice para posteriorescontroles evolutivos16.

    Test de cribado (screening) o test de diagnstico? Losinstrumentos de cribado (screening) (sean biolgicos, psico-mtricos o fsicos) pretenden identificar a los sujetos quepueden presentar una enfermedad17-20. En principio no pre-tenden establecer un diagnstico. Estas pruebas se aplicanen poblaciones que tienen un alto riesgo de padecer untrastorno determinado. Al contrario, las pruebas diagnsti-cas se aplican para confirmar un diagnstico en los casos enque una prueba de screening ha sido positiva. Un buen testde screening debera ser capaz de detectar la mayora decasos buscados (alta sensibilidad) y presentar pocos falsospositivos (alta especificidad). Entre el cribado y el diagnsti-co precoz de los sujetos asintomticos existen semejanzas, ala vez que claras y cruciales diferencias con el diagnsticode los sujetos sintomticos. Sin embargo, existe una lnea deunin entre estos tres objetivos17,18. En este sentido el sub-comit de estndares de Calidad de la Academia Americanade Neurologa (AAN)4 estableci que los instrumentos decribado son tiles para la evaluacin del grado de alteracincognitiva por parte del clnico (gua), al igual que los testsneuropsicolgicos (gua), los tests cognitivos focalizados(opcin) y ciertas entrevistas estructuradas practicadas a in-formadores (opcin) (p. 1133). Un test focalizado es unaprueba que, a diferencia las pruebas que estudian diferentesfunciones cognitivas como la memoria, el lenguaje o laorientacin, se centra en el estudio de un solo aspecto, co-mo la evocacin de nombres de animales.

    En este momento es importante comentar un hecho im-portante. El estndar de trabajo de la AAN sita los tests decribado en paralelo a los tests neuropsicolgicos, pero no es-pecifica ms. En una situacin clnica normal, con mediosadecuados, se debera realizar un estudio neuropsicolgicodetallado como continuacin de los tests de screening13.Consecuentemente, los tests neuropsicolgicos (como segun-do paso psicomtrico) se debern someter, como mnimo, alas mismas exigencias mtricas que los tests de cribado. Segnesta afirmacin, el debate sobre la psicometra de las demen-cias se debe situar tanto en los instrumentos de screening co-mo en los tests neuropsicolgicos o las bateras formales detests. Cabe recordar, sin embargo, que una precisa valoracinpsicomtrica nunca debe realizarse sin considerar la semiolo-ga que se desprende de la ejecucin de los sujetos.

    Cmo debe ser un instrumento psicomtrico para apli-carse adecuadamente en clnica? Los instrumentos psicom-tricos deben cumplir una serie de caractersticas para que sepuedan aplicar adecuadamente a los pacientes19. En el casode las demencias existen requisitos especiales13,16,17. Los ins-trumentos de screening deberan tener una serie de carac-tersticas formales como la brevedad (por las limitaciones detiempo de la clnica), aceptabilidad por parte de los pacien-tes, simplicidad, facilidad de administracin y puntuacin y302 70

    Neu

    rolo

    ga

    2007

    ;22(

    5):3

    01-3

    11

    La psicometra de las demencias a debateJ. Pea-Casanova, et al.

    301-311.qxd 10/5/07 10:56 Pgina 302

  • bajo coste econmico. Por ltimo, los tests deberan ser f-cilmente adaptables a distintas culturas en la bsqueda deestudios comparativos (adaptabilidad transcultural)18. Lostests neuropsicolgicos no estn sometidos a las limitacio-nes propias del screening, pero deberan tener tres requisi-tos bsicos: idoneidad, factibilidad y utilidad16. Los instru-mentos neuropsicomtricos deben cumplir, adems, unaserie de caractersticas como instrumentos de medida. Lascaractersticas mtricas son mltiples, pero en la presenteaproximacin nicamente se consideran brevemente la fia-bilidad y la validez.

    La fiabilidad de un test describe la confianza que sepuede depositar en los resultados obtenidos a travs de suaplicacin. Un instrumento fiable debe ser preciso. Dicho enpalabras ms tcnicas: la fiabilidad se refiere a la proporcinde la variacin en los resultados que no es consecuencia deerrores de medida. Representara la proporcin de la varian-za total atribuible a diferencias verdaderas de los indivi-duos. La disminucin del error confiere al instrumento unmejor ndice de estabilidad y de replicabilidad17-20. La fiabi-lidad de un instrumento incluye o denota diversos aspectos:consistencia interna, estabilidad (o replicabilidad) y concor-dancia interjueces.

    La consistencia interna evala la medida en que todoslos elementos que conducen a una puntacin final de uncuestionario o una batera reflejan un mismo constructo. Laconsistencia interna habitualmente se mide calculando elcoeficiente alfa de Cronbach o dividiendo el test en dos mi-tades y comparando las puntuaciones de cada una de ellas19.El coeficiente alfa de Cronbach viene a representar la mediade todas las correlaciones entre cada tem y la puntuacintotal de todos los tems. En cuanto a su graduacin se con-sidera que una alfa superior a 0,8 es excelente, superior a0,7 es buena e inferior a 0,4 es pobre o mala20. En este sen-tido, por ejemplo, ya que los tems que componen la escalaBayer-ADL21 miden prcticamente lo mismo, es posible ob-tener la puntuacin final a partir de la media aritmtica delas puntuaciones con independencia de que algunos temsno sean aplicables en un paciente dado.

    La fiabilidad interevaluador (interjueces) e intraevalua-dor determina el acuerdo entre los resultados de la pruebacuando la realizan varios evaluadores o cuando un mismoevaluador la aplica en momentos distintos16-20. Si estas fia-bilidades son bajas las diferencias no reflejarn verdaderasmodificaciones en el estado del paciente. Estas fiablidadesfrecuentemente se miden mediante un valor kappa, que in-dica el grado de acuerdo tras una correccin por factores deazar. Los valores de kappa deberan situarse ms all de 0,7en la evaluacin de la fiabilidad interevaluador y superioresa 0,9 para la fiabilidad intraevaluador20. La fiabilidad tam-bin se puede medir mediante coeficientes de correlacin,pero estos coeficientes pueden ser equvocos. Como alter-nativa a este coeficiente se puede calcular el coeficiente decorrelacin interclase. La fiabilidad test-retest (intraevaluador)pretende reflejar la replicabilidad de los resultados cuando

    la prueba se administra a la misma persona en momentosdistintos16. Para estudiar adecuadamente esta fiabilidad sedebe evitar readministrar la prueba en un corto plazo (paraevitar los efectos del recuerdo), o en un plazo de tiempo ex-cesivamente largo (para evitar el efecto de la posible evolu-cin de la enfermedad).

    La validez de un instrumento de medicin neuropsico-lgica constituye el grado en que mide lo que debe medir yda lugar a resultados similares a los del estndar oro o crite-rio17. La validez tiene mltiples dimensiones, entre las quedestacan la validez de contenido, la validez de constructo yla validez de criterio. La validez de contenido evala si eltest o cuestionario abarca el elemento, o los elementos, quepretende medir. En este sentido, un test de screening de de-mencia debera como mnimo evaluar la memoria, mientrasque un test diagnstico debera incluir otros componentescognitivos. La validez de constructo evala la medida en queun test se correlaciona con otros tests que miden el mismodominio cognitivo (validez convergente) y no se correlacio-na con pruebas que evalan otros dominios cognitivos (vali-dez discriminativa). Habitualmente se usa el estadstico kap-pa para calcular el acuerdo entre pruebas distintas17.

    La validez de criterio aporta informacin sobre la rela-cin del test con el estndar oro. Dicho en otras palabras, lavalidez de criterio representa el grado de similitud de los re-sultados del test con la variable o patrn oro. El criterio de-be ser siempre una medida independiente y obtenida deforma distinta del test estudiado. Para que este aspecto secumpla adecuadamente se deben realizar estudios en losque los investigadores sean ciegos en relacin con el crite-rio. Existen dos clases de validez de criterio: la validez pre-dictiva y la validez concurrente. El concepto de validez predictiva se refiere a la capacidad de un test para anticiparlos resultados de la aplicacin del criterio. La validez predic-tiva es probablemente el mejor mtodo para determinar lavalidez de los instrumentos neuropsicolgicos19.

    La validez concurrente normalmente se mide medianteel clculo de la sensibilidad, la especificidad y el rea bajola curva ROC (Receiver Operatoring Characteristic). La sensi-bilidad constituye la proporcin de pacientes efectivamenteenfermos (segn el criterio oro) que presentan positividad enla prueba. La especificidad constituye la proporcin de su-jetos sin la enfermedad y con un resultado negativo en laprueba. La curva ROC permite establecer las relaciones en-tre la sensibilidad y la especificidad en funcin de posiblespuntos de corte entre la patologa y la normalidad. La cur-va se establece mediante dos ejes, en el eje de ordenadas serepresenta el grado de verdaderos positivos (sensibilidad),mientras que en el eje de abscisas se representan los falsospositivos (1especificidad). La curva se traza en funcin delos distintos puntos de corte. La prueba que resultara con elmismo nmero de verdaderos positivos y verdaderos nega-tivos dara lugar a una lnea recta de 45o y el rea bajo estacurva sera de 0,5. El instrumento ideal dara un rea bajola curva de 1 (todos los sujetos estaran bien clasificados). 71 303

    Neu

    rolo

    ga

    2007

    ;22(

    5):3

    01-3

    11

    La psicometra de las demencias a debateJ. Pea-Casanova, et al.

    301-311.qxd 10/5/07 10:56 Pgina 303

  • Aunque el conocimiento de la sensibilidad y especifici-dad diagnsticas de una prueba es importante, habitual-mente, en clnica se plantea la siguiente pregunta: si el re-sultado de la prueba es positivo, cul es la probabilidad deque el paciente sufra la enfermedad? (este es el valor pre-dictivo positivo de la prueba: VPP). Tambin se puede plan-tear la siguiente pregunta: si el resultado es negativo, quprobabilidad tiene el paciente de no padecer la enfermedad?(este es el valor predictivo negativo de la prueba: VPN). Estosndices (y otros) no dependen slo de la sensibilidad y especi-ficidad de la prueba, sino tambin de la prevalencia (proba-bilidad anterior) de la enfermedad considerada en la pobla-cin de estudio.

    La razn de probabilidad (likelihood ratio) para unaprueba determinada establece la probabilidad de que unaprueba sea positiva (anormal) ante la patologa en estudio. Laprobabilidad, por ejemplo, de que el Mini-Mental Status Exa-mination (MMSE) sea anormal en un paciente con la patolo-ga en estudio comparado con la probabilidad que el mismoresultado se observe en un paciente sin dicha patologa, seestablece a partir de los datos conocidos de su sensibilidad yespecificidad en una poblacin determinada en la que se co-noce la prevalencia de la enfermedad. Si la prevalencia de laenfermedad es baja (la enfermedad es poco frecuente en lapoblacin estudiada), el valor predictivo positivo de unaprueba positiva es bajo. En este caso el valor predictivo nega-tivo de una prueba negativa aumenta. Si la prevalencia de laenfermedad es alta (la enfermedad es relativamente frecuen-te en la poblacin estudiada) el valor predictivo positivo aumenta, mientras que el valor predictivo negativo se redu-ce. Por este motivo es muy importante conocer los distintosvalores predictivos en funcin de distintas prevalencias21,22.

    La probabilidad postest establece la probabilidad deque el paciente del que se sospecha que est afecto de unaenfermedad determinada y, presentando un valor positivo(anormal) en una prueba dada, sufra efectivamente dichaenfermedad. La oportunidad relativa postest (postest odds)se calcula multiplicando la probabilidad pretest (pretestodds) por la razn de probabilidad (likelihood ratio) de unaprueba positiva.

    En el contexto del diagnstico de la enfermedad de Alz-heimer es fundamental la consideracin de las caractersticascognitivas del envejecimiento. La prevalencia de la EA presen-ta una fuerte relacin positiva con la edad (a ms edad, ma-yor probabilidad de padecer una enfermedad de Alzheimerpreclnica). Consecuentemente es lgico que en el estudio delvalor diagnstico de los tests se deban tener en cuenta losfactores de probabilidad pretest en funcin del grupo deedad considerado. En otras palabras: no es lo mismo una pun-tuacin por debajo de un punto de corte determinado en unapersona de 65 aos que en una persona de 85. A priori, lapersona de 85 aos de edad tiene una mayor probabilidad depadecer una enfermedad demenciante. Por estos motivos elvalor predictivo de una prueba se debe estudiar en relacincon la prevalencia de la enfermedad en cuestin.

    La significacin frente al tamao del efecto. Es impor-tante diferenciar las significaciones estadsticas (habitual-mente p < 0,05) del tamao del efecto. El tamao del efecto(d) indica el porcentaje de individuos que se solapan entre elgrupo control y el grupo experimental. En trminos mate-mticos, d es la diferencia entre las medias de los pacientesy los controles calibrada en funcin de unidades de desvia-cin estndar mancomunadas (pooled). Un buen marcadordiagnstico debera discriminar aproximadamente a todoslos pacientes de los sujetos controles en la variable de inte-rs. Tal discriminacin se obtiene si d es mayor de 3 (el por-centaje de solapamiento es menor del 5%)23.

    Son importantes los datos normativos? Obviamente,los datos normativos son importantes, pero el punto clavepara la prctica est, adems, en el grado de semejanza en-tre el paciente en cuestin y el grupo de referencia o nor-mativo disponible. Lo ideal sera disponer de grupos de refe-rencia amplios, con todo tipo de caractersticas, de edad,sexo, escolaridad, lengua materna, etc. Cuestiones como elanalfabetismo, el bajo nivel educativo y la multiculturalidadaaden particularidades y dificultades a la evaluacin cog-nitiva. La poblacin de la comarca de Njar en Almera cita-da por Carnero24 sera un ejemplo de una sociedad multi-linge y multicultural a la que hay que proporcionaratencin sanitaria y a la que habr que aplicar los instru-mentos diagnsticos disponibles (p. 49). Es tal la importan-cia de los datos normativos que han aparecido libros que in-tentan recoger y comentar las publicaciones normativas delos principales tests neuropsicolgicos (v., p. ej., Mitrushinaet al.25). En este punto es importante recordar que en nues-tro medio no existen publicaciones adecuadas sobre normasde tests neuropsicolgicos. Por este motivo la psicometraque se puede realizar es bastante intuitiva. En muchos ca-sos no existen normas, o las normas no son adecuadas parael sujeto en estudio. En otras ocasiones, los datos normati-vos de un test no se corresponden con los datos normativosde otro y, consecuentemente, ser difcil o especulativo es-tablecer disociaciones entre funciones. Cabe recordar queen ciertos casos se toman como referencia las tablas norma-tivas de otros pases o se citan instrumentos no validados.As, por ejemplo, en el Documento Sitges26 sobre la capa-cidad de tomar decisiones durante la evolucin de una de-mencia aparece un listado de algunos de los tests que seutilizan en neurologa cognitiva para la valoracin de alte-raciones intelectuales y psicopatolgicas. Un anlisis dellistado, con independencia de la discutible bibliografa cita-da, pone de relieve (como refieren los autores) el problemade la falta de datos normativos. No hay alternativas, o senormalizan los tests para nuestra poblacin, o la neuropsi-cologa psicomtrica seguir teniendo componentes clara-mente especulativos27.

    Normas comparativas? Las tradicionales normas de lostests (normas comparativas) aportan informacin sobre me-dias, puntuaciones estndar y percentiles que permiten si-tuar al paciente en relacin con su grupo sociodemogrficoconsiderando, bsicamente, la edad, la escolaridad y el sexo.304 72

    Neu

    rolo

    ga

    2007

    ;22(

    5):3

    01-3

    11

    La psicometra de las demencias a debateJ. Pea-Casanova, et al.

    301-311.qxd 10/5/07 10:56 Pgina 304

  • El conocimiento del efecto de variables como la edad y laescolaridad permite realizar ajustes o correcciones de laspuntuaciones obtenidas. Estas normas no aportan informa-cin sobre la validez discriminativa, resultante de la bsque-da de puntos de corte a partir del estudio de sujetos patol-gicos y de la consideracin de factores de prevalencia en lapoblacin estudiada. Los puntos de corte se establecen arbitra-riamente en funcin del tipo de distribucin de las puntuacio-nes. La situacin ideal sera disponer de datos normativos simi-lares a los del proyecto MOANS (Mayo Older AmericansNormative Study)28-31. En este proyecto se realiz una co-normalizacin de una serie de instrumentos neuropsicolgi-cos. La conormalizacin constituye la normalizacin simul-tnea de distintos instrumentos en una misma poblacin yen un mismo proyecto. Esta aproximacin es importante pa-ra poder establecer disociaciones entre mbitos cognitivosde forma consistente. La existencia de bancos de datos nor-mativos permite aadir sujetos o reanalizar las estadsticasprevias (v. el nmero monogrfico de la revista The ClinicalNeuropsychologist)32.

    Existen alternativas ante las normas comparativas?Ante las normas comparativas33 tradicionales sera conve-niente establecer normas diagnsticas. Estas normas pre-tenden aportar informacin en la que las puntuaciones decorte y las probabilidades del diagnstico o clasificacin seconcatenan con datos sobre la probabilidad pretest (datosepidemiolgicos). En otras palabras, se establecen puntos decorte mediante el estudio de la mejor sensibilidad y especi-ficidad y se consideran las posibilidades diagnsticas enfuncin de distintos ndices de prevalencia en la pobla-cin34. La razn de probabilidad (likelihood ratio) establecela probabilidad de que una prueba sea positiva (anormal)ante la enfermedad estudiada.

    Cmo evaluar los artculos sobre diagnstico y criba-do? Esta es, posiblemente, la pregunta ms importante. Unavez se han discutido los requisitos bsicos se trata ahora deplantear una serie de preguntas propias de la medicina ba-sada en evidencias17 sobre una prueba diagnstica concreta.Ciertamente es importante conocer las caractersticas m-tricas35,36 de los instrumentos, pero tambin es importantever con detalle si los instrumentos cumplen con los requisi-tos exigidos y si los estudios sobre diagnsticos se han reali-zado adecuadamente37.

    Para determinar si las caractersticas de los instrumen-tos son adecuadas y si existen las pruebas (evidencias) sobresu precisin diagnstica se debera contestar adecuadamen-te a cada una de las preguntas de la tabla 1.

    En primer lugar se debera comprobar si se han cumpli-do las reglas que se desprenden de la primera pregunta ysubpreguntas (son vlidas las pruebas sobre la precisindiagnstica de este instrumento? o, en otras palabras, seha desarrollado una investigacin adecuada?). A continua-cin se trata de responder a la segunda pregunta (tiene es-te instrumento una capacidad significativa de distinguir en-

    tre sujetos que padecen o no este trastorno especfico?). Dehecho, todos estos planteamientos han sido formalizados enlo que sera la arquitectura de la investigacin diagnsti-ca37 y en las normativas Standards for Reporting of Diag-nostic Accuracy (STARD)38,39 reflejadas en una lista de com-probacin con 25 puntos (tabla 2). Mediante la aplicacinde estos puntos se avanzar significativamente en la calidadde los trabajos y se reflejar en la prctica clnica39,40.

    Qu se encuentra en la literatura? Los estudios soncorrectos? Los trabajos sobre instrumentos diagnsticos sonmuy frecuentes en la literatura, pero, desgraciadamente, lamayora de los trabajos se caracterizan por serios problemasmetodolgicos27,36. Es muy frecuente encontrar variacionesdel mismo instrumento (es decir, nada nuevo), variacionesdel mtodo de puntuacin, estudios con pocos sujetos, que73 305

    Neu

    rolo

    ga

    2007

    ;22(

    5):3

    01-3

    11

    La psicometra de las demencias a debateJ. Pea-Casanova, et al.

    Son vlidas las pruebas (evidencias) sobre la precisin diagnstica de este instrumento?

    Se us un grupo independiente y ciego de comparacin con un estndar oro de diagnstico?

    El test diagnstico se evalu en un espectro apropiado de pacientes (similar al que se encontrar en la prctica)?

    Se aplic el estndar de referencia con independencia del resultado del test?

    Se ha validado la prueba (grupo de pruebas) en un segundo grupo independiente de pacientes?

    Tiene este instrumento (vlido) una capacidad significativa de distinguir entre sujetos que padecen o no este trastorno especfico?

    Se puede aplicar este instrumento (test) a un paciente especfico?

    La prueba est disponible, es adecuada y precisa en el medio concreto en el que se va a aplicar?

    Se puede disponer de una estimacin clnicamente razonable de la probabilidad pretest del paciente?

    A partir de la experiencia personal, estadsticas de prevalencia, bases de datos de prctica

    Los pacientes del estudio son similares al propio?Es poco probable que las posibilidades y

    probabilidades de la enfermedad hayan cambiado desde que se obtuvieron las pruebas?

    Las probabilidades postest afectarn al manejo del paciente y vamos a ayudarle?

    Van a inducir a iniciar un tratamiento?Las consecuencias de la prueba ayudarn a que el

    paciente alcance sus objetivos?

    Basado en Sakett et al. Evidence-based Medicine. How to practice andteach EBM, 2.a ed. Edinburgh: Churchill-Livingstone, 2000.

    Tabla 1 Preguntas fundamentales sobre las pruebas diagnsticas

    301-311.qxd 10/5/07 10:56 Pgina 305

  • 306 74

    Neu

    rolo

    ga

    2007

    ;22(

    5):3

    01-3

    11

    La psicometra de las demencias a debateJ. Pea-Casanova, et al.

    Seccin y tema tem Descripcin

    Ttulo, resumen y palabras 1clave

    Introduccin 2

    MtodosParticipantes 3

    4

    5

    6

    Mtodos de la prueba 78

    9

    10

    11

    Mtodos estadsticos 12

    13ResultadosSujetos 14

    15

    16

    Resultados de la prueba 17

    18

    19

    20Estimaciones 21

    22

    23

    24Discusin 25

    Tabla 2 Lista de comprobacin de STARD para la publicacin de estudios sobre precisin diagnstica

    Definir el artculo como un estudio de precisin diagnstica (epgrafe MeSH recomendadosensibilidad y especificidad

    Establecer la cuestin u objetivos de estudio, tales como estimar la precisin diagnsticao comparar la precisin entre pruebas o entre grupos de sujetos (participantes)

    Describir la poblacin de estudio: criterios de inclusin y exclusin, as como los contextos ylugares donde se recogieron los datos

    Describir el reclutamiento de los sujetos: se bas en sntomas de inicio, resultados de pruebasprevias, o en que a los sujetos se les administrara la prueba ndice o el estndar de referencia?

    Describir el muestreo de sujetos: se trata de una serie consecutiva de sujetos definida por loscriterios de seleccin de los tem 3 y 4? Si no es el caso, especificar cmo se seleccionaron

    Describir la recogida de datos: Se planific antes de la realizacin de las pruebas ndice y estndaresde referencia (estudio prospectivo) o se realiz posteriormente (estudio retrospectivo)?

    Describir el estndar de referencia y su fundamentoDescribir las especificaciones tcnicas del material y mtodos implicados, incluyendo cmo

    y cundo se tomaron las medidas, o citar las referencias de las pruebas ndice o el estndar de referencia o ambas

    Describir la definicin y/o la justificacin de las unidades de medida, puntos de corte o categorasde los resultados de las pruebas ndice y del estndar de referencia

    Describir el nmero, formacin y experiencia de las personas que ejecutan y evalan las pruebasndice y los estndares de referencia

    Los evaluadores de las pruebas ndice y el estndar de referencia eran desconocedores (ciegos) de los resultados de la otra prueba? Describir cualquier otra informacin clnica disponible paralos evaluadores

    Describir los mtodos de clculo o comparacin de medidas de precisin diagnstica y los mtodosestadsticos utilizados para medir la incertidumbre (p. ej., intervalos de confianza del 95%)

    Describir los mtodos para calcular la replicacin de los resultados, en caso de haberse realizado

    Referir cundo se realiz el estudio, incluyendo las fechas de inicio y finalizacin del reclutamientoDescribir las caractersticas clnicas y demogrficas de los sujetos (p. ej., edad, sexo, espectro de los

    sntomas de inicio, comorbilidad, tratamientos actuales y centro de reclutamiento)Referir el nmero de sujetos que, cumpliendo los criterios de inclusin, se sometieron o no a las

    pruebas ndice o al estndar de referencia, o a ambas. Describir por qu a los sujetos no se lesadministr alguna de las pruebas (se recomienda encarecidamente un diagrama de flujo)

    Referir el intervalo entre las pruebas ndice y el estndar de referencia, as como cualquiertratamiento instaurado entre las mismas

    Referir la distribucin de la gravedad de la enfermedad (definir los criterios) en los sujetos objetode estudio, as como la distribucin de otros diagnsticos en sujetos que no padecen la enfermedad

    Presentar una tabla 2 2 de los resultados de la prueba ndice incluyendo resultadosindeterminados y perdidos. Para variables continuas referir la distribucin de los resultados de laprueba en relacin con los resultados del estndar de referencia

    Referir cualquier efecto adverso al realizar las pruebas ndice o el estndar de referenciaPresentar las estimaciones de precisin diagnstica y las medidas de incertidumbre estadstica

    (p. ej., intervalos de confianza del 95%)Presentar cmo se trataron los resultados indeterminados, los casos perdidos y los valores

    extremos (outliers) de las pruebas ndiceReferir las estimaciones sobre la variabilidad en la precisin diagnstica entre evaluadores, centros,

    o subgrupos de sujetos, si se ha realizadoReferir las estimaciones de la replicacin de la prueba, si se han realizadoDiscutir la aplicacin clnica de los hallazgos del estudio

    La presente lista de comprobacin se puede obtener, sin ninguna restriccin, en la direccin de internet http://www.consort-statement.org/stardstatement.htmchecklist (consultado el 11 de junio de 2006). Bossuyt PM, et al. Towards complete and accurate reporting of studies of diagnostic accuracy: the STARD initiative.British Medical Journal 2003;326:41-4. STARD: Standards for Reporting of Diagnostic Accuracy.

    301-311.qxd 10/5/07 10:56 Pgina 306

  • no se den probabilidades en funcin de tasas de prevalencia,ni se calcule el tamao del efecto36. A pesar de las limitacio-nes de muchos trabajos, en el ao 2001 la AAN recomenda-ba una serie de instrumentos con altas evidencias (pruebas)de su funcionamiento4 y aportaba la bibliografa correspon-diente: MMSE41-44, Memory Impairment Screen (MIS)22, TestBreve del Estado mental (Short test of Mental Status)45,Test de los 7 Minutos46, Test del Dibujo del Reloj47-49 y elTest del Tiempo y el Cambio de Dinero (Time and ChangeTest)50. Las revisiones posteriores descartan muchos instru-mentos por la falta de datos psicomtricos o por muestrasinadecuadas51,52.

    Algunos de los tests recomendados por la AAN han sidovalidados en Espaa con mayor o menor refinamiento meto-dolgico: el MMSE, el MIS, el Test del Reloj y el Test del Dinero(que sera una adaptacin del Test del Tiempo y el Cambio)52.A continuacin se presenta una seleccin no exhaustiva detrabajos espaoles.

    En la literatura espaola destacan numerosos trabajossobre el MMSE53-58, y en especial las aportaciones sobreajustes en funcin de la edad y la escolaridad. El trabajo deManubens et al.55 es especialmente esclarecedor, ya queaportan tablas de percentiles en funcin de grados de esco-larizacin para sujetos de ms de 70 aos de edad. La admi-nistracin de este test requiere entre 7 y 10 min.

    El MIS59,60 es un test excelente recomendado por laAAN. Ha sido recientemente adaptado al espaol con la autorizacin del autor59. El estudio de Bhm et al.59 incluya 403 sujetos divididos en 188 pacientes con demencia y215 controles. Las curvas ROC mostraron grados excelentesde discriminacin de la demencia (0,944), y an mejores pa-ra la enfermedad de Alzheimer (0,978). El punto de corte es-tablecido fue el mismo que en el estudio original ( 4). Cabecomentar la alta tasa de prevalencia de demencia en la po-blacin estudiada, pero las tablas de probabilidad pretestdan una clara visin del valor diagnstico en distintas pre-valencias. Los datos espaoles publicados proceden de uni-dades especializadas59,60, pero dadas las caractersticas sim-ples del test y la semejanza de los datos con el original sepuede usar sin problemas. La administracin de este test re-quiere una media aproximada de 4 min.

    El Test del Reloj ha sido sometido a distintos estudiosespaoles61-63 y forma parte del Test de los 7 Minutos. Nin-guno de los trabajos publicados (aunque correctos en fun-cin de sus objetivos) aporta datos normativos. La adminis-tracin de este test requiere una media aproximada de 1 min, o menos.

    En cuanto al Test de los 7 Minutos destaca el trabajo deDel Ser et al.64, que incluye una muestra de 416 ancianosmayores de 70 aos participantes en el estudio longitudinalEnvejecer en Legans. El trabajo es totalmente correcto enrelacin con los objetivos de los autores: aportar datos nor-

    mativos en sujetos a partir de una edad determinada. La ad-ministracin de este test requiere una media aproximada de8 min.

    El Test de las Monedas65, que sigue, en parte, el concep-to de la Making Change Task, se ha continuado con el Euro-test. El Eurotest ha sido sometido a un estudio preliminar66,a un excelente estudio posterior multicntrico67 en el que seha mostrado su capacidad diagnstica y a un estudio de fia-bilidad68. Los rendimientos en el test no estn influidos porfactores sociodemogrficos o educativos. Tiene una buenacapacidad diagnstica, con adecuada validez de contenido yconstructo. La administracin de este test requiere una me-dia aproximada de algo ms de 8 min. El Eurotest, al igualque el MIS original, constituye el modelo metodolgico aseguir en el desarrollo de un test.

    La evocacin categorial (fluencia verbal de palabras deuna categora determinada o en forma del Set-test) tam-bin se ha estudiado en el mbito normativo, predictivo yde diagnstico de demencia69-73. Adems dicha prueba estincluida en el Test de los 7 Minutos. Los estudios del tamaodel efecto no muestran excelentes resultados23.

    El Test de Pfeiffer (Short Portable Mental Status Ques-tionnaire, SPMSQ) como alternativa al MMSE ha sido vali-dado en Espaa74. La administracin de este test requiereunos 2 a 3 min. El estudio espaol reciente muestra unasensibilidad del 85% y una especificidad del 79%.

    En este contexto de problemas, el proyecto NORMACO-DEM75 plante adaptar, normalizar y validar instrumentosinterrelacionados que evaluaran el deterioro neuropsicol-gico, su intensidad, su estructura cognitiva bsica y la co-rrelacionaran con grados de discapacidad funcional. El pro-yecto NORMACODEM75 incluy a 254 sujetos control, 86 casosde deterioro sin demencia y 111 casos de enfermedad deAlzheimer. En el momento actual se han publicado trabajossobre los siguientes instrumentos: Alzheimers Disease As-sessment Scale (ADAS)76, Interview for Deterioration ofDaily living in Dementia (IDDD)77, MMSE57, Test Barcelona78,Escala de Blessed (Blessed Dementia Rating Scale)79, Geria-tric Evaluation of Relatives Rating Instrument (GERRI)80,Rapid Disability Ranting Scale-2 (RDRS-2)81. La posibilidadde combinar datos de tests cognitivos, escalas funcionales yde los perfiles del Test Barcelona dan una especial dimen-sin a este proyecto. No se han publicado datos diagnsti-cos de la combinacin de diversas pruebas.

    Por su parte, la ADAS ha sido estudiada por varios gru-pos76,82,83, e incluso validada en un proyecto de armonizacineuropea de instrumentos para la evaluacin de la demencia,el proyecto Euro-Harpid84. El Cambridge Examination forMental Disorders of the Elderly (CAMDEX) tambin est dis-ponible en espaol85-87 y tambin est disponible en una ver-sin con validacin europea (proyecto Euro-Harpid)88.

    Tambin existen importantes datos multicntricos es-paoles sobre la escala Bayer-ADL en el contexto de un 75 307

    Neu

    rolo

    ga

    2007

    ;22(

    5):3

    01-3

    11

    La psicometra de las demencias a debateJ. Pea-Casanova, et al.

    301-311.qxd 10/5/07 10:56 Pgina 307

  • estudio realizado en tres pases europeos21. La muestra es-paola, de 619 casos, mostr que tena una mayor capaci-dad diagnstica que el MMSE. Se cita este trabajo porquepone de manifiesto que una buena escala de actividadesavanzadas de la vida diaria puede tener un mayor valor pre-dictivo que un test cognitivo.

    Por ltimo, cabe citar la serie de tests que, con mayor omenor correccin metodolgica, aparece en la literatura inter-nacional. El lector encontrar su revisin en un trabajo de Lo-renz, Scanlan y Borson (2002)51. El Syndrom Kurztest (SKT)89,90

    se incluye en la citada revisin. A este conjunto de tests cabraaadir el MoCA (Montreal Cognitive Assessment) 91, un testmuy reciente que, aunque existe en versin castellana, no hasido validado en controles y pacientes espaoles.

    Qu instrumentos psicomtricos se pueden aconsejaren nuestro medio? Aunque en el mundo se han publicadomltiples tests, ninguno ha sido reconocido como estndarinternacional4. De forma ideal se debera aconsejar el testque cumpliera con todos los requisitos enunciados previa-mente y que estuviera normalizado y validado en la pobla-cin a la que pertenece el paciente. Una vez establecido es-te principio se debe descender al pragmatismo y aconsejarel test que ms se aproxime al ideal. Puede acontecer queun test haya sido adaptado culturalmente a una poblacinpero no haya sido estudiado adecuadamente en cuanto a suvalidez. Cabe hacer una serie de comentarios sobre los testsms estudiados y usados por los neurlogos espaoles:

    MMSE. Probablemente sera el test de eleccin si sedispone del tiempo suficiente, ya que aporta datosen distintos mbitos cognitivos. Es adecuado si elpaciente tiene un mnimo de escolaridad y/o se apli-can ajustes por edad y escolaridad. Convendra to-mar como referencia el estudio normativo msadaptado a la realidad del paciente estudiado. Comoalternativa ms breve se puede usar el SPMSQ dePfeiffer, siguiendo los datos de la validacin de Mar-tnez de la Iglesia et al.74. El problema est en eltiempo necesario para su administracin.

    MIS. Test excelente si se dispone de muy poco tiem-po. Durante el tiempo de interferencia se puede rea-lizar, por ejemplo, una prueba de evocacin catego-rial. Una variacin del MIS, con imgenes, que esten fase de desarrollo, es el Test de la Fotos92.

    Test del Reloj. Poco aconsejable. Se debera usarcuando el sujeto tenga suficiente escolaridad (estu-dios primarios completos) y experiencia suficiente entareas de papel y lpiz. El Test del Reloj no es real-mente el mejor instrumento con los datos psicom-tricos disponibles. Tampoco es un buen test si se usaaislado, ya que solamente mide praxis constructivay ejecucin.

    Test de Fluencia Verbal. Se debera usar como segun-da opcin. Los tests de fluencia verbal se pueden uti-lizar si se realizan ajustes por edad y escolaridad. Tie-

    ne mucho inters si se realiza junto con otras prue-bas como un test de memoria. La suma de fallos dememoria (p. ej., en el MIS) ms los fallos en un testde fluencia verbal son orientativos de demencia.

    Test de los 7 Minutos. Se debera usar cuando los su-jetos a estudiar sean similares al grupo normativoespaol publicado. No cumple en absoluto los requi-sitos para su uso en una consulta de medicina gene-ral o de neurologa (realmente se requiere ms de 7 min, y se requiere material). Faltan datos normati-vos amplios.

    Eurotest. Excelente test para demencia si no se quiere incidir especficamente en la memoria y sedispone de 8 min. Test fiable y excelentemente vali-dado.

    Una serie de tests ya publicados muestran unas carac-tersticas de contenidos, mtricas y de brevedad que lesconfieren cierto futuro. Estos tests son los siguientes: Mini-Cog93, el GPCOG94 y el 6 tem Screener95 (el lector puedeconsultar las correspondientes referencias y la revisin crti-ca de Lorentz et al.51).

    El siguiente paso, el de la exploracin neuropsicolgica atravs de la seleccin de una serie de tests, se enfrenta a ungrave problema: la ausencia de datos normativos sistemticosespaoles. Adems, idealmente, se debera disponer de instru-mentos conormalizados siguiendo el modelo MOANS. Aunqueexisten datos normativos espaoles diversos (v. la reciente re-visin de Pea-Casanova et al.)52, no existen, por ahora, tra-bajos sistemticos de conormalizacin en la poblacin en laque la demencia es prevalente. La conormalizacin es impor-tante, ya que si los datos normativos proceden del mismogrupo de sujetos, las disociaciones entre los rendimientos enlos distintos tests adquirirn un valor ms objetivo. En el m-bito de los tests tambin sera aconsejable aplicar los concep-tos de las normas diagnsticas, es decir, ver su rendimiento apartir de puntos de corte definidos por grupos de pacientes.Tomar como modelo sistemtico la enfermedad de Alzheimeres realmente un problema, ya que ciertos tests especficos,como los tests de lenguaje o ejecutivos, se deberan estudiaren pacientes con lesiones cerebrales focales.

    En este contexto sera muy importante estudiar los ren-dimientos de los tests de screening y de los tests neuropsi-colgicos en grupos normativos, sujetos diagnosticados detrastorno cognitivo leve y sujetos con demencia discreta ymoderada. La correlacin con datos de neuroimagen y ge-ntica sera un complemento importante. Por otro lado, lostests se deberan estudiar en otras situaciones clnicas comola depresin, la ansiedad o trastornos psicticos.

    CONCLUSIONES

    La medicin de las capacidades cognitivas en el mbitode las demencias no es una tarea crucial. Como cualquier308 76

    Neu

    rolo

    ga

    2007

    ;22(

    5):3

    01-3

    11

    La psicometra de las demencias a debateJ. Pea-Casanova, et al.

    301-311.qxd 10/5/07 10:56 Pgina 308

  • prueba mdica, de alta o de baja tecnologa, la psicometradebe cumplir con los requisitos mtricos y diagnsticos ade-cuados. En los ltimos aos se han establecido unos estn-dares para el desarrollo de estudios sobre el diagnstico ymtodos para realizar una publicacin completa y precisade los resultados de los estudios. Estas aportaciones se de-beran adoptar sistemticamente y deberan tenerse encuenta en el desarrollo de nuevos tests o en la reevaluacinde los existentes. El desarrollo del Eurotest es un ejemplo detrabajo de calidad. La aplicacin de las guas de trabajo y pu-blicacin va a redundar en la calidad cientfica de los estu-dios y en una mayor aplicabilidad clnica. La seleccin de uninstrumento se debera hacer a partir de la consideracin delos instrumentos disponibles y la realidad del paciente (edad,escolaridad, deficiencias sensoriales, etc.). El know your tools(conozca sus instrumentos) es fundamental, pero no se de-bera olvidar la importancia de la coherencia entre la histo-ria clnica, las manifestaciones funcionales y los resultadosde los tests, atendiendo, asimismo, a la semiologa. Si en elmbito del cribado (screening) quedan muchos temas pen-dientes, en el mbito de los tests neuropsicolgicos formalesel recorrido restante es an mayor.

    BIBLIOGRAFA

    1. American Psychiatric Association. Manual diagnstico y estads-tico de los trastornos mentales, texto revisado (DSM-IV-TR).Barcelona: Masson, 2001.

    2. McKhann G, Drachman D, Folstein M, Katzman R, Price D, Sta-dlan EM. Clinical diagnosis of Alzheimers disease: report of theNINCDS-ADRDA work group under the auspices of Departmentof Health and Human Services Task Force on Alzheimers disea-se. Neurology 1984;34:939-44.

    3. Corey-Bloom J, Thal LJ, Galasko D, Folstein M, Drachman D, Ras-kind M, et al. Diagnosis and evaluation of dementia. Neurology1995;45:925-35.

    4. Petersen RC, Stevens JC, Ganguli M, Tangalos EG, Cummings JL,DeKosky ST. Practice parameter: early detection of dementia:mild cognitive impairment (an evidence-based review). Reportof the Quality Standards Subcommittee of the American Aca-demy of Neurology. Neurology 2001;56:1133-42.

    5. Galdos L, Manubens JM. Historia clnica, exploracin fsica yneurolgica y pruebas complementarias. En: Grupo de Estudiode Neurologa de la Conducta y Demencias. Sociedad Espaolade Neurologa. Guas en Demencias. Barcelona: Masson, 2003;p. 189-94.

    6. Robles A, Carnero C, Pascual LF, Alom J, Dobato JL, Romero J, etal. Clasificacin. En: Grupo de Estudio de Neurologa de la Con-ducta y Demencias. Sociedad Espaola de Neurologa. Guas enDemencias. Barcelona: Masson, 2003; p. 29-38.

    7. Knopman DS, DeKosky ST, Cummings JL, Chui H, Corey-Bloon J,Relkin N, et al. Practice parameter: diagnosis of dementia (anevidence-based review). Report of the Quality Standards Sub-committee of the American Academy of Neurology. Neurology2001;56:1143-53.

    8. Chui H. Clinical history and neurological signs. En: Qizilbash N,Schneider LS, Chui H, Tariot P, Brodaty, Kaye J, Erkinjuntti T,

    editores. Evidence-based dementia practice. Oxford: BlackwellPublishing, 2003; p. 119-24.

    9. Reisberg B, Ferris SH, de Leon MJ, Crook T. The Global Deteriora-tion Scale for assessment of primary degenerative dementia.Am J Psychiatry 1982;139:1136-9.

    10. Hughes CP, Berg L, Danzinger WL. A new clinical scale for thestaging of dementia. Br J Psychiatr 1988;140:566-72.

    11. Bouchard RW, Rossor MN. Typical clinical features. En: Gauthier S,editor. Clinical diagnosis and management of Alzheimers disea-se, 2.a ed. revisada. Londres: Martin Dunitz, 1996.

    12. Strauss E, Sherman E, Spreen O. A compendium of neuropsy-chological tests, 3.a ed. New York: Oxford University Press, 2006.

    13. Qizilbash N, Schneider LS, Chui H, Tariot P, Brodaty, Kaye J, Er-kinjuntti T. Evidence-based dementia practice. Oxford: Black-well Publishing, 2003.

    14. Pea-Casanova J. Alzheimer Disease Assessment Scale-Cogniti-ve in clinical practice. International Psychogeriatr 1997;9(Suppl. 1):105-14.

    15. Gmez A. Caracterizacin de las pruebas diagnsticas. Neurolo-ga 2004(Suppl. 1):31-8.

    16. Lezak MD, Howieson DB, Loring DW. Neuropsychological assess-ment, 4.a ed. New York: Oxford University Press, 2004.

    17. Sackett DL, Strauss SE, Richardson WS, Rosenberg W, Haynes RB.Evidence-based Medicine, Edinburg: Churchill Livingstone, 2000.

    18. Shulman K, Feinstein A. Quick Cognitive Screening for Clini-cians. London: Martin Dunitz, 2003.

    19. Retzlaff PD, Gibertini M. Neuropsychometric issues and pro-blems. En: Vanderploeg RD, editor. Clinicians guide to neurops-ychological assessment. Hillsdale: Lawrence Erlbaum Associates,1994; p. 185-209.

    20. Gifford DR, Cummings JL. Evaluating dementia screening tests.Neurology 1999;52:224-7.

    21. Erzigkeit H, Lehfeld H, Pea-Casanova J, Bieber F, Yekrangi C,Rupp M, et al. The Bayer-Activities of Daily Living Sacale (B-ADL):results from a validation study in three european countries. De-ment Geriatr Cogn Disord 2001;12:348-58.

    22. Buschke H, Kuslansky G, Katz M, Stewart WF, Sliwinski MJ, Eckholdt HM, et al. Screening for dementia with the MemoryImpairment Screen. Neurology 1999;52:231-8.

    23. Zakzanis KK, Leach L, Kaplan E. Neuropsychological DifferentialDiagnosis. Lisse: Swets and Zeitlinger, 1999.

    24. Carnero C. Analfabetismo, bajo nivel educativo y muestras nor-mativas para pruebas neuropsicolgicas. Neurologa 2005;20:49.

    25. Mitrushina M, Boone KB, Razani J, DElia LF. Handbook of nor-mative data for neuropsychological assessment, 2.a ed. NewYork: Oxford University Press, 2005.

    26. Boada M, Robles A. Anlisis y reflexiones sobre la capacidad pa-ra tomar decisiones durante la evolucin de una demencia: Do-cumento Stges. Barcelona: Glosa, 2005.

    27. Pea-Casanova J, Gramunt N, Gich J. Test neuropsicolgicos.Fundamentos para una neuropsicologa basada en evidencias.Barcelona: Masson, 2004.

    28. Ivnik RJ, Malec JF, Smith GE, Tangalos EG, Petersen RC, Kokmen E,et al. Mayos Older Americans Normative Studies: WAIS-R normsfor ages 56 to 97. Clin Neuropsychol 1992;6(Suppl.):1-30.

    29. Ivnik RJ, Malec JF, Smith GE, Tangalos EG, Petersen RC, Kokmen E,et al. Mayos Older Americans Normative Studies: WMS-Rnorms for ages 56 to 94. Clin Neuropsychol 1992;6(Suppl.):49-82.77 309

    Neu

    rolo

    ga

    2007

    ;22(

    5):3

    01-3

    11

    La psicometra de las demencias a debateJ. Pea-Casanova, et al.

    301-311.qxd 10/5/07 10:56 Pgina 309

  • 30. Ivnik RJ, Malec JF, Smith GE, Tangalos EG, Petersen RC, Kokmen E,et al. Mayos Older Americans Normative Studies: Updated AVLTnorms for ages 56 to 97. Clin Neuropsychol 1992;6(Suppl.): 83-104.

    31. Ivnik RJ, Malec JF, Smith GE, Tangalos EG, Petersen RC. Neu-ropsychological tests norms above age 55: COWAT, BNT, MAEToken, WRAT-R Reading, AMNART, Stroop, TMT, and JLO. ClinNeuropsychol 1996;10:262-78.

    32. Steinberg B, Bieliauskas L. Introduction to the special edition:IQ-based MOANS norms for multiple neuropsychological ins-truments. Clin Neuropsychol 2005;19:277-9.

    33. Smith GE, Ivnick RJ. Normative neuropsychology. En: Petersen R,editor. Mild cognitive impairment. Aging to Alzheimers disease.New York: Oxford University Press, 2003; p. 63-88.

    34. Sliwinski M, Lipton R, Buschke H, Wasylyshyn C. Optimizingcognitive tests norms for detection. En: Petersen RC, editor. Ox-ford: Oxford University Press, 2003; p. 89-104.

    35. Serra-Mayoral A, Pea-Casanova J. Fiabilidad test-retest e inte-revaluador del test Barcelona. Neurologa 2006;21:277-81.

    36. Pea-Casanova J, Bhm P, Manero RM. La evaluacin neuropsi-colgica en la enfermedad de Alzheimer en una medicina basa-da en evidencias: notas preliminares. Neurologa 2000;15(Suppl. 4):31-8.

    37. Sacket DL, Haynes RB. Evidence base of clinical diagnosis: thearchitecture of diagnostic research. Br Med J 2002;324:539-41.

    38. Bossouyt PM, Reitsma JB, Bruns DE, Gatsonis CA, Glasziou PP,Irwig LM, et al. for the STARD steering group. Towards completeand accurate reporting of studies of diagnostic accuracy: theSTARD initiative. Br Med J 2003;326:41-4.

    39. Burns DE. The STARD initiative and reporting of studies of diag-nostic accuracy. Clin Chem 2003;49:19-20.

    40. Carnero-Pardo C. Evaluacin de las pruebas diagnsticas. RevNeurol 2005;40:641-3.

    41. Ganguli M, Belle S, Ratcliff G. Sensitivity and specificity for de-mentia of population-based criteria for cognitive impairment:the movies project. J Gerontol 1993;48:152-61.

    42. Kukull WA, Larson EB, Teri L. The Mini-Mental State Examina-tion score and the clinical diagnosis of dementia. J Clin Epide-miol 1994;47:1061-7.

    43. Wilder D, Cross P, Chen MPJ. Operating characteristics of briefscreens of dementia in a multicultural population. Am J GeriatrPsychiatry 1995;3:96-107.

    44. Tangalos EG, Smith GE, Ivnik RJ. The Mini-Mental State Exami-nation in general medical practice: clinical utility and acceptan-ce. Mayo Clin Proc 1996;71:829-37.

    45. Kokmen E, Smith GE, Petersen RC. The short test of mental sta-tus: correlations with standardized psychometric testing. ArchNeurol 1991;48:725-8.

    46. Solomon PR, Hirschoff A, Kelly B. A 7-Minute neurocognitivescreening battery highly sensitive to Alzheimers disease. ArchNeurol 1998;55:349-55.

    47. Cahn D, Salmon D, Monsch A. Screening for dementia of theAlzheimer type in the community: the utility of the Clock Dra-wing Test. Arch Clin Neuropsychol 1996;11:529-39.

    48. Bourke J, Castleden CM, Stephen R. A comparison of clock andpentagon drawing in Alzheimers disease. Int J GeriatrPsychiatry 1995;10:703-5.

    49. Lam L, Chiu H, Ng K. Clock-face drawing, reading and settingtests in the screening of dementia in Chinese elderly adults. J Gerontol 1998;538:353-7.

    50. Inouye SK, Robison JT, Froehlich TE. The Time and Change Test: asimple screening test for dementia. J Gerontol 1998;53A:281-6.

    51. Lorentz WJ, Scanlan JM, Borson S. Brief screening tests for de-mentia. Can J Psychiatry 1947;8:723-33.

    52. Pea-Casanova J. Enfermedad de Alzheimer: los tests de cribado.En: Martnez-Lage M, editor. Curso Nacional Alzheimer (en prensa).

    53. Lobo A, Saz P, Marcos G, Da JL, de la Cmara C, Ventura, et al.Revalidacin y estandarizacin del MEC (primera versin espa-ola del Mini-Mental Status Examination) en la poblacin ge-ritrica general. Med Cln 1999;112:767-41.

    54. Bermejo F, Gmez-Isla T, Morales JM. El Mini-Mental State Exa-mination en la evaluacin del deterioro cognitivo y la demen-cia. En: Del Ser T, Pea-Casanova, editores. Evaluacin neuro-psicolgica y funcional de la demencia. Barcelona: JR ProusEditores, 1994; p. 93-7.

    55. Manubens JM, Martnez-Lage P, Martnez-Lage JM, Larumbe R,Muruzbal J, Martnez-Gonzlez, et al. Variacin de las puntua-ciones en el Mini-Mental-State con la edad y el nivel educativo.Datos normalizados en la poblacin mayor de 70 aos de Pam-plona. Neurologa 1998;13:111-9.

    56. Lobo A, Marcos G, Dia JL, De la Cmara C, Ventura T, MoralesAsn F. Validacin y estandarizacin del mini-examen cognosci-tivo (primera edicin espaola del Mini-Mental Status Exami-nation) en la poblacin geritrica general. Med Clin 1999;112:767-74.

    57. Blesa R, Pujol M, Aguilar M, Santacruz P, Bertrn-Serra I, Her-nndez G, et al. Clinical validity of the Mini-Mental State forSpanish speaking communities. Neuropsychologia 2001;39:1150-7.

    58. Vilalta-Franch J, Llins-Regla J, Lpez-Pousa S. Resultados delMini-Examen Cognitivo como un instrumento de muestreo en losestudios epidemiolgicos de demencia. Neurologa 1996;11:166-9.

    59. Bhm P, Pea-Casanova J, Gramunt N, Manero RM, Terrn C,Quiones-beda S. Versin espaola del Memory ImpairmentScreen (MIS): datos normativos y validez discriminativa. Neuro-loga 2005;20:402-11.

    60. Prez Martnez DA, Baztn JJ, Gonzlez-Becerra M, Socorro A.Evaluacin de la utilidad diagnstica de una adaptacin espa-ola del Memory Impairment Screen de Buschke para detectardemencia y deterioro cognitivo. Rev Neurol 2005;40:644-8.

    61. Navarro JAG, Garca PG, Mora J, Pastor E, Gil Gregorio P. El testcognitivo del reloj: utilidad para medir deterioro cognitivo yapraxia. Rev Esp Geriatr Gerontol 1995;30:27-31.

    62. Martnez Arn A, Sol P, Salamero M, de Azpiazu P, Toms S,Marn R. El test del dibujo del reloj: mtodos de evaluacincuantitativos y cualitativos. Rev Neurol 1998;27:55-9.

    63. Cacho J, Garca R, Arcaya J, Vicente JL, Lantada N. Una propues-ta de aplicacin y puntuacin del test del reloj en la enferme-dad de Alzheimer. Rev Neurol 1999;28:648-55.

    64. Del Ser T, Snchez F, Garca MJ, Otero A, Zunzunegui MV, Mu-oz DG. Versin espaola del Test de los 7 minutos. Datos nor-mativos de una muestra poblacional de ancianos de ms de 70 aos. Neurologa 2004;19:344-58.

    65. Carnero C, Lendnez A, Navarro E. El test de las monedas. RevNeurol 1999;29:801-4.310 78

    Neu

    rolo

    ga

    2007

    ;22(

    5):3

    01-3

    11

    La psicometra de las demencias a debateJ. Pea-Casanova, et al.

    301-311.qxd 10/5/07 10:56 Pgina 310

  • 66. Carnero-Pardo C, Montoro-Ros MT. Evaluacin preliminar deun nuevo test de cribado de demencias (Eurotest). Rev Neurol2004;38:201-9.

    67. Carnero-Pardo C, Gurpegui M, Snchez-Cantalejo E, Frank A,Mola S, Barquero S, et al., and the Trans-EUROTEST Group. BMCNeurology 2006, 6:15 http://www.biomedcentral.com/1471-2377/6/15.

    68. Carnero-Pardo C, Gurpegui M, Snchez-Cantalejo E, Gmez A,Guardado P, Montoro T, en nombre del grupo Trans-Eurotest.Evaluacin de la fiabilidad del Eurotest. Neurologa 2007;22:153-8.

    69. Pascual LF, Martnez JV, Modrego P, Mostacero E, Lpez del Val J,Morales F. El set test en el diagnstico de demencia. Neurologa1990;5:82-5.

    70. Pascual LF, Martnez JV, Modrego P, Lpez del Val LJ, Mostacero M,Morales F. Contribucin del set-test en el diagnstico de la en-fermedad de Alzheimer. Neurologa 1991;6:78-83.

    71. Carnero C, Maestre J, Marta J, Mola S, Olivares J, Sempere AP.Validacin de un modelo de prediccin de la fluencia verbal se-mntica. Rev Neurol 2000;30:1012-5.

    72. Alberca R, Salas D, Prez-Gil JA, Lozano P, Gil-Neciga E. Fluenciaverbal y enfermedad de Alzheimer. Neurologa 1999;15:344-8.

    73. Benito-Cuadrado MM, Esteba-Castillo S, Bhm P, Cejudo-Boli-bar J, Pena-Casanova J. Semantic verbal fluency of animals: anormative and predictive study in a Spanish population. J ClinExp Neuropsychol 2002;24:1117-22.

    74. Martnez de la Iglesia J, Dueas R, Ons M, Aguado C Albert C. Adap-tacin y validacin al castellano del cuestionario de Pfeiffer(SPMSQ) para detectar la existencia de deterioro cognitivo enpersonas mayores de 65 aos. Med Cln 2001;117:129-34.

    75. Pea-Casanova J, Aguilar M, Bertrn-Serra I, Santacruz P, Hernn-dez G, Insa R, et al. Normalizacin de instrumentos cognitivos yfuncionales para la evaluacin de la demencia (NORMACODEM):objetivos, contenidos y poblacin. Neurologa 1997;11:61-7.

    76. Pea-Casanova J, Aguilar M, Santacruz P, Bertran-Serra I, Her-nndez G, Sol JM, et al. Adaptacin y normalizacin espaolasde la Alzheimers Disease Assessment Scale (NORMACODEM)(y II). Neurologa 1997;12:69-77.

    77. Bhm P, Pea-Casanova J, Aguilar M, Hernndez G, Sol JM, Ble-sa R. Clinical validity and utility of the interview for deteriora-tion of daily living in dementia for Spanish-speaking communi-ties. Int Psychogeriatr 1998;10:261-70.

    78. Pea-Casanova J, Monllau A, Bhm P, Blesa R, Aguilar M, SolJM, et al. Correlacin cognitivo-funcional en la de demencia ti-po Alzheimer: a propsito del Test Barcelona abreviado. Neuro-loga 2005;20:4-8.

    79. Pea-Casanova J, Monllau A, Bhm P, Aguilar M, Sol JM, Her-nndez G, et al., y Grupo NORMACODEM. Valor diagnstico yfiabilidad test-retest de la Escala de demencia de Blessed(BDRS) para la enfermedad de Alzheimer: datos del proyectoNORMACODEM. Neurologa 2005;20:349-55.

    80. Soler T, Pujol J, Pea-Casanova J, Hernndez G, Sol JM, Aguilar A,et al., and the NORMACODEM Group. Adaptation and standar-dization of the Geriatric Evaluation of Relatives Rating Instru-ment (GERRI) for Spain. Neurologa 2002;17:193-9.

    81. Monllau A, Aguilar M, Pea-Casanova J, Bhm P, Sol JM, Her-nndez G y grupo NORMACODEM. Estudio de la Escala de Eva-luacin de Rpida de la discapacidad-2 (The Rapid Disability Ra-ting Scale-2) en la enfermedad de Alzheimer: datos delproyecto NORMACODEM. Neurologa 2006;21:282-8.

    82. Manzano JM, Llorca G, Ledesma A, Lpez JJ. Adaptacin espa-ola de la Alzheimers Disease Assessment Scale (ADAS). ActasLuso-Esp Neurol Psiquiatr 1994;22:64-70.

    83. Pascual LF, Saz P, Larumbe R, Martnez-Lage P, Muruzabal J,Morales F, et al. Estandarizacin en una poblacin espaola dela escala ADAS (Alzheimers Disease Assessment Scale). Neuro-loga 1997;12:238-44.

    84. Verhey FR, Houx P, Van Lang N, Huppert F, Stoppe G, Saerens J,et al. Cross-national comparison and validation of the Alzhei-mers Disease Assessment Scale: results from the European Harmo-nization Project for Instruments in Dementia (EURO-HARPID).Int J Geriatr Psychiatry 2004;19:41-50.

    85. Vilalta J, Llins J, Lpez-Pousa S, Amiel J, Vidal C. CAMDEX. Vali-dacin de la adaptacin espaola. Neurologa 1990;5:117-20.

    86. Llins J, Vilalta J, Lpez-Pousa S. Camdex: adaptacin y valida-cin espaolas. Barcelona: ncora, 1991.

    87. Lozano-Gallego M, Vilalta-Franch J, Llins-Regl J, Lpez-Pousa S.El Cambridge Cognitive Examination como instrumento de de-teccin de demencia. Rev Neurol 1999;28:348-52.

    88. Verhey FR, Huppert F, Korten ECC, Houx P, de Vugt M, Van Lang N,et al. Cross-national comparisons af the Cambridge Cognitive Exa-mination-revised: the CAMCOG-R. Age Ageing 2003;32:534-40.

    89. Erzigkeit H. The development of the SKT project. En: Hindmarch I,Hippius H. Vilcox J, editores. Dementia: molecules, methods andmeasures. Chichester: John Wiley, 1991; p. 101-8.

    90. Erzigkeit H. Manual zum SKT. Formen A-E vorlufiges Manual.Vless: Vatersteten-Mnchen, 1989.

    91. Nasreddine ZS, Phillips NA, Bdirian V, Charbonneau S, White-head V, Collin I, et al. Montreal Cognitive Assessment (MoCA): abrief screening tool for mild cognitive impairment. J Am Geriatr2005;53:695-9.

    92. Carnero-Pardo C, Montoro-Ros MT. Test de las fotos. Rev Neu-rol 2004;39:801-6.

    93. Borson S, Scanlan JM, Brush M, Vitalino PP, Dokman A. The mi-ni-cog: a cognitive vital signs measure for dementia screeningin multi-lingual elderly. Int J Geriat Psychiatry 2000;15:1021-7.

    94. Brodaty H, Pond D, Kemp NM, Luscombre G, Harding L. The GPCOG: a new screening test for dementia designed for generalpractice. J Am Geriatr Soc 2002;50:530-4.

    95. Callahan CM, Unverzagt FW, Hui SL, Perkins AJ, Hendrie HC. Six-item screener to identify cognitive impairment among potentialsubjects for clinical research. Med Care 2002;40:771-81.

    79 311

    Neu

    rolo

    ga

    2007

    ;22(

    5):3

    01-3

    11

    La psicometra de las demencias a debateJ. Pea-Casanova, et al.

    301-311.qxd 10/5/07 10:56 Pgina 311