Presentación de PowerPoint · 2011-11-03 · Desarrollo del proyecto – VI CIE9-MC (7º ed....
Transcript of Presentación de PowerPoint · 2011-11-03 · Desarrollo del proyecto – VI CIE9-MC (7º ed....
VI Jornadas de Sistemas de Información en Salud
Htal. Italiano de Bs As - Año 2011
Experiencias en la implementación de Snomed CT
Contenidos
1. Conformación de SMG (sector salud)
2. Estado actual de Terminologías en SMG
3. Dificultades en el proyecto
4. Desarrollo del proyecto
5. Conclusiones
Conformación de SMG (sector salud)
1989 1994
CyMSA SMMP
Adquisición: •Qualitas •Docthos •Optar •Nubial •Medicien •Salud •Diagnos •Imagen
2011
Presente
5 Clínicas (3 adquiridas) CyMSA, Agote, DLA, San Lucas, CLIO
5 Centros Ambulatorios
8 Clínicas Odontológicas
SM ART
ECCO
770.000 asociados
Sistemas y Tecnología en SMG
1. Creación de la Gerencia Corporativa de Sistemas de SMG:
• Para la unificación de criterios y políticas.
2. Sistemas de Información Médica en SMG:
• De múltiples proveedores.
• Con distintos modelos de datos.
• Poca Interoperabilidad.
3. Actualmente, en proceso de compra de HIS integral.
Estado actual de Terminologías en SMG
1. Evaluando la expresividad de Snomed CT:
• Completitud y Granularidad adecuada de los conceptos.
2. Aumentar usabilidad de Snomed CT:
• Facilitar el Acceso al concepto buscado.
• Enriquecer el vocabulario de interfaz con sinónimos.
• Definir vocabularios de salida para los reportes.
3. Aplicaciones:
• Codificación de Egresos: manual y/o automática.
• ID unívoca de medicamentos y prestaciones.
• Alimentar con terminología al HIS en proceso de compra.
Dificultades
1. Heterogeneidad de los sistemas de información.
2. Aplicaciones legadas no modificables.
3. Poca difusión inicial del tema de las terminologías en la
organización.
4. Priorización inicial del proyecto.
Desarrollo del proyecto – I
1. Análisis del lenguaje médico en SMG para incrementar…
… el conocimiento sobre casuística terminológica.
… el “Match” entre términos de búsqueda y de terminologías.
2. Buscador básico para empezar a usar la terminología.
3. Enriquecer vocabulario de interfaz para aumentar la usabilidad.
4. Codificación manual de Registros Médicos – Finalidad:
• Obtención de sinónimos.
• Dataset codificado para validar la codificación automática.
5. Evaluación de estrategias de codificación automática.
Desarrollo del proyecto – II
Análisis exploratorio del texto I: Coincidencia de Términos (JOIN)
Nota: Truncado por razones de espacio…
Procedimento: se realizó un join (SQL) entre el campo descriptor del diagnóstico en CIE9 ó Snomed CT y el campo con la descripción del diagnóstico escrita por el médico. Cuantas mas coincidencias se encuentran, mayor es la similitud entre estos “lenguajes”. La normalización del texto (ver luego) aumentó enormemente la coincidencia entre los términos.
Desarrollo del proyecto – IV
Diagnostico Cuenta
<p> </p> 460
<p>RNtpaeg</p> 308
<p>Hiperbilirrubinemia sin incompatibilidad</p> 150
<p>ITU</p> 122
<p>BRONCOESPASMO</p> 119
<p>ICC</p> 115
<p>Infeccion urinaria</p> 101
<p>PRETPAEG</p> 98
<p>RNPRETPAEG</p> 88
… … … …
<p>Infección urinaria</p> 39
… … … …
Diagnostico Cuenta
RNTPAEG 329
HIPERBILIRRUBINEMIA SIN INCOMPATIBILIDAD 245
INFECCION URINARIA 193
BRONCOESPASMO 170
ITU 149
BRONQUIOLITIS 126
ICC 123
PRETPAEG 106
NEUMONIA 91
RNPRETPAEG 91
HIPERBILIRRUBINEMIA S INCOMPATIBILIDAD 89
… … … …
SIN NORMALIZACIÓN CON NORMALIZACIÓN
Exploración del texto II : Agrupación de Términos (Group By)
Nota: Truncado por razones de espacio…
Procedimento: se realizó un Group By (SQL) en el campo Diagnóstico de Egreso. Sin normalización de texto se aprecian muchos grupos con pocos miembros. Al normalizar el texto disminuye la cantidad de grupos, pero con mayor cantidad de miembros cada uno. (Aumenta la agregación)
Texto Libre Descriptor Snomed CT Mejoras en el reconocimiento
NEUMONIA Neumonía Diacríticos - Capitalización.
H. D. A. HDA Puntuación - Espacios en blanco
<p>pleuresía</p> pleuresía Markup HTML
luxación de cadera luxación de la cadera Diferencias en stop-words
ruptura apendicular ruptura del apéndice Inflecciones: apéndice / apendicular
Desarrollo del proyecto – V
Formas de aumentar la capacidad de reconocimiento / agrupación de texto
Desarrollo del proyecto – VI
CIE9-MC (7º ed. 2010-11)
Snomed CT (Abr. 2011)
Sin Normalización 0,6% 3,33% 10 veces mas Con Normalización 6,09% 38%
5 veces mas
TOTAL ↑ 50 veces
Aumento en las coincidencias
Usar Snomed CT en vez de CIE9-MC mejora en 5 veces aprox. la cantidad de coincidencias (mayor riqueza terminológica…) Normalizar el texto aumenta 10 veces la cantidad de coincidencias. En forma conjunta: usar Snomed CT con normalización de los textos, aumenta 50 veces la cantidad de coincidencias entre lo que escriben los médicos y los descriptores de la terminología.
Desarrollo del proyecto – II
1. Análisis del lenguaje médico en SMG para incrementar…
… el conocimiento sobre casuística terminológica.
… el “Match” entre términos de búsqueda y de terminologías.
2. Buscador básico para empezar a usar la terminología.
3. Enriquecer vocabulario de interfaz para aumentar la usabilidad.
4. Codificación manual de Registros Médicos – Finalidad:
• Obtención de sinónimos.
• Dataset codificado para validar la codificación automática.
5. Evaluación de estrategias de codificación automática.
Buscador Básico 1.0: eje (desordenes)
* Usuarios: diseñado para usuarios especializados; no para el médico final.
Buscador Básico 1.0: eje (desordenes)
Buscador Básico 1.0: eje (desordenes)
Buscador Básico 1.0: eje (desordenes)
Desarrollo del proyecto – III
1. Análisis del lenguaje médico en SMG para incrementar…
… el conocimiento sobre casuística terminológica.
… el “Match” entre términos de búsqueda y de terminologías.
2. Buscador básico para empezar a usar la terminología.
3. Enriquecer vocabulario de interfaz para aumentar la
usabilidad.
4. Codificación manual de Registros Médicos – Finalidad:
• Obtención de sinónimos.
• Dataset codificado para validar la codificación automática.
2. Evaluación de estrategias de codificación automática.
Obtención de Sinonimia para aumentar la usabilidad
Desarrollo del proyecto – IV
1. Análisis del lenguaje médico en SMG para incrementar…
… el conocimiento sobre casuística terminológica.
… el “Match” entre términos de búsqueda y de terminologías.
2. Buscador básico para empezar a usar la terminología.
3. Enriquecer vocabulario de interfaz para aumentar la usabilidad.
4. Codificación manual de Registros Médicos – Finalidad:
• Obtención de sinónimos.
• Dataset codificado para validar la codificación automática.
5. Evaluación de estrategias de codificación automática.
Codificación de Registros Médicos
Epicrisis a codificar: 3.000 2 Codificadores Simultáneos
Set #1 – 1.000 Epicrisis Medica1 – Medica2
Set #2 – 1.000 Epicrisis Enfermero – Medica1
Set #3 – 1.000 Epicrisis Enfermero – Medica2
En caso de que no haya coincidencia en una codificación dada, desempatará el Comité de Terminologías. (Informática Médica y referentes de distintas especialidades)
• Codificación a cargo de 2 Médicas y 1 Enfermero: sin experiencia en codificación ni en terminologías.
• Objetivo: evaluar variabilidad entre médicos y entre médico-enfermero.
Desarrollo del proyecto – V
1. Análisis del lenguaje médico en SMG para incrementar…
… el conocimiento sobre casuística terminológica.
… el “Match” entre términos de búsqueda y de terminologías.
2. Buscador básico para empezar a usar la terminología.
3. Enriquecer vocabulario de interfaz para aumentar la usabilidad.
4. Codificación manual de Registros Médicos:
• Obtención de sinónimos.
• Dataset codificado para validar la codificación automática.
5. Evaluación de estrategias de codificación automática.
Codificación Automática I: Basado en Reglas
Exploración: Coincidencias con Reglas (SEMANTICA)
Regla: SI: (“% GRIP%” O “% ETI %”) Y NO “% VACUNA %” ENTONCES: GRIPE Ej.: ■ Sme. Gripal = GRIPE ■ Cuadro Gripal = GRIPE ■ Solicita Vacuna para la Gripe = GRIPE Problema: Polisemia → IRA: Insuf. Renal? ó Insuf. Respiratoria? ó IRA (síntoma)?
Para evaluar la exactitud de reconocimiento:
Validar contra Dataset codificado manualmente.
Resultados preliminares:
Se logró coincidencia con el 50% de las epicrisis, con 42 grupos de reglas.
9:30 – 10:30
Codificación Automática II: a. Procesamiento de los datos
Dataset de Entrenamiento
Dataset de Testeo
Registro PalabraX … Edad Sexo TransformadaX Label
[SCTCID]
Epicrisis01 1 … 27 0 0 2452453534534
… … … … … … … … … … …
EpicrisisN 1 … 67 1 1 529846324543
Dataset Codificado
Preprocesamiento • Selección • Transformación
Partición
Codificación Automática II: b. Entrenamiento del Clasificador
Dataset de Entrenamiento
Entrenamiento (Inducción) Usualmente Machine Learning
Modelos Clasificadores
Modelos Clasificadores
1 a N Modelos Clasificadores
Modelo Simple ó Combinado
Testeo Medición del Error
Varias técnicas y algoritmos: DT - ANN - SVM Naïve Bayes – Etc.
Dataset de Testeo Selección
Procesos Iterativos: 1. Obtención del modelo inicial. 2. Mantenimiento del modelo.
Codificación Automática II: c. Uso del clasificador
Paciente: Sexo – Edad MC: “Oliguria” Dx: “IRA” Autor del Registro: Especialidad Sitio del Registro: Servicio
Aplicar Clasificador
Label Probabilidad
Insuficiencia Renal 0,90
Insuficiencia Respiratoria 0,10
IRA (hallazgo) 0,00
Conclusiones
• En proceso de evaluación.
• Interés creciente en distintos ámbitos de SMG: salud, sistemas y comercial.
• Explorando como incorporarla en distintos circuitos de información médica.
• Puesta a punto para alimentar al HIS integral.
• Investigando codificación automática.