Bravo Valero Antonio José
Segmentación de imágenes ventriculográficas usando modelos deformables parte 1
Universidad de Los Andes-Facultad de Ingeniería-Postgrado en Matemática Aplicada a la
Ingeniería. 1999. p. 109
Venezuela
Disponible en:
http://bdigital.ula.ve/RediCiencia/busquedas/DocumentoRedi.jsp?file=33910&type=ArchivoDocumento
&view=pdf&docu=27079&col=5
¿Cómo citar?
: e
' v, '
SEGMENTACIÓN DE IMÁGENES VENTRICULOGRÁFICAS USANDO
MODELOS DEFORMABLES
Autor: Antonio José Bravo V alero
Tutor: Rubén Medina
Trabajo de Grado presentado a la ilustre Universidad de Los Andes
como requisito final para optar al titulo de
MAGISTER SCIENTIAE EN MATEMÁTICA APLICADA A LA
INGENIERÍA
D~GiTAl~ZArDO http://tosi2,. u:2. ve
UNIVERSIDAD DÉ LOS ANDES
' ?¡ B 5 i f AD DE INGENIERÍA
ESPECIALIZACid {i 6 (3 J3 ;TRIA EN MATEMÁTICA APLICADA A LA
INGENIERÍA, EMMA-I
Mérida, Julio de 1999
"Cuando alguien evoluciona,
también evoluciona todo a su alrededor.
Cuando tratamos de ser mejores de lo que somos,
todo a nuestro alrededor se mueve mejor"
A José Leonardo y José Alejandro
AGRADECIMIENTO
Quiero inicialmente agradecer a mis hijos, José Leonardo y José Alejandro, por la
paciencia y comprensión, que me han tenido en estos dos últimos años. Gracias a que son la luz
de mi vida, he podido culminar esta etapa. También agradezco infinitamente a mis Padres, que
han sabido soportar los altos y bajos, que se me han presentado en el tiempo que le dedique a
mis estudios.
Especialmente quiero agradecer a mi Tutor, Prof. Rubén Medina, a quien respeto como
académico y como persona. Se que los objetivos planteados por él, cumplieron su efecto,
generar un trabajo, que diera alguna contribución importante en el área de Procesamiento de
Imágenes Médicas. Gracias por cultivar en mi, ese espíritu de estudio y de búsqueda constante.
A mis profesores de la Maestría, por la gran paciencia que me tuvieron, a José Luis
Bendito, Florencio Plachco, Alejo Sánchez, Alden Mora, Julio Flores López, Rector Febres, y
muy especialmente a nuestro Coordinador, Prof. Carlos Ga.jardo, por siempre estar buscando el
bienestar y tranquilidad de los estudiantes del EMMA-I.
A los profesores Alexis López y Carlos Ramírez, quien estuvieron encargados de revisar
y evaluar este trabajo.
Esto tampoco habría sido posible, si Pablo Guillen, Cesar, Lorena y Gilberto, no me
hubieran ayudado, por eso muchachos, muchas gracias.
Al Grupo de Ingeniería Biomédica (GillULA), todos los que lo conforman son un gran
equipo, y contribuyeron en muchos aspectos a que este trabajo culminara exitosamente, quisiera
nombra a Pablo Miranda, Carlos Castillo y Dhionel Díaz, gracias por tenerme tanta paciencia.
Al Grupo de Bioingeniería de la Universidad Nacional Experimental del Táchira,
quienes tienes grandes deseos, de seguir con la ingeniería aplicada a la Medicina.
RESUMEN
La segmentación es una etapa esencial para la reconstrucción tridimensional del
ventrículo izquierdo, y para la determinación de parámetros asociados a la función ventricular,
al permitir obtener una descripción precisa de la forma ventricular.
En el presente trabajo, se utilizan los Modelos de Cuerpos Deformables o Modelos de
Contorno Activo, para la segmentación de imágenes ventriculográficas. Este tipo de modelo,
corresponde a una curva o superficie que se deforma bajo las leyes de la mecánica de Newton,
y en particular, en base a la teoría de elasticidad expresada en la dinámica de Lagrange. El uso
de los modelos deformables para la segmentación de imágenes médicas se ha incrementado
considerablemente, debido a su capacidad para representar la forma de estructuras biológicas o
anatómicas del cuerpo humano, que usualmente corresponden a objetos no rígidos. El modelo
planteado es un contorno activo, representado como un spline de energía minimizante,
denominado "snake". Las fuerzas asociadas al contorno activo, se obtienen en base a
funcionales de energía tales como, energía interna del spline, la cual establece características
topológicas del modelo, expresadas en términos de la elasticidad y la rigidez. La energía de
imagen, que se encarga de halar el spline hacia una característica deseada de la imagen, que en
nuestro trabajo, está representada por los contorno de la cavidad ventricular. La forma fmal que
el contorno puede adoptar, se encuentra al minimizar los distintos funcionales de energía
asociados al mismo. El proceso de deformación del contorno, es controlado por las reglas
básicas de la fisica, e implantado como un proceso de integración numérica, en el cual, el
estado fmal es calculado a partir de una secuencia de posiciones discretas en el tiempo.El
comportamiento de modelo propuesto es analizado, al realizar la segmentación de imágenes
sintéticas, así como de ventriculogramas reales. La cuantificación del error se realiza al
comparar el contorno obtenido por el modelo deformable con contornos trazados en forma
manual por especialistas. Para imágenes sintéticas, se obtienen errores del orden del 4.78 %, y
para imágenes de ventriculogramas reales del5.25 %. Se realiza adicionalmente un estudio que
permite comparar los resultados obtenidos por el modelo propuesto, en relación a otros
esquemas de contornos activos propuestos en la literatura.
TABLA DE CONTENIDO
ANGIOGRAFÍA CARDIACA ................................................................................................. 1
1.1 INTRODUCCIÓN .......................................................................................................... 1
1.2 ANATOMÍA DEL CORAZÓN ...................................................................................... 3
1.2.1 Aspectos generales ................................................................................................... 3
1.2.2 Aspectos más importantes de la anatomía ................................................................. 5
1.3 ASPECTOS DINÁMICOS DEL CORAZÓN ............................................................... 1 O
1.3 .1 Naturaleza del movimiento cardiaco ....................................................................... 11
1.3.2 Mediciones asociadas a la dinámica cardiaca .......................................................... 11
1.4 MODALIDADES DE IMAGENOLOGÍA CARDIACA ............................................... U
1.4.1 Radiología .............................................................................................................. 13
1.4.2 Tomografia computariza por rayos X ..................................................................... 15
1.4.3 Resonancia magnética ............................................................................................ 16
1.4.4 Tomografia por emisión ......................................................................................... 17
1.4.5 Ultrasonido ............................................................................................................ 17
1.5 VENTRICULOGRAFÍA .............................................................................................. 18
TÉCNICAS DE SEGMENTACIÓN DE IMÁGENES ........................................................... 21
2.1 INTRODUCCIÓN ........................................................................................................ 21
2.2 SEGMENTACIÓN BASADA EN TECNICAS DE BAJO NIVEL ............................... 23
2.2.1 Agrupamiento de atributos ..................................................................................... 24
2.2.2 Técnicas de separación y agrupamiento de regiones ............................................... 25
2.3 SEGMENTACIÓN BASADA EN TECNICAS DE NIVEL MEDIO ............................ 25
2.3.1 Agrupamiento difuso .............................................................................................. 26
2.3.2 Aproximación por teoría de grafos ......................................................................... 27
2.3.3 Modelos deformables ............................................................................................. 29
2.3.4 Métodos de segmentación basado en aproximaciones morfológicas ........................ 31
2.3.5 Redes Neurales ....................................................................................................... 31
2.4 SEGMENT ACION BASADA EN TECNICAS DE ALTO NIVEL .............................. 34
2.4.1 Segmentación piramidal ......................................................................................... 34
2.4.2 Enfoques basados en sistemas expertos .................................................................. 35
4.5.3 Modelo aplicado sobre ventriculogramas reales .................................................... 120
CONCLUSIONES YPERSPECTIVAS ............................................................................... 131
APENDICE A ...................................................................................................................... 134
Media de la Mínima Distancia .......................................................................................... 134
Error Suma ....................................................................................................................... 135
APENDICE B ...................................................................................................................... 137
Teorema B. l ..................................................................................................................... 137
Teorema B.2 ..................................................................................................................... 137
BIBLIOGRAFIA .................................................................................................................. 138
..
CAPÍTULO 1
ANGIOGRAFÍA CARDIACA
1.1 INTRODUCCIÓN
Los avances tecnológicos en imagenología han mejorado considerablemente la calidad
del cuidado médico a los pacientes y sus diferentes modalidades han permitido a los
especialistas incrementar la exactitud en sus diagnósticos, pudiendo así dar tratamientos
precisos. Las tecnologías imagenológicas actuales, incluyen laboratorios de medicina, terapia
por radiación, medicina nuclear y diagnósticos radiológicos. Los rápidos avances de la
tecnología, han permitido obtener representaciones en 3D y 4D de las estructuras internas de
humanos y animales, donde una variedad de modalidades imagenológicas son utilizadas para
ello.
La radiología permite obtener una película radiográfica de la imagen de una parte del
cuerpo humano, por su exposición a los rayos X. Cuando la radiación X atraviesa el objeto bajo
estudio, sufre una atenuación que depende de la densidad y el espesor del objeto. Los rayos
atenuados llegan a un receptor que puede ser la película fotográfica, produciendo así una
imagen cuyo contraste facilitará el diagnóstico médico.
La angiografía es un procedimiento radiológico usado para observar el flujo de sangre,
en cualquier órgano del cuerpo. Bajo este procedimiento destacan la angiografia cardiaca para
observar las arterias coronarias, la angiografia vascular para estudiar la irrigación del cerebro, y
la ventriculografia, para observar la cavidad ventricular.
ANGIOGRAFÍA CARDIACA 2
La Tomografia Computarizada por rayos X (CT) es una modalidad utilizada
rutinariamente en la práctica clínica. Esta modalidad genera un conjunto de imágenes en 2D, en
donde cada una de ellas, representa una rodaja que incluye información sobre la anatomía
interna del paciente. Las imágenes 3D son obtenidas a partir de proyecciones radiológicas
mediante técnicas de reconstrucción. Las proyecciones son obtenidas por la exposición del
objeto a radiaciones de rayos X según distintos ángulos y por la medición del grado de
absorción del haz que atraviesa al objeto. Cuando la distancia entre dos imágenes tomográficas
2D consecutivas es lo suficientemente pequeña, resulta posible obtener una imagen en 3D de la
estructura visualizada mediante interpolación lineal.
La Resonancia Magnética (MR ó MRl) es similar a la Tomografia Computarizada en el
proceso de generación de conjunto de datos en 3D, el cual también puede realizarse mediante
capas 2D. Sin embargo, la resonancia magnética difiere fundamentalmente de la Tomografia
Computarizada en la forma como las imágenes son adquiridas, la CT utiliza radiación por rayos
X para generar los datos necesarios para reconstruir las estructuras internas, mientras que la MR
está basada en el principio de Resonancia Magnética Nuclear (MNR), la cual utiliza ondas de
radio frecuencia y campos magnéticos para obtener las imágenes 3D.
Las técnicas de imágenología por ultrasonidos, se basa en registrar las reflexiones que
sufre un haz de ultrasonido al propagarse internamente a través de las diferentes estructuras
anatómicas del cuerpo humano. Los métodos de ultrasonido son atractivos por la facilidad de
obtener imágenes no invasivas en tiempo real, utilizando equipos compactos y portátiles, a un
significativo bajo costo en comparación con otras modalidades de imágenes médicas. Sin
embargo, la relación señal a ruido es baja, por lo cual resulta difícil identificar de manera
precisa las estructuras anatómicas presentes en las mismas.
Todas éstas modalidades han sido utilizadas para visualizar las estructuras cardiacas sin
embargo, solo la angiografía por rayos X es utilizada en las salas de hemodinámia.
En este capitulo, se hace un estudio de la anatomía cardiovascular y se realiza una
síntesis de las diferentes modalidades de imagenología cardíaca. El capítulo fmaliza, con una
ANGIOGRAFÍA CARDIACA 3
breve descripción de la ventriculografia y de su importancia para la evaluación cuantitativa de
la función ventricular.
1.2 ANATOMÍA DEL CORAZÓN.
En esta sección se presentan brevemente algunos aspectos importantes de la anatomía
cardíaca y una explicación muy resumida acerca de su funcionamiento. Dentro de lo breve, se
le presta mayor atención al ventrículo izquierdo por la importancia para este trabajo.
1.2.1 Aspectos generales
El corazón es el agente principal de la circulación de la sangre, el cual consiste en un
músculo hueco situado en el tórax que desempeña a la vez el papel de bomba aspirante e
impelente, atrayendo hacia sus cavidades la sangre que circula por las venas e impulsándola por
otra parte a las dos arterias aorta y pulmonar, y por medio de éstas, a todas las redes capilares
del organismo. Está envuelto en un saco serofibroso llamado pericardio. Las fibras musculares
del corazón son estriadas de movimiento involuntario. Está dividido en cuatro cavidades: dos
aurículas y dos ventrículos, y se compone además de cuatro anillos fibrocartilaginosos
correspondientes a los cuatro orificios de la base de los ventrículos. Posee cinco válvulas: la
mitra/ entre la aurícula y el ventrículo izquierdo, la tricúspide entre la aurícula y el ventrículo
derecho, la aórtica y la pulmonar a la entrada de las arterias aorta y pulmonar, en los
ventrículos izquierdo y derecho respectivamente, y la de Eustaquio, entre el borde anterior de la
vena cava inferior y la abertura auriculoventricular derecha. En la figura 1.1 se observan
algunas de las partes mencionadas en un corte del corazón. El peso medio del corazón en
relación al cuerpo es como 1 es a 158 en el hombre y como 1 es a 149 en la mujer. En números
redondos son aproximadamente de 250 a 300 gr en promedio. En términos muy generales, su
dimensión es semejante a un puño [Testut 60][Netter 78].
Los billones de células musculares que componen el músculo cardíaco son capaces de
generar corrientes eléctricas y potenciales que están en función de diferencias de concentración
ANGIOGRAFÍA CARDIACA 4
iónicas a través de sus membranas [Brooks 97]. Estas células son capaces de generar un cambio
brusco en la diferencia de potencial eléctrico entre sus membranas conocido como un potencial
de acción (P A), además pueden propagar a las células vecinas el ímpetu para generar un P A de
tal manera de producir una onda de movimiento y pueden contraerse mecánicamente si se
incrementan sus concentraciones del ion de calcio. De esta manera, el músculo cardíaco
cíclicamente se expande y se contrae bombeando sangre a distintas partes del cuerpo. Como se
sabe, el ventrículo izquierdo tiene gran importancia debido a que la sangre oxigenada ocupa
esta cavidad al momento de ser bombeada al cuerpo. En contraste, el ventrículo derecho es
ocupado por la sangre que necesita oxigenación y que es bombeada únicamente a los pulmones.
Por tanto, el ventrículo izquierdo realiza un mayor esfuerzo siendo mas propenso a las
patologías, por lo cual su estudio es importante.
Arteria aorta
Vena cava superior --s-....
derecha
Venas
cama e interventricular
Válvula mitral
aortica
Ventrículo Izquierdo
Apex
Fig. 1.1. Estructura del corazón en un corte para mostrar las cavidades, válvulas y vasos
(tomado de [Medina 98]). _
ANGIOGRAFÍA CARDIACA 5
1.2.2 Aspectos más importantes de la anatomía
El corazón se divide en dos mitades laterales, análogamente constituidas: mitad derecha,
en la que circula la sangre venosa, y mitad izquierda, en relación con la sangre arterial. Cada
una de estas mitades se subdivide a su vez en otras dos, situadas una encima de otra: la cavidad
superior, de paredes delgadas y fláccidas, llamada aurícula, y la cavidad inferior, de paredes
más gruesas y más resistentes que lleva el nombre de ventrículo. Cada aurícula comunica con el
ventrículo correspondiente por medio de una válvula auriculoventricular. La parte superior del
corazón está conectada al resto del aparato circulatorio a través de vasos que conducen sangre
hacia el corazón y conducen sangre del corazón al cuerpo. La aorta es la arteria principal que
conduce la sangre oxigenada desde el ventrículo izquierdo a otras partes del cuerpo. El segundo
vaso en importancia es la arteria pulmonar que conduce la sangre para su oxigenación desde el
ventrículo derecho a los pulmones. El paso de la sangre de estos vasos principales desde los
ventrículos se realiza a través de válvulas. Por su parte, las dos venas cavas (superior e inferior)
conducen sangre sin oxigenar desde el cuerpo hasta la aurícula derecha, mientras que las cuatro
venas pulmonares llevan la sangre oxigenada desde los pulmones a la aurícula izquierda. La
sangre contenida en las aurículas pasa a los ventrículos correspondientes para su posterior
bombeo.
Los dos lados del corazón están separados entre sí, en toda su altura, por un tabique
vertical, situado en sentido sagital, que toma el nombre de tabique interauricular a nivel de las
aurículas, y el tabique interventricular a nivel de los ventrículos.
Situación. En el hombre, como en todos los mamíferos, el corazón ocupa la parte media de la
cavidad torácica. Está situado entre los dos pulmones; encima del diafragma, que lo aísla de las
vísceras abdominales; delante de la columna vertebral (43, 53
, 6S, 73 y ga vértebras dorsales), de
la que está separado por el esófago y la aorta; detrás del esternón y de los cartílagos costales,
que lo protegen a manera de escudo. Forma, pues, una parte importante de este tabique,
dispuesto en sentido sagital, que separa los dos pulmones y se denomina mediastino.
ANGIOGRAFÍA CARDIACA 6
Medios de fijación. El corazón se halla mantenido en esta posición por su continuidad con los
grandes vasos que de él llegan: la aorta y sus ramas principales, que se dirigen hacia el cuello y
los miembros superiores; los vasos pulmonares que solidarizan el corazón a los dos pulmones;
por último, las venas cavas, de las que la inferior sobre todo, arrima sólidamente el corazón a la
parte posterior derecha del centro frénico. Además de los vasos, el pericardio también cumple
un papel de fijador mediante sus inserciones diafragmáticas, vertebrales, estemales, y
aponeuróticas, por una parte y sus pliegues sobre los grandes vasos, por otra, constituyendo el
elemento más importante de fijación cardíaca. Sin embargo, el corazón, libre en el saco
pericárdico, salvo a nivel de los puntos de inserción de la serosa, se desplaza, dentro de ciertos
límites, con relativa facilidad inmerso en un líquido que lo lubrica. Se desplaza, de arriba abajo
por la influencia de los movimientos del diafragma, de izquierda a derecha o de atrás adelante.
Además el corazón puede desplazarse en masa con su aparato de suspensión, es decir, con el
tabique mediastínico, por una causa patológica (hidrotórax, neumotórax) [Testut 60].
Forma y Orientación. La orientación del corazón es la siguiente: su base está dirigida hacia
arriba, a la derecha y a atrás; su vértice o punta, hacia abajo, a la izquierda y adelante; su eje
mayor, es decir, la línea recta que desciende de la mitad de la base al vértice, ofrece una triple
oblicuidad: está inclinado a la vez de arriba abajo, de derecha a izquierda y de atrás adelante. La
inclinación sobre el plano medio es muy acentuada y cabe decir con razón que el eje cardíaco
se aproxima más a la horizontal que a la vertical; el ángulo que forma con el plano horizontal
mide, por término medio, 40°. Además, el corazón experimenta, sobre todo en su porción
ventricular, una torsión sobre su eje, de suerte que el borde derecho del órgano es más anterior
que el izquierdo, el ventrículo derecho, más superficial que el ventrículo izquierdo.
Consistencia. La consistencia del corazón varía según sus cavidades, según los sujetos, la edad
y el estado del órgano. Las paredes de las aurículas son delgadas, en cambio las paredes
ventriculares son más gruesas resistentes y elásticas. El corazón diastólico es blando; el corazón
sistólico es duro. Las lesiones patológicas (esclerosis, hipertrofia cardíaca, endocarditis)
influyen considerablemente en la consistencia normal del corazón, disminuyéndola o
aumentándola.
ANGIOGRAFÍA CARDIACA 7
Volumen y peso. El volumen del corazón varía según el sexo y la edad. Su volumen se compara
con el volumen de un puño. No obstante, según [Testut 60] tal modo de evaluación es muy
poco preciso, pues, son numerosas las profesiones que hacen variar el volumen de la mano, sin
tener sobre el corazón influencia alguna. Las dimensiones varían también considerablemente
según el corazón esté en sístole (disminución de todos los diámetros) o en diástole (aumento).
En términos generales, el corazón, en un hombre adulto, pesa alrededor de 270 a 300 gramos y
mide 98 milímetros de altura, 105 de anchura y 250 de circunferencia. Estas cifras,
disminuidas cada una de 5 a 1 O milímetros, dan las dimensiones correspondientes al corazón de
la mujer, cuyo peso por término medio es de 250 gramos. En [Testut 60] se muestra la
capacidad de las dos aurículas y de los dos ventrículos resumidos en el cuadro siguiente:
Aurículas
Ventrículos
Totales
Cavidades
Tabla 1.1 Capacidad de las cavidades cardíacas
Lado derecho Lado izquierdo Totales ------------~--~-----·----·--·-·~--·------··
110a185cc 100a130cc 210a315cc
160 a 230 ce
270 a 415 ce
143 a 212 ce
243 a 342 ce
303 a 442 ce
513 a 757 ce
Ventrículos. Los ventrículos tienen la forma de una pirámide triangular cuya base mira hacia
arriba, a la derecha y atrás. En sus caras hay cuatro orificios: dos anteriores, arteriales, que
corresponden al origen de la aorta y al de la arteria pulmonar; dos posteriores, venosos, los
orificios auriculoventriculares. En la superficie interna de los ventrículos se presentan columnas
carnosas de tipo "trabeculae carnae", las cuales son fascículos de tejido muscular. Algunas de
ellas son simples repliegues, otras se insertan por ambas extremidades y otras terminan por
cordones tendinosos que se insertan en las válvulas auriculoventriculares. Sus tres caras son:
estema!, diafragmática, y pulmonar. Por su mayor importancia para el presente trabajo, se
detalla un poco mas el ventrículo izquierdo (figura 1.2).
Ventrículo Izquierdo. El ventrículo izquierdo ocupa la mayor parte del lado izquierdo del
corazón y es el encargado de bombear la sangre a todo el cuerpo a una presión ocho veces
ANGIOGRAFÍA CARDIACA 8
mayor que la ejercida por el ventrículo derecho [Ganong 98] el cual únicamente bombea sangre
a los pulmones. Por esta razón, el ventrículo izquierdo es la cavidad que realiza un esfuerzo
mayor y la evaluación de su funcionamiento es muy importante. Con relación al ventrículo
derecho, el ventrículo izquierdo posee su eje longitudinal más largo, ocupa en la cara
diafragmática una porción mayor y el espesor medio de sus paredes es tres veces mayor. Dentro
del ventrículo izquierdo están localizadas dos válvulas muy cercanas llamadas la válvula mitral
y la válvula aórtica. La válvula mitral permite la entrada de la sangre desde la aurícula izquierda
y la válvula aórtica permite la salida de la sangre alojada en el ventrículo hacia la arteria aorta.
Pared posterior del ventrículo izquierdo Tabique
interventricular
Apex
Válvula aortica
Pared anterior del ventrículo izquierdo
Vértice del Ventrículo
...._~~----;Izquierdo
Región posterior
Plano de corte
Fig. 1.2. Estructura anatómica del ventrículo izquierdo (tomado de [Medina 98]).
El ventrículo izquierdo visto según la incidencia Oblicua Anterior Derecha (OAD) está
dividido en tres regiones: la región basal correspondiente al tercio mas cercano a la válvula
aórtica, la región apicalla cual es el tercio del ventrículo mas próximo al apex y la región media
dispuesta entre la región basal y la región apical (ver figura 1.3.a). Además, de acuerdo a un eje
que pasa por el centro de la válvula aórtica y el apex se diferencian dos regiones: una inferior
ANGIOGRAFÍA CARDIACA 9
al lado del tabique interventricular y una anterior para también diferenciar distintas partes de su
contorno (ver figura 1.3.b).
Válvula Aortica
l. Antm-o-ba.sal 2. ilnfero-media l Jlpical 4. Injero-media S. Iriferobasal
Fig. 1.3. a) Regiones del ventrículo izquierdo, en la proyección Oblicua Anterior Derecha,
b) El contorno del ventrículo izquierdo subdividido en regiones.
Ventrículo Derecho. Su forma es de una pirámide triangular cuyo vértice apunta hacia abajo. El
ventrículo derecho presenta cuatro partes: anterior, posterior, septal y auriculo-ventricular. La
función del ventrículo derecho es la de dirigir la sangre que necesita ser oxigenada hacia los
pulmones con una presión más baja que la presión contenida en el ventrículo izquierdo. Por esta
razón las paredes del ventrículo derecho son más delgadas que las paredes del ventrículo
izquierdo.
Aurículas. Cavidades que se encuentran encima de las cavidades ventriculares cuya forma es
geométricamente indefmible. Cuando están llenas exceden, de derecha a izquierda, la masa
ventricular. Vacías y sin fijar, sus paredes, blandas, se aplastan. Están separadas interiormente,
como los ventrículos, por un tabique. La aurícula derecha es la cavidad donde la sangre llega
proveniente del cuerpo a través de la vena cava inferior y de la vena cava superior. La aurícula
derecha está conectada al ventrículo derecho mediante un orificio auriculoventricular que posee
una válvula llamada tricúspide. Por otra parte, la aurícula izquierda recibe cuatro venas
pulmonares, dos derechas y dos izquierdas. La función de la aurícula izquierda es la de recibir
la sangre oxigenada proveniente de los pulmones. Esta aurícula está conectada al ventrículo
izquierdo por un orificio auriculoventricular en donde se encuentra la válvula mitral.
ANGIOGRAFÍA CARDIACA 10
1.3 ASPECTOS DINÁMICOS DEL CORAZÓN
El corazón es un órgano en movimiento pennanente, con latidos periódicos de una
frecuencia aproximada de 60 latidos por segundo. Estos latidos corresponden a fases de llenado
y expulsión de sangre de las cavidades cardiacas, llamadas respectivamente diástole y sístole.
El comportamiento dinámico del corazón es estudiado, por el registro de su actividad eléctrica
representada por la señal Electrocardiográfica (ECG), por la medición de parámetros mecánicos
o por la observación de imágenes de angiografia.
El movimiento cardiaco es producido por la activación de fibras musculares, por la
acción de una señal eléctrica. Esta señal es propagada por el sistema de conducción, el cual está
constituido por fibras de inervación adaptadas a la fisiología del corazón. La estimulación
eléctrica se produce primero en las aurículas, propagándose luego a los ventrículos. La fuerza y
la velocidad de contracción de los músculos cardiacos son variables, y están afectados por
características tales como la longitud de las fibras y la intensidad del estímulo eléctrico.
Nonnalmente, las cavidades del corazón laten en secuencias, donde la contracción de las
aurículas (sístole auricular), genera una contracción en los ventrículos (sístole ventricular), y
durante la diástole se produce el paso de sangre acumulada hacia los ventrículos. Durante la
diástole el corazón se llena de sangre, según las siguientes fases:
Diástole auricular. Las válvulas aortica y pulmonar se cierran, y la presión ventricular
disminuye durante la fase de relajamiento ventricular. Las sangre desoxigeneada penetra en la
aurícula derecha, mientras que la aurícula izquierda recibe la sangre oxigenada. La velocidad de
llenado, disminuye cuando las aurículas se dilatan. Durante la fase de llenado de las aurículas,
las válvulas mitral y tricúspide permanecen cerradas.
Diástole ventricular. La aurícula izquierda y la aurícula derecha, se contraen durante la sístole
auricular, y expulsan la sangre hacia los ventrículos, a través de la válvula mitral y tricúspide.
El llenado es rápido, volviéndose bastante lento cuando los ventrículos están casi llenos.
Sístole ventricular. Al comienzo, durante la fase de contracción ventricular, el músculo
ventricular se acorta un poco, y la presión ventricular aumenta. Entonces las válvulas pulmonar
ANGIOGRAFÍA CARDIACA 11
y aortica se abren, cuando las presiones de los ventrículos alcanzan un cierto umbral. La presión
intraventricular aumenta hasta alcanzar su máximo. Las válvulas mitral y tricúpide se cierran, y
el ventrículo izquierdo impulsa la sangre hacia el cuerpo, por medio de la aorta, y el ventrículo
derecho impulsa la sangre hacia los pulmones, por medio de la arteria pulmonar.
1.3.1 Naturaleza del movimiento cardiaco
El movimiento del corazón es asincrónico entre el lado derecho e izquierdo. La sístole
auricular derecha precede a la auricular izquierda, y la contracción del ventrículo derecho
comienza luego que la del ventrículo izquierdo. Sin embargo, el comienzo de la expulsión
ventricular derecha por la arteria pulmonar precede ligeramente la expulsión ventricular
izquierda hacia la aorta. En su mayoría, los aspectos dinámicos involucrados en un ciclo
cardiaco son fácilmente observables a partir de imágenes bidimensionales (en angiografía
cardiaca).
1.3.2 Mediciones asociadas a la dinámica cardiaca
La estimación de la función dinámica del corazón es frecuentemente realizada a partir
de imágenes de angiografía. Esta estimación requiere también la medición de diferentes
variables que dan información en forma general del corazón y de sus cavidades. Las variables
medidas son de naturaleza eléctrica (ECG), acústica (fonocardiográma) o de naturaleza
mecánica (señal de presión). En el procedimiento de cateterismo cardiaco utilizado en la rutina
clínica, se mide la señal ECG y la señal de presión. Sin embargo, durante los procesos de
oscultación médica, es posible medir los fonoc~diográmas.
Electrocardiograma. El corazón posee una red de fibras de músculo cardiaco que se adaptan a \.
la transmisión de un impulso eléctrico de naturaleza electroquímica. La estimulación progresiva
del músculo cardiaco, produce una serie de fases de despolarización rápida, seguida de una
repolarización más lenta asociada a la contracción o relajación de las cavidades. Este proceso es
capaz de producir diferentes potenciales eléctricos que son transmitidos a todo el cuerpo. El
electrocardiograma o señal ECG es una señal eléctrica medida en la superficie del cuerpo que
ANGIOGRAFÍA CARDIACA 12
recoge las variaciones del potencial eléctrico asociadas a la actividad del corazón. Esta señal es
medida por la utilización de electrodos colocados sobre la piel, y conectados a un apropiado
equipo de amplificación y filtraje. La señal registrada da información sobre la actividad
auricular (expresada por la onda P), y la actividad ventricular según dos componentes, una
componente rápida asociada a la despolarización ventricular (complejo QRS), y otra más rápida
asociada a la repolarización (onda T). La onda de estimulación que se propaga por el miocardio
está asociada al movimiento ventricular. La sístole auricular comienza a aparecer en la onda P
de la señal ECG, la sístole ventricular aparece al fmal de la onda R, y finaliza justo cuando
aparece la onda T, figura 1.4.
Onda P
Complejo QRS
R
Q S
OndaT
Fig. 1.4. Señal Electrocardiográfica
Fonocardiograma. Durante cada ciclo cardiaco, dos sonidos son audibles con ayuda de un
estetoscopio: el primero es un sonido débil, ligeramente prolongado debido al cierre de la
váwla mitral y tricúspide debido al inicio de la sístole ventricular. El segundo sonido es más
corto, de tonalidad fuerte a causa del cierre de las válvulas aortica y pulmonar debido al fin de
la sístole ventricular.
Señal de presión. La medición de la señal de presión es realizada durante el proceso de
cateterismo, por la inserción de un cateter que se encarga de sensar en las cavidades del corazón
o en los vasos. La presión medida se expresa en milímetros de mercurio (mmHg). La medición
se realiza, al menos durante dos ciclos respiratorios. La morfología de la señal de presión de la
ANGIOGRAFÍA CARDIACA 14
Los rayos X son un tipo de radiación electromagéntica ionizante que debido a su
pequeña longitud de onda (1 a 2 Á), tienen la capacidad de interacción con la materia
(intercambio de energía). Los rayos X pueden atravesar los tejidos del cuerpo y excitar placas
fotográficas y pantallas fluoroscópicas.
Fig. 1.6. Imágenes de rayos X. del Torax.
El tubo de rayos X (fuente de radiación) es el elemento más importante en un equipo de
radiología ya que en él se produce la radiación. Básicamente, es un encapsulado de vidrio (al
vacío) formado por dos elementos: el ánodo con polaridad positiva y el cátodo con polaridad
negativa (figura 1.7). Cuando se hace circular por el filamento una corriente eléctrica del orden
de varios amperes, éste se calienta alcanzando temperaturas de hasta 2000 °C, y en ese
momento un grupo de electrones es producido por emisión termoiónica. Dichos electrones son
acelerados (energía cinética) debido a las diferencias de potencial en el orden de los 100 kV,
que se aplican entre el ánodo y el cátodo. Los electrones así acelerados se estrellan contra el
ánodo, sufriendo un frenado brusco, que libera al menos dos tipos de energía, una en forma de
calor y otra en forma de radiación X. Cuando la radiación producida por el tubo de rayos X
atraviesa el objeto bajo estudio, sufre una atenuación que depende de factores como densidad y
espesor de dicho objeto. Los rayos atenuados llegan fmalmente al receptor que puede ser la
película radiográfica (radiología directa) ó un intensificador de imagen (radiología indirecta),
figura 1.8. En ambos casos, los rayos atenuados producirán, finalmente, una imagen cuyo
contraste facilitará el diagnóstico médico.
ANGIOGRAFÍA CARDIACA 15
Fig. 1.7. Tubo de rayos X.
Plano Dlll!u:tor
Fig. 1.8. Sistema radiológico simplificado.
1.4.2 Tomografía computariza por rayos X
La tomografia computarizada por rayos X (CT) o tomografia axial computarizada
(CAT) es una modalidad de imagenología médica no invasiva, capaz de adquirir
representaciones tridimensionales de estructuras anatómicas internas de pacientes. En la CT, un
segmento plano del cuerpo se hace irradiar en varias direcciones por haces de rayos-X, y a
partir de la detección de los haces transmitidos a través de la sección, se reconstruye una
imagen plana del segmento, tal como si éste hubiese sido removido fisicamente del cuerpo e
irradiado en una vista perpendicular. La figura 1.9 muestra una imagen de los vasos sanguíneos
por tomografia computarizada. Los equipos convencionales de tomografia no permiten
visualizar la estructura cardíaca debido a que su naturaleza dinámica requiere tiempos de
adquisición muy pequeños. Existen sin embargo, equipos experimentales de tomografia que
permiten adquirir imágenes tomográficas 3D de la estructura cardíaca [Ritman 96].
ANGIOGRAFÍA CARDIACA 16
Fig. 1.9. Imagen de los vasos sanguíneos
1.4.3 Resonancia magnética
La radiología y la tomografia axial computarizada, tienen en común la utilización de
rayos X como fuente de energía para la obtención de las imágenes. Los rayos X son un tipo de
radiación ionizante capaz de interactuar con la materia, lo cual para el cuerpo humano significa
que puede producir mutaciones biológicas. En tal sentido, una de las metas de largo alcance de
la imagenología médica es la de obtener imágenes médicamente diagnosticables sin, o al menos
minimizando, la utilización de radiación ionizante. La Resonancia Magnética (MR) puede
obtener imágenes del cuerpo humano, no solo en el plano transversal o axial sino también en
los dos restantes planos ortogonales (sagital y coronal) sin utilización de radiación ionizante. La
imagenología por resonancia magnética, consiste de la medición de la concentración y el
tiempo de relajación de cierto núcleo atómico excitado por la acción de un campo magnético
fijo y un campo de radiofrecuencias. En la figura 1.1 O, se muestra una imagen por resonancia
magnética del corazón. La visualización de las estructuras cardíacas mediante MRI requiere
utilizar técnicas sofisticadas de adqusición que operan de manera sincronizada con la señal
ECG para mejorar la resolución temporal de la misma [Zuccaro 95].
Fig. 1.1 O. Imagen del corazón por MR.
ANGIOGRAFÍA CARDIACA 17
1.4.4 Tomografía por emisión
Las imágenes de tomografia por emisión están basadas en la localización en cada punto
de un órgano, de una sustancia marcada por un radioelemento, la cual es administrada al
paciente. Esta modalidad proporciona una imagen cuantitativa del funcionamiento del órgano
en estudio. Esta técnica imagenológica nuclear, se considera en dos modalidades, la tomografia
computarizada por emisión de un solo fotón (SPECT), la cual involucra el uso de agentes
marcadores con tecnesio, donde un solo rayo gamma es emitido por un proceso de
desintegración nuclear; mientras que la tomografia por emisión de positrones (PET) usa
isótopos como el galio que produce dos rayos gamma en cada desintegración nuclear. La
diferencia básica en la SPECT y PET viene dada por los radioisotopos usados. La figura 1.11,
muestra una imagen PET del ventrículo izquierdo.
Fig. 1.11. Imagen PET del ventrículo izquierdo.
1.4.5 Ultrasonido
Otro de los métodos que día a día gana más terreno en aplicaciones dentro del campo de
la imagenología, lo constituye sin duda alguna el Ultrasonido. Al igual que la RM, no hace uso
de radiación ionizante para la obtención de imágenes, lo cual permite su uso repetitivo,
particularmente para el diagnóstico de mujeres en estado de gravidez y en cardiología.
Como su nombre lo expresa, la imagenología por ultrasonido se refiere a la utilización
de ondas de sonido por encima del rango audible. Las ondas mecánicas de sonido que se
ANGIOGRAFÍA CARDIACA 18
propagan en los tejidos biológicos, son ondas longitudinales de compresión que se propagan a
través del medio a cierta velocidad v. El espaciamiento entre regiones sucesivas de compresión
es llamado longitud de onda acústica A. Estros parámetros se relacionan con la frecuencia de
onda mediante la expresión v = fA. (donde v está en rnls, f en Hz y A en m). Esta sencilla
ecuación expresa la resolución de un sistema de imagenología ultrasonido, y la necesidad de
usar frecuencias más altas para visuali~ar tejidos. La figura 1.12, muestra una imagen por
ultrasonido de la válvula aortica.
Fig. 1.12. Imagen de ultrasonido de la Válvula aortica.
La mayor parte de equipos de ecografia permite la adquisición de imágenes 2D del
corazón según un plano predefmido de acuerdo a la ubicación de la sonda. Recientemente, se ha
logrado la adquisición de imágenes 3D mediante la adquisición sincronizada con la señal ECG,
de imágenes 2D del corazón [Torrealba 98].
1.5 VENTRICULOGRAFÍA
La angiografía es una técnica que permite visualizar y analizar los órganos internos
mediante la utilización de rayos X, luego de la inyección de un producto de contraste a esas
estructuras. Cuando esta técnica es utilizada para visualizar las cavidades del corazón recibe el
nombre de ventriculografia. El objetivo de la ventriculografía durante los cateterismos
cardiacos, es el de defmir el tamaño y la forma del ventrículo izquierdo, asi como también la
visualización de la forma y la movilidad de estructuras asociadas como las válvulas cardiacas,
ANGIOGRAFÍA CARDIACA 19
la figura 1.13 muestra imágenes angiográficas del ventrículo izquierdo y de las arterias
coronarias.
(a) (b)
Fig. 1.13. Imágenes angiográficas. a) Ventrículo izquierdo. b) Arterias coronarias.
El estudio del movimiento también es uno de los objetivos que se persigue a través de la
estimación de la dinámica ventricular. La evaluación de la función ventricular es posible, a
partir de un conjunto de parámetros que describen el comportamiento de la dinámica ventricular
durante el ciclo cardiaco [Kennedy 87][Bravo 96]. La estimación de la función ventricular a
nivel global y local puede realizarse por la estimación visual de partes del ventrículo durante el
ciclo cardiaco. La ventriculografia izquierda es una herramienta comúnmente utilizada para la
toma de decisiones clínicas de diversos daños cardiacos.
Las imágenes ventriculográficas presentan ciertas distorsiones debidas al sistema
radiológico de proyección oblicua. Estas distorsiones son la magnificación, deformación y
desplazamiento. La primera constituye un agrandamiento de la imagen proyectada debida a la
relación entre las distancias entre la fuente y el plano detector por una parte, y entre la fuente y
el objeto de estudio. La deformación está caracterizada por cambios de magnificación en
diferentes porciones del objeto en estudio.
ANGIOGRAFÍA CARDIACA 20
Por otra parte, las ventriculografias obtenidas recogen las atenuaciones registradas por el
paso de los rayos X no solo por el ventrículo izquierdo sino por todos los otros tejidos, huesos y
cavidades que intervienen en la escena.
Existen otros problemas asociados al procedimiento de registro de las ventriculografias
como llenado incompleto y no homogéneo del producto de contraste en la cavidad ventricular,
llenado de otras cavidades con el producto de contraste, presencia del catéter en la escena,
aparición de ruido, movimientos del paciente etc.
El ruido generalmente se defme como la variación aleatoria de una señal que contamina
la información. Para el caso de imágenes obtenidas mediante rayos X, el ruido consiste en la
aparición de intensidades aleatorias en el plano detector de aspecto granuloso, que se producen
por efectos inherentes a la naturaleza del proceso de emisión de fotones y al equipo usado
[Medina 98][Kruger 86]. El ruido producido por este fenómeno es conocido como ruido
cuántico y su generación sigue una ley de distribución de probabilidades de Poisson. Con
respecto al equipo usado en la adquisición aparece también ruido en la imagen de naturaleza
aditiva e independiente del ruido cuántico que en todo caso se considera en niveles menores que
este.
CAPÍTUL02
TÉCNICAS DE
SEGMENTACIÓN DE IMÁGENES
2.1 INTRODUCCIÓN
Las técnicas de segmentación de imágenes se basan en la organización o agrupamiento
de un conjunto de formas, donde las principales características para esa organización son la
proximidad, similaridad, y continuidad. En imágenes médicas, estas técnicas se utilizan para la
identificación de estructuras anatómicas, ya que las mismas permiten particionar a la imagen en
un conjunto no solapado de regiones, cuya unión es la imagen completa.
En procesamiento de imágenes ventriculográficas, una de las técnicas más usadas para
la extracción de información es la segmentación de imágenes. La segmentación es una etapa
esencial para la reconstrucción tridimensional del ventrículo izquierdo, y para la determinación
de parámetros asociados a la función ventricular [Kennedy 70][Bravo 96]. En la actualidad, se
desarrollan esfuerzos para realizar la detección automática de los contornos de las imágenes
ventriculares [Figueiredo 92][0livier 98], sin embargo, no se ha encontrado aún ningún
método capaz de resolver este problema de manera precisa y automática, adicionalmente las
técnicas existentes no han sido validadas clínicamente. En tal sentido, Covvey [Covvey 70]
desarrolla uno de los primeros métodos para la detección automática del contorno ventricular,
el cual utiliza una técnica de umbral fijo para tratar una secuencia de vídeo, en la cual las
imágenes adyacentes deben tener una muy buena calidad de contraste, para poder obtener
buenos resultados.
TÉCNICAS DE SEGMENTACIÓN DE IMÁGENES 22
En 1986, Boecker [Boecker 86] intenta detectar los contornos ventriculares a partir de
imágenes sustraídas logaritmicamente, luego de aplicarle un filtro basado en el operador de
Marr y Hildreth [Marr 80]. En ese mismo año, Leeuwen [Leeuwen 86] describe un método para
la detección automática de los contornos ventriculares sobre cineangiogramas contrastados
según la incidencia Oblicua Anterior Derecha (OAD), dicho método era inicializado por la
defmición interactiva de tres puntos de referencia sobre el contorno, dos de ellos colocados al
nivel de la válvula aórtica y el tercero a nivel del ápex; luego, un modelo, derivado de un
conjunto de contornos trazados manualmente, se hace corresponder con esos tres puntos, y los
atributos del contorno son extraídos según líneas ortogonales al contorno asumido. El conjunto
de rectas ortogonales va a formar una franja que contiene al contorno ventricular. Esta franja
forma una nueva imagen rectangular, la cual es tratada con un detector de contorno basado en el
gradiente, el cual defme los puntos del contorno deseado. Otro enfoque para la estimación del
contorno ventricular ha sido propuesto por Figueiredo [Figueiredo 92], donde el problema de
segmentación se estudia desde el punto de vista de la estimación Bayesiana. El modelo de
contorno se establece de acuerdo a un sistema en coordenadas polares, cuyo centro esta en
correspondencia con el centro de gravedad de la forma ventricular. Los niveles de gris según un
radio del sistema coordenado polar es modelado como un escalón invertido. A partir de ese
modelo, una función de probabilidad es defmida por los niveles de gris de la imagen como
función de la longitud de los radios considerados para la descripción en coordenadas polares.
Un estimador MAP (rnaximun a posteriori) es entonces derivado, el cual permite estimar
completamente cuales de los radios pueden ser modelados como un campo unidimensional de
Markov. El algoritmo de optimización del estimador es inicializado con una aproximación del
contorno obtenida por el método de la máxima verosimilitud. El contorno es deformado para
obtener la máxima probabilidad condicional para cada punto del contorno según un algoritmo
AICM (Iterated conditional modes algorithm). Este proceso permite la estimación simultánea
de parámetros asociados al modelo de maximización de la función de energía de diques, de
manera de generar un contorno bien adaptado a los datos iniciales. Medina [Medina 95b ],
propone un método de segmentación de imágenes angiográficas del ventrículo utilizando
Agrupamiento Difuso. El método permite la detección ventricular, sin embargo, resulta costoso
desde el punto de vista computacional. Recientemente Olivier [Olivier 98], propone un método
para la detección automática de contornos por codificación de conocimiento en modelos de
TÉCNICAS DE SEGMENTACIÓN DE IMÁGENES 23
contorno activo. Este método está basado, en la idea de introducir información en los procesos
de segmentación por contornos activos. El mismo es capaz de superar los inconvenientes de los
contornos activos, como la dependencia del modelo inicial y el uso exclusivo de información
local. Una red neural multiresolución es usada para encontrar automáticamente un contorno
inicial, y un algoritmo de programación dinámica se encarga implantar el proceso de detección
basada en contornos activos. Este método ha generado resultados prometedores en la detección
de contornos del ventrículo izquierdo en imágenes de rayos X, y demuestra que la detección
completamente automática de contornos, puede ser lograda.
El desarrollo de técnicas para resolver el problema de detección de contornos en
imágenes ventriculares, como se ha podido observar es un problema abierto, en tal sentido, el
presente capitulo apunta hacia una revisión de las más recientes técnicas de segmentación en
imágenes médicas y su aplicación. En el mismo, las técnicas de segmentación se agrupan en las
siguientes categorías:
i. Segmentación basada en técnicas de bajo nivel.
u. Segmentación basada en técnicas de nivel medio.
iii. Segmentación basada en técnicas de alto nivel.
2.2 SEGMENTACIÓN BASADA EN TECNICAS DE BAJO NIVEL
Las técnicas de segmentación de imágenes usando técnicas de bajo nivel pueden ser
ampliamente clasificadas en dos clases: agrupamiento de atributos y segmentación basada en
regiones. Las técnicas de clasificación de características comienzan desde clasificación basada
en pixeles hasta agrupamiento multidimensional de vectores de características. Los métodos de
segmentación basados en regiones, tornan en cuenta un conjunto de puntos de la imagen, a los
cuales se les analiza características como, la posición en el espacio de intensidades, las
relaciones topológicas (conectividad) y las características de las fronteras entre dos conjuntos.
Dependiendo de como sea analizada la posición en el espacio y las relaciones espaciales
existentes entre los pixeles, se pueden encontrar métodos de Clasificación [Horud 93] y
métodos por Crecimiento de Regiones [Haralick 92].
TÉCNICAS DE SEGMENTACIÓN DE IMÁGENES 24
2.2.1 Agrupamiento de atributos
El objetivo de este método, es el de encontrar de una manera óptima los valores
característicos de la imagen que establecen la separación del objeto de interés, con respecto a
las regiones que no pertenecen al mismo; debido a esta característica y si los valores de gris del
objeto y del resto de la imagen difieren claramente, entonces el histograma mostrará una
distribución bimodal, con dos máximos distintos, lo que debiera generar, la existencia de una
zona del histograma ubicada entre los dos máximos, que no presente los valores característicos,
y que idealmente fuera igual a cero. Con ello, se logrará una separación perfecta entre el objeto
y la región de la imagen que lo circunda, al establecer un valor umbral ubicado en esta región
del histograma. Por lo tanto cada pixel de la imagen, es asignado a una de dos categorías,
dependiendo si el valor umbral es excedido o no, como se observa en al figura 2.1.
Fondo Objeto
L-1 Umbral
Fig. 2.1. Ejemplo de un histograma bimodal, en este caso el umbral a utilizar en la
segmentación debiera estar ubicado en el valle entre los dos picos del mismo.
Si el valor del histograma ubicado entre los dos máximos, es distinto de cero, las
funciones de probabilidad de los valores de gris del objeto y de la región restante, se solaparán,
de tal manera que algunos pixeles del objeto deberán ser tomados como pertenecientes a la
región circundante y viceversa. Conocida la distribución de la función de probabilidad de los
pixeles del objeto y de la región circundante, es posible aplicar análisis estadístico en el proceso
de buscar un umbral óptimo, con el número mínimo de correspondencias erróneas. Estas
distribuciones pueden ser estimadas por histogramas locales, los cuales solamente incluyen las
TÉCNICAS DE SEGMENTACIÓN DE IMAGENES 25
regiones correspondientes de la imagen. Por otra parte, puede formarse un vector
multidimensional de atributos tales como magnitudes de los contornos, mediciones de textura,
características espectrales, todas ellas propiedades locales de cada pixel. Cada región forma un
grupo distinto en el espacio N-dimensional de las atributos, donde un algoritmo conveniente de
agrupamiento [Hartington 75], es usado para asignar puntos en distintos grupos. Estos grupos,
son mapeados en el dominio espacial para generar la región deseada.
2.2.2 Técnicas de separación y agrupamiento de regiones
Esta técnica se basa, en organizar los pixeles de la imagen en una estructura piramidal
mallada de regiones [Ballard 82]. En esta estructura mallada, las regiones son organizadas en
grupos de cuatro (4). Algunas regiones pueden ser separadas en cuatro subregiones, y las
proximas cuatro pueden ser agrupadas en una sola región. El algoritmo puede ser formulado de
la siguiente forma:
1. Escoger una estructura mallada y una propiedad de homogeneidad H. Si para una región R
en la estructura, H(R) =falso, separe en cuatro subregiones. Si para cuatro subregiones RkJ,
Rk2, ... , Rk4, H(Rkl u Rk2 u RkJ u Rk4) = verdad, agrupe en una región simple. Cuando no se
puedan agrupar más regiones, parar.
ii. Si regiones R¡ y R1 son vecinas, tales que H(R¡ u R) = verdad, agrupe esas regiones.
2.3 SEGMENTACIÓN BASADA EN TECNICAS DE NIVEL MEDIO
En esta categoría, se clasifican todas aquellas técnicas que proporcionan un esquema de
representación apropiado de las formas presentes en una escena, y que luego forman estructuras
de datos de alto nivel a partir de la imagen segmentada. El proceso de formación de estructuras
de datos de alto nivel, a partir de imágenes segmentadas puede ser dividido en dos principales
clases: formación de contornos (o superficies en 3D) y formación de regiones (sólidos en 3D).
Entre las técnicas basadas en contornos, se encuentran los modelos deformables [Kass 87] y los
enfoques morfológicos [Serra 82]. Cuando la forma del contorno no es conocida, algunas
técnicas aplicables para la formación de contornos consisten en algoritmos basados en grafos de
TÉCNICAS DE SEGMENTACIÓN DE IMÁGENES 26
búsqueda [Hubert 74], en los cuales los elementos del contorno de la imagen son representados
como un grafo, y el proceso trata de encontrar la vía de menor costo entre dos nodos del grafo
usando algoritmos de búsqueda [Martelli 72][Duda 73][Fischler 81]. También métodos de
agrupamiento difuso [Boujemaa 94] son utilizados cuando las particiones entre grupos de la
imagen que se quiere segmentar no se encuentran bien definidas.
2.3.1 Agrupamiento difuso
Los algoritmos de agrupamiento difuso, constituyen una herramienta matemática usada
para detectar similaridades entre los miembros de una colección de objetos. La información
acerca de los objetos a ser analizada, es almacenada en forma de vectores de d dimensiones. El
vector usado representa un objeto en particular, el mismo tiene como componentes las d
características escogidas como base para la comparación con otros objetos. La salida del
algoritmo puede entonces ser usada para clasificar los datos en subconjuntos o grupos
[Windham 82]. Cuando los subconjuntos o grupos son fusificados, el algoritmo de clasificación
se conoce como algoritmo difuso de C-medias. El mismo corresponde a una técnica que puede
ser utilizada en la segmentación [Hall92][Boujemaa 94][Medina 95b][Richardt 96].
Algoritmo de agrupamiento difuso. Las técnicas de agrupamiento difuso no necesitan ser
entrenadas para realizar la clasificación. Ellas toman un conjunto de datos fmito
X= xPx2' ..... ,xn como entrada, cada X¡ e X es un vector de característica;
X¡ = (x¡" x¡2 , ..... ,x¡.J, donde XiJ es la /sima característica del subconjunto X¡, donde s es la
dimensionalidad de X¡. Una función u: X~ [O,l]es defmida, la cual asigna a cada X¡ en X su
grado de membresia en el conjunto difuso u. La función u es llamada función de membresía del
subconjunto difuso de X El objetivo es particionar a X en conjuntos difusos significativos. Una
partición difusa en e subconjuntos está definida como una matriz U de tamaño ex n, tal que:
1. Cada fila U¡ representa la membresía asociada al ¡esimo subconjunto difuso de X.
ii. Cada columna U exhibe el grado de membresia del/simo dato del subconjunto difuso.
iii. La suma de los grados de membresia de cada dato en todos los subconjuntos difusos es a lo
sumo igual a l.
TÉCNICAS DE SEGMENTACIÓN DE IMÁGENES 27
iv. Subconjuntos no difusos son eliminados.
Si M¡c denota la partición difusa e de X, entonces U E Mtc· El algoritmo difuso de C
medias usa optimización iterativa para estimar el mínimo de una función objetivo Jm.
n e
Jm(u, v)= ¿¿(u;kt(d;ky Ec 2.1 k=l i=l
donde v = (v¡, v2, ...... , ve) con v; empezando en el centro del grupo de la clase i; 1:::; i:::; e y
d;~ = llxk - v; 112
, la norma Euclideana. Para minimizar la función objetivo, los centros de grupo
y las funciones de membresía son escogidas mediante un algoritmo iterativo tal que altos
valores de membrecía ocurran en los puntos cercanos al correspondiente centro del grupo.
2.3.2 Aproximación por teoría de grafos
El agrupamiento de datos es un aspecto importante en el análisis de los nusmos.
Numerosos métodos de agrupamiento han sido reportados en la literatura [Hubert 74][Urquhart
82]. Dado un conjunto de M puntos de datos, el objetivo del agrupamiento, es particionar el
conjunto en K subconjuntos no vacíos tal que, datos semejantes sean agrupados en un mismo
subconjunto y los datos en diferentes subconjuntos no sean parecidos. Wu [Wu 93], propone
una técnica basada en teoría de grafos para el agrupamiento de datos, que ha sido aplicada en el
problema de segmentación de imágenes, dicha técnica es aplicada en dos pasos como se
describe a continuación:
Agrupamiento de datos a través de teoría de grafos. Los datos agrupados son representados por
un grafo de adyacencias indirectas, denotado por G: cada vértice de G corresponde a un punto
de datos, y un arco enlaza dos vértices en G si los puntos de datos correspondientes son
vecinos, de acuerdo a un sistema de vecindad establecido. Una capacidad de flujo es asignada a
cada arco en G. Esta capacidad se escoge tal que, refleje la característica de similaridad entre un
par de vértices enlazados. El agrupamiento es obtenido por la remoción de los arcos de G, que
no cumplan con un valor establecido de capacidad de flujo, formando así subgrafos
TÉCNICAS DE SEGMENTACIÓN DE IMÁGENES 28
mutuamente excluyentes. El propósito de estos algoritmos, es el de agrupar componentes
semejantes en la menor cantidad de grupos. Esto puede ser formulado en términos de grafos de
adyacencia formado por dichas componentes, los cuales al ser divididos forman un conjunto de
subgrafos que contienen un grupo de vértices conectados o componentes cuya unión representa
una región espacialmente conectada de la imagen [Wu 93].
Segmentación de imágenes usando la teoría de grafos. Las aproximaciones por teoría de grafos,
han sido aplicadas exitosamente al problema de segmentación de imágenes. Si la imagen es
representada por un grafo no direccionado G: cada vértice corresponde a un pixel de G, y un
arco es trazado entre dos vértices si sus pixeles asociados son longitudinalmente o
verticalmente vecinos uno del otro. Por cada par de pixeles vecinos se defme un elemento de
borde, donde la longitud del elemento de borde se calcula como una función de la intensidad
entre el par de pixeles y entre pixeles de una misma. Si X;J representa la intensidad de los
niveles de gris para un pixel de coordenadas (iJ), y si D;: y n;,1 representan a los elementos
de contprno defmidos entre el par de pixeles (x;J, X;J+I) y (x;J, X;+JJ) respectivamente, entonces:
DH s::( ) ( ) ( ) (xi,J-l - xi,J+2 ~ ;,1 = u X;,1 - xi,;+l + xi-I,J - X;-l,J+I + xi+I,J - xi+I,J+I + (ó + 3 )cr -~ Ec. 2.2
D v s::( ) ( ) ( ) (xi-l,J - xi+2,J ~ i,J = u X;,1 - xi+I,J + xi,J-1 - xi+l,J-1 + xi,J+I - xi+I,J+I + (ó + 3 )cr -~ Ec. 2.3
donde ó y cr son parámetros de control. ó controla los efectos de suavidad de la máscara de
borde, mientras que cr es proporcional a la diferencia de intensidad más pequeña que indica la
presencia de una región limitada en la imagen. Para lograr una partición de G en dos subgrafos,
el elemento de borde correspondiente al arco perteneciente al corte, forma un contorno cerrado.
El valor del corte es igual a la suma de las capacidades de sus arcos. Si una capacidad pequeña
es asignada a un elemento de borde pronunciado, entonces los cortes de valor pequeño
corresponden a contornos cerrados con elementos de borde pronunciados. De allí, que una
correcta defmición de la capacidad de arco [Wu 93], es determinante en el proceso de
segmentación de imágenes usando teoría de grafos.
TÉCNICAS DE SEGMENTACIÓN DE IMÁGENES 29
2.3.3 Modelos deformables
Los Modelos Deformables, representan una poderosa herramienta usada como técnica
para la representación, reconstrucción, reconocimiento y manipulación de curvas no rígidas,
superficies y sólidos, de allí que es una de las herramientas de mayor rango de aplicación en el
análisis de imágenes [Kass 87][Terzopoulos 91][Cohen 92][Staib 92][0'Donnell 94][Radeva
95a][Radeva 95b][Lobregt 95] [Kervrann 98]. El mayor inconveniente que este tipo de modelos
presenta para su efectiva aplicación, es la necesidad de establecer una aproximación inicial. En
los últimos años, se han tratado de diseñar e implantar sistemas de detección automática de
contornos basadas en modelos deformables [Olivier 98], los cuales logran dar solución al
problema de segmentación en dos fases, la primera de ellas se encarga de obtener la
aproximación inicial deseada de manera automática, para ello se utilizan algunas técnicas de
segmentación reseñadas en este capitulo. En una segunda fase, la aproximación inicial
encontrada, sirve como contorno inicial de un modelo deformable.
A continuación se mencionan algunos de los métodos que usan modelos deformables
para la segmentación de imágenes:
i. Spline de energía minimizante ("snake"), que son atraídos hacia características de la imagen
tales como, líneas y contornos, mientras que fuerzas internas le imponen restricciones de
suavidad [Kass 87]. En el capitulo 3 se da una revisión mas detallada acerca de estos
modelos.
ii. Los modelos de contorno dinámico discreto [Lobregt 95], que consisten en un conjunto de
vértices conectados por segmentos de líneas o contornos. Con un mínimo de interacción, un
contorno inicial puede ser defmido, el cual es automáticamente modificado por un proceso
de minimización de energía. La energía interna del modelo depende de la curvatura local del
contorno, mientras que la energía externa es derivada de las características de la imagen. El
proceso de deformación se detiene cuando un mínimo local de la función de energía es
encontrado. La forma final del modelo, es una aproximación reproducible del contorno
deseado.
iii. Modelos paramétricamente deformables, los cuales son esencialmente de naturaleza
bidimensional, donde la aproximación esta basada en descomposición elíptica de Fourier,
TÉCNICAS DE SEGMENTACIÓN DE IMÁGENES 30
donde la curva es expresada de acuerdo a bases ortonormales, las cuales permiten expresar a
un objeto, como la suma pesada de un conjunto de funciones conocidas, y determinar los
parámetros de forma sencilla, evitando la redundancia [Staib 92].
iv. Superficies deformables en 3D [Cohen 92], donde los objetos se deforman bajo la acción de
fuerzas internas, tales como propiedades elásticas de la superficie, y fuerzas externas que
atraen la superficie hacia los elementos de borde deseados. La deformación es formulada
como un proceso de minimización de energía, donde las aproximaciones variacionales y un
método de elementos fmitos se utiliza para expresar a la superficie en un conjunto discreto
de funciones continuas, lo cual reduce la complejidad computacional y mejora la estabilidad
numérica. Este método ha permitido segmentar imágenes médicas en 3D.
v. Supercuadricas deformables [Terzopoulos 9l][O'Donnell 94], las cuales incorporan
parámetros globales de forma de un elipsoide, de un cilindro generalizado, y grados de
libertad locales basados en propiedades elásticas y fuerzas de acción externa. Estos modelos
pueden ser utilizados para extraer todas las características de la forma, a partir de data visual.
Las deformaciones locales ayudan a reconstruir los detalles de formas complejas.
Algunos otros trabajos en el área de segmentación de imágenes, usando modelos
deformables han sido desarrollados, entre ellos Widrow usa plantillas parametrizadas [Widrow
73], llamadas rubber mask para modelar objetos, donde los parámetros son los tamaños y las
relaciones entre las partes de la imagen. Yuille usó plantillas parametrizadas que consistían en
un circulo encerrado por dos parábolas [Yuille 89], la plantilla se fue deformando en la imagen
por optimización de una función de costo basada en características morfológicas. Modelos
deformables basados en modelos de Markov en 2D han sido también utilizados [Kervrann 98],
donde las deformaciones globales son modeladas usando análisis estadístico modal de las
deformaciones observadas en una población, y las deformaciones locales son representadas por
un proceso aleatorio de Markov de primer orden.
Este tipo de técnicas, han sido usadas en una gran variedad de trabajos de segmentación
de imágenes médicas, en el capitulo 3 se examinan con mayor detenimiento las primeras y
principales técnicas propuestas para realizar esta tarea, se hace una revisión de las ventajas y
TÉCNICAS DE SEGMENTACIÓN DE IMÁGENES 31
limitaciones que estos modelos presentan al ser utilizados para tratar de resolver el problema de
segmentaciones de imágenes.
2.3.4 Métodos de segmentación basado en aproximaciones morfológicas
La morfológica matemática utiliza un conjunto de transformaciones para el análisis de
imágenes [Serra 82]. Tradicionalmente, la morfológica matemática ha sido utilizada para
describir objetos considerándolos como un subconjunto del espacio Euclideano, realizando
énfasis en sus formas, sus volúmenes y sus texturas, o bien en su luminosidad y color en cada
punto, también ha sido utilizada para la comparación de cuerpos, y reconocimiento de los
mismos. Bomans usa una extensión del operador de Marr y Hildreth para la detección de
contornos en imágenes de resonancia magnética [Bomans 90], él usa filtros morfológicos para
refmar la selección de los contornos. Acharya aplica operadores morfológicos a la
segmentación multidimensional de imágenes cardiacas [Acharya 90].
Los operadores morfológicos básicos son la dilatación, erosión, apertura y cerramiento
estructurante, tales operadores se aplican a las imágenes en base a considerar un patrón
denominado "Elemento Estructurante" [Haralick 92]. Los elementos estructurantes de un
operador morfológico son una función definida en el dominio del patrón espacial del operador,
y cuyo valor en cada pixel del dominio depende del coeficiente empleado por el operador para
tal posición del pixel y del valor del pixel afectado.
2.3.5 Redes Neurales
Las redes neurales artificiales, han sido utilizadas como técnicas de segmentación de
imágenes, basadas en la noción de que la red neural puede reducir los requerimientos de
experticia del usuario en el problema de segmentación. Las técnicas de segmentación con redes
neurales están esencialmente basadas en formas, que hacen uso de características de la imagen
para la extracción de la forma. Lin segmentó imágenes de rayos X, tomografia computarizada
usando un algoritmo de redes neurales [Lin 91]. La segmentación de imágenes, es formulada
como un problema de satisfacción de restricciones donde una red neural es utilizada para
TÉCNICAS DE SEGMENTACIÓN DE IMÁGENES 32
realizar ese proceso. Veronin adopta estas técnicas para segmentar imágenes ópticas [Veronin
92], donde utiliza discriminación de texturas y emplea filtros específicos como la principal
componente acoplada con la red neural para conseguir la segmentación. Sundaramoorthy usa
características espaciales basadas en forma para segmentar imágenes médicas usando redes
neurales [Sundaramoorthy 93]. El método de segmentación que se va a describir aquí consta de
dos pasos importantes, extracción de características y posteriormente el uso de las redes
neurales para realizar la segmentación a partir del análisis de las características extraídas en el
paso previo.
Extracción de atributos. En este paso se decide que tipo de entradas va a tener el algoritmo de
segmentación. La correcta selección de las características puede reducir la complejidad
computacional, o bien mejorar la efectividad del método de segmentación. Un procedimiento
para la extracción de atributos [Sundaramoorthy 93], se puede implantar con un algoritmo que
inicialmente genera vectores n-dimensionales llamados vectores de forma (VF). Por cada pixel,
el correspondiente VF caracteriza la distancia desde ese pixel al borde del objeto que contiene
al pixel en cada una de las n direcciones. Los VF están determinados por:
uF (·) = Distancia del borde del objeto en direccion i al pixel (k,l) . = 0
_1 V ' k [ l ¡-;-;:---;:; ' l • • • • Jl
' -vM·N Ec. 2.4
donde M x N son las dimensiones de la imagen I(x,y), (k,l) es la posición del pixel a caracterizar
en la imagen.
Los bordes son determinados por una correcta selección de un umbral, logrando de esa
forma una aproximación al objeto deseado. En objetos que presentan bordes relativamente
suaves, los VF de los pixeles tienden a formar un grupo en el espacio n-dimensional de
características. Si objetos con diferentes formas, forman un grupo en el espacio n-dimensional,
un clasificador basado en redes neurales podría realizar la segmentación del objeto deseado.
Segmentación usando una red neural artificial. El algoritmo de VF produce espacios de
características con grupos de contornos altamente no lineales. Una red neural artificial puede
ser utilizada para segmentar los espacios de características [Sundaramoorthy 93], esta red es un
TÉCNICAS DE SEGMENTACIÓN DE IMÁGENES 33
perceptron de tres capas con algoritmo de entrenamiento supervisado de propagación hacia
atrás. El proceso para el entrenamiento es descrito a continuación:
Entradas a la red:
i. l¡n(x,y), imagen de entrada.
ü. Ia(x,y), imagen ideal.
iü. T1 y Th, mínimo y máximo valor umbral usado para definir los bordes de los objetos.
Algoritmo
i. Inicializar la red con pesos aleatorios.
ü. Probar que ln(x,y) se encuentre entre los límites de T1 y Th. Si es verdad, calcular el VF para
(x,y).
iü. Introducir los VF a la red y calcular su salida.
iv. Comparar la salida obtenida con la salida deseada la(x,y) y ajustar los pesos.
v. Repetir a partir del paso ii para todos los pixeles (x,y).
vi. Calcular los mapas de clasificación de error usando la salida actual y la deseada.
Los mapas de clasificación de error ayudan en la evaluación del comportamiento de red
neural, sin embargo el comportamiento de la misma depende de otros factores tales como, la
posibilidad de que el algoritmo sea influenciado por mínimos locales debido a que la red es
entrenada por un algoritmo de propagación hacia atrás. También si el conjunto de
entrenamiento es muy grande, la contribución de características individuales en el proceso de
aprendizaje global puede ser afectado con cada iteración, perdiéndose información ganada en
otra región de la imagen.
El algoritmo utilizado para la extracción de características, junto con la red neural ya
entrenada, forman un sistema de detección automática de contornos, que recibe como entrada
una imagen, a la cual se le extraen ciertos atributos que van a ser utilizados por un clasificador
para generar la imagen segmentada.
Las redes neurales, han permitido desarrollar sistemas para la segmentación automática
de imágenes, adicionalmente este tipo de técnicas permite integrar a los sistemas de detección
TÉCNICAS DE SEGMENTACIÓN DE IMÁGENES 34
otras técnicas utilizadas en el estudio de los problemas de visión por computadora, tales como,
segmentación basada en agrupamiento de regiones y operaciones morfológicas.
2.4 SEGMENTACION BASADA EN TECNICAS DE ALTO NIVEL
Los sistemas basados en conocimiento constituyen el soporte de los métodos de
segmentación de alto nivel, ellos permiten realizar un control estratégico que supervisa todas
las componentes de ese proceso, generando interpretaciones directas del mismo. El interés por
la incorporación de conocimiento en los sistemas de interpretación de imágenes médicas, tiene
su origen en la dificultad inherente al procesamiento informático de este tipo de imágenes
[Windyga 95]. Típicamente, las imágenes médicas presentan una gran complejidad (diversidad
de informaciones presentes) y variabilidad (las estructuras observadas son flexibles y
deformables), además estás poseen un alto nivel de ruido estructural (estructuras que no son las
de interés) y no estructural (inhomogeneidad de intensidad, solapamiento de estructuras). Con
frecuencia la calidad de las imágenes, en términos de contraste, está muy por debajo del nivel
deseado. Modelos basados en sistemas expertos, y métodos basados en pirámides constituyen
algunos de los métodos de segmentación de alto nivel. Por otra parte, las estructuras de datos de
alto nivel formadas por los métodos de segmentación de nivel medio pueden ser usados en la
tarea de análisis, interpretación y clasificación de formas.
2.4.1 Segmentación piramidal
Una pirámide, es en general una estructura que representa copias de la imagen en
múltiples resoluciones. La estructura de datos piramidal de una imagen, involucra la búsqueda
de objetos en baja resolución, para luego refinar las áreas de interés al incrementar la
resolución, hasta que sea alcanzada la resolución máxima de interés. Los métodos piramidales
han tenido varios campos de aplicación. La segmentación de imágenes es una área donde estos
métodos han encontrado una gran aplicación. Uno de los problemas asociados con este tipo de
enfoque, se debe a la descomposición de la imagen en varias subimágenes, lo cual permite
detectar fácilmente ciertas imágenes y excluir otras de ellas. Bister prueba que usando métodos
TÉCNICAS DE SEGMENTACIÓN DE IMÁGENES 35
piramidales no es posible detectar objetos largos muy delgados [Bister 90]. Por otra parte,
formas compactas pueden ser delineadas correctamente usando este método [Rosenfeld 90]. El
enfoque establecido por Merr ataca este problema con ayuda de la teoría de grafos [Merr 89],
allí la imagen es transformada a un grafo donde los vértices corresponden a los pixeles, donde
algunos son enlazados por relaciones de vecindad. La pirámide es construida por reducción
iterativa del grafo en subgrafos. El proceso de reducción del grafo se realiza al aplicar un
proceso estocástico. Su eficiencia es lograda solamente si la forma de las regiones de la imagen
están correctamente delineadas, independientemente de la realización de la pirámide. Una
pirámide estocástica óptima ha sido propuesta por Mathieu, donde se aplica este concepto para
segmentar imágenes de resonancia magnética del corazón [Mathieu 92].
2.4.2 Enfoques basados en sistemas expertos
Los sistemas expertos imitan los procesos de razonamiento de un experto, dividiendo la
imagen médica en entidades semánticamente significativas. Las entidades pueden ser
relacionadas a procesos biomédicos fundamentales, tanto en salud como en enfermedad. Este
tipo de sistemas ha sido utilizado por Chen para segmentar imágenes tomográficas del cerebro
[Chen 89]. Raya ha usado este método para la segmentación imágenes multidimensionales
[Raya 89]. Botto ha usado métodos de segmentación basado en sistemas expertos, para la
extracción de estructuras biomédicas de imágenes de microscopio [Botto 89].
2.4.3 Detector de concavidad y herramientas de análisis de forma
Las estructuras de datos consideradas en el procesamiento de nivel medio, pueden ser
usados en la tarea de análisis, interpretación y clasificación de formas. Los métodos de
procesamiento de alto nivel están formados por herramientas de análisis de formas y tamaños, y
herramientas de prueba de concavidad. Estas herramientas contienen información de la forma y
el tamaño de objetos comunes en 2D y 3D; información que es usada para detectar objetos
irregulares. El análisis de forma busca los ejes mayores y menores de cada objeto, y el análisis
de tamaño del objeto en 2D, o el volumen del objeto en 3D. Otras herramientas de interés
encuentran el centro de gravedad de estructuras individuales, con lo cual se reduce la cantidad
TÉCNICAS DE SEGMENTACIÓN DE IMÁGENES 36
de datos a procesar y desplegar. Un análisis de tal naturaleza, se utiliza para clasificación de
células en imágenes de microscopía.
2.5 CONCLUSIONES
En este capitulo, se ha revisado un conjunto de técnicas de segmentación de imágenes
biomédicas. En esta revisión, se ha clasificado el problema de segmentación en varias
categorías, y se han tratado algunos métodos asociados a cada categoría. El objetivo de ello, es
mostrar una revisión global, y presentar al lector un conjunto de posibles enfoques que ha
adoptado la segmentación de imágenes como tarea a resolver, en los problemas de Visión por
Computadora. La revisión que se ha realizado, permite focalizar los aspectos teóricos y
prácticos de estas técnicas, logrando así, asentar bases que permitan la comparación de las
técnicas mencionadas con aquellas que están basadas en Modelos Deformables. En tal sentido,
en el presente trabajo, y específicamente en los capítulos siguientes, se estudian de forma
detallada los modelos deformables como herramienta para la segmentación de imágenes
biplanas del ventrículo izquierdo.
CAPÍTUL03
FUNDAMENTOS DE LOS
MODELOS DEFORMABLES
3.1 INTRODUCCIÓN
Los Modelos Deformables son modelos físicos de objetos que se deforman bajo las
leyes de la mecánica de Newton, en particular, por la teoría de elasticidad expresada en la
dinámica de Lagrange [Radeva 95]. Estos modelos son modelos activos que representan una
poderosa herramienta que trata físicamente a los objetos presentes en una imagen. El objetivo
de este capitulo es mostrar los modelos deformables como una técnica apropiada para la
solución de distintos problemas en Visión por Computadora. Para ello se realiza una revisión
teórica de los principales trabajos que en los últimos cinco años se han venido desarrollando,
logrando así focalizar los aspectos teóricos y prácticos de dichos modelos, esto permitirá
obtener una visión global de esta poderosa herramienta la cual ha sido usada como técnica para
la representación, reconstrucción, reconocimiento y manipulación de curvas no rígidas,
superficies y sólidos, presentes en imágenes y en secuencias de imágenes [Terzopoulos 88]. El
uso de los modelos deformables en el análisis de imágenes médicas se ha incrementado
considerablemente, debido a que una característica fundamental de los tejidos en el cuerpo
humano o en otra estructura biológica corresponde a objetos no rígidos. Los contornos
deformables han sido usados para la segmentación, visualización, seguimiento y cuantificación
de órganos tales como corazón, cerebro, pulmón, hígado, vasos sanguíneos, en modalidades
imagenológicas como rayos X, tomografia computarizada, angiografia, resonancia magnética y
FUNDAMENTOS DE LOS MODELOS DEFORMARLES 38
ultrasonido [Singh 98]. De allí entonces la importancia de obtener una visión global de la
técnica de tratamiento de imágenes.
3.2 MODELOS DEFORMARLES SEGÚN DEMETRI TERZOPOULOS
[Kass 87]
Un "Snake" o modelo deformable, es un spline de energía minimizante guiado por
fuerzas de restricción externa e influenciado por fuerzas de imagen, que lo halan hacia
características como líneas y contornos. Los "snakes" son modelos de contornos activos: ellos
convergen a los contornos de los objetos en la imagen, localizándolos con exactitud. Los
"snakes" son utilizados en un gran número de problemas de visualización, incluyendo detección
de contornos, líneas y contornos subjetivos. La idea fundamental acá es la de utilizar los
"snakes" de forma interactiva, en la cual el usuario impone fuerzas de restricción, las cuales
guían al "snake" hacia las características de interés [Kass 87].
3.2.1 Definición de snake
Un "snake" es un spline de continuidad controlada, bajo la influencia de fuerzas de
imagen y de fuerzas de restricción externas. Las fuerzas internas del spline imponen la
restricción de suavidad. Las fuerzas de imagen empujan al "snake" hacia características de la
imagen como líneas, contornos y contornos subjetivos. Las fuerzas de restricción externas son
responsables de halar el "snake" hacia un determinado mínimo local.
Un "snake" s puede representarse en forma paramétrica como:
v(s) = (x(s),y(s)) Ec. 3.1.
donde v(s), es el vector que contiene a las coordenadas (x, y) de un determinado snake. Este
tipo de representación permite establecer que el funcional de energía de este modelo, puede ser
escrito como:
FUNDAMENTOS DE LOS MODELOS DEFORMARLES 40
donde es colocada; mientras que el término de segundo orden se encarga de que el mismo se
comporte como una placa delgada [Malverm 69], es decir, que bajo cualquier esfuerzo que le
sea aplicado, nunca se alcance su punto de ruptura. De allí, que realizando un ajuste de las
funciones de peso a.(s) y ~(s), que representan en la mecánica de sólidos los coeficientes de
elasticidad y rigidez de un medio continuo, se puede controlar la importancia de los términos de
membrana y de placa delgada, es decir, matemáticamente estos pesos controlan la curvatura y
la suavidad que el spline puede adoptar. Si la función de peso ~(s) se coloca a cero en un punto,
se presentará en ese punto una discontinuidad de segundo orden, lo que permitirá generar una
esquina en el snake.
Los spline de continuidad controlada son una generalización de un estabilizador de
Tikhonov [Tikhonov 63] y puede ser formalmente tratado como un problema de regularización
[Poggio 85], donde la idea básica, es la de restringir el espacio de soluciones aceptables, con
ayuda de la escogencia de una función que minimice un funcional apropiado. La escogencia del
funcional está impuesta por consideraciones matemáticas, y lo más importante, por un análisis
físico de las restricciones genéricas del problema [Bertero 87].
3.2.3 Energía de restricción (Econ)
Este tipo de energía debe ser adicionada al "snake" de forma interactiva. Con ayuda del
ratón el usuario puede defmir dos tipos de fuerzas externas:
i. Resortes: se pueden establecer resortes entre puntos, el punto inicial de colocación debe ser
un punto sobre el snake, y el punto fmal se puede colocar sobre el modelo o en una posición
fija fuera de él. Lo que simplemente se está haciendo al establecer un resorte, es fijar una
energía externa de la forma -k(x¡ - x2/, que hala el "snake" hacia el punto final de
colocación, en la figura 3.2, se muestra su aplicación.
ü. Fuerzas de repulsión: son de la forma 11?, donde res la distancia de colocación de la fuerza
con respecto al snake. Este tipo de energía es descrita en el modelo por un volcán, figura 3.2,
el cual se encarga de empujar el "snake" fuera de un mínimo, para de esta forma forzarlo a
que vaya a algún otro mínimo.
FUNDAMENTOS DE LOS MODELOS DEFORMARLES
/ (
Fig. 3.2. Un "snake" representado en color negro, es influenciado
por resortes (amarillo) y por un volcán (azul).
3.2.4 Fuerzas de Imagen
41
Para que este tipo de modelo sea aplicable en los problemas de visión por computadora,
es necesario adicionarle funcionales de energía que lo atraigan hacia características esenciales
de las imágenes. Entre las características más importantes de una imagen se encuentran, las
líneas, los contornos y los puntos en los cuales empieza y fmaliza un contorno abierto
(terminaciones). De allí, que la energía de imagen total pueda ser expresada, como la suma
pesada de tres (3) funcionales de energía, de la forma:
E image = (1) fine E fine + (1) edge E edge + (1) tenn E tenn Ec. 3.4.
donde el ajuste de los pesos permite generar un "snake" de amplio rango de comportamiento,
es decir que los factores de peso, determinaran el comportamiento del modelo, como se explica
a continuación.
Funcional de Línea. El funcional de línea se puede expresar simplemente, como la intensidad
(I) de la imagen en el punto (x,y), entonces:
E fine = I(x, Y) Ec. 3.5.
FUNDAMENTOS DE LOS MODELOS DEFORMARLES 42
Con ayuda de este funcional y dependiendo del signo asignado al factor de peso últine, el
modelo será atraído cerca de las líneas claras, o hacia las líneas oscuras. Esto permitirá que el
"snake" trate de alinearse a las vecindades claras u oscuras del contorno.
Funcional de Contorno. Un funcional de contorno puede ser simplemente expresado como:
Eedge = -IVI(x,y f Ec. 3.6.
donde VI(x,y) represente el gradiente de los niveles de gris de la imagen l.
Este funcional va a permitir que el "snake" sea atraído a contornos con gradientes
pronunciados. Otro tipo de funcional pudiera ser, aquel basado en la teoría de detección de
contornos de Marr - Hildreth [Marr 80], donde se propone que los cambios en las intensidades
de una determinada imagen, pueden ser detectados encontrando los ceros de Ga(x,y)*I(x,y),
para una imagen 1 y donde G(x,y) es una distribución Gaussiana de dos dimensiones de
desviación estándar a: Bajo esta teoría, los cambios en las intensidades pueden ser detectadas
convolucionando la imagen con un operador DoG (derivada de la función gausiana) [Brend 93],
lo cual generaría una imagen de salida, a la cual habría que buscarle sus cruces por cero. Este
análisis involucra la selección de la dirección a la cual debe ser asociada la segunda derivada.
Esta dirección debe coincidir con la orientación formada localmente por sus cruces por cero,
siempre que se cumpla la condición de variación lineal, la cual establece que la variación de la
intensidad cerca y paralela a la línea de cruce por cero debe ser locahriente lineal; de allí que el
funcional de contorno este representado por:
Ec.3.7.
Funcional de Terminaciones. Este funcional se utiliza para encontrar terminaciones de
segmentos de líneas y esquinas. Para defmir tal funcional, se utilizan los niveles de curvatura de
las líneas de una imagen ligeramente suavizada. Sea:
FUNDAMENTOS DE LOS MODELOS DEFORMARLES 43
C(x,y)= Ga(x,y)* I(x,y) Ec. 3.8.
la versión suavizada de la imagen, y sea:
Ec.3.9.
el ángulo del gradiente, donde Cx y Cy representan las primeras derivadas de la imagen
suavizada en las direcciones x e y respectivamente, y sea o = ( cos B, sin 8) y 0.1 = (-sin B, e os
8), los vectores unitarios a lo largo y perpendicular al gradiente. Entonces la curvatura de
C(x,y), que representa la funcional de terminaciones, puede ser escrita como:
Ec. 3.10.
3.2.5 Consideraciones Numéricas del Método propuesto
De acuerdo con el cálculo variacional [Mikhlin 64][Washizu 68], el contorno v(s) que
minimiza el funcional de energía, ecuación 3.2, debe satisfacer la ecuación de Euler- Lagrange,
la cual se puede expresar como un sistema de dos (2) ecuaciones diferenciales independientes
[Kass 87].
8Eex1 ax +r.tx +--=0 SS tJ S.'iSS a:x
Ec. 3.11. 8Eext
CX.Yss + PYssss +~=O
FUNDAMENTOS DE LOS MODELOS DEFORMARLES 44
donde los subíndices en x e y denotan derivadas (Xss, segunda derivada y Xssss, cuarta derivada);
y Eext = Eimage + Econ· La discretización de ecuación 3.11, permitirá obtener una solución
numérica del método, se utiliza para ello el Método de las Diferencias Finitas para la
aproximación de las derivadas. Si los puntos del modelo se encuentran igualmente espaciados,
la discretización por el método antes señalado permitirá obtener errores de truncamiento igual a
cero. Si a y J3 no son constantes y si los puntos no se encuentran igualmente espaciados, el
sistema lineal generado será mucho más complejo para su implantación.
Se considera el caso en que a y J3 varían, pero los puntos del spline se encuentran
igualmente espaciados, siendo el contorno a analizar cerrado, es decir, v(O) = v(n). La ecuación
3.11, de forma más general podría escribirse como:
a(s)v SS+ p(s )vSSSS +o:~~ =o Ec. 3.12.
a2<I> a (B<I>) Discretización del Primer Término de la ecuación 3.12. Recordando que 8x2 = 8x 8x ,
entonces se puede escribir a(s)vss = (a(s)vs)s. Si la derivada primera interna es aproximada por
diferencias hacia atrás en el punto i (ver Apéndice), se tendrá:
Ec. 3.13.
Para poder obtener la discretización del primer término, es necesario calcular la primera
derivada de la ecuación 3.13, para ello se sugiere utilizar una aproximación por diferencias
hacia adelante en el i.
Ec. 3.14.
Discretización del Segundo Término de la ecuación 3.12. De la misma forma que para el
. , . d 1. 1 . . . . fl<I> a ( a (a2<I>J) primer termmo, se pue e rea ¡zar a stgmente constderactón: ax4 = ax ax ax2 ' donde la
FUNDAMENTOS DE LOS MODELOS DEFORMARLES 45
derivada segunda es aproximada por diferencias centrales alrededor del punto i, las derivadas
primeras se aproximan por diferencias hacia atrás y hacia adelante respectivamente.
fJ(s )v .... = j3,. (vi-l - 2v,. + v,.+J
(p(s )v ss )s = f3i+l (v; - 2vi+I + vi+2 )- f3; (v,._¡ - 2v; + vi+l)
((fJ(s )v s.JJ. = j31+1 (v1 - 2v1+1 + v,.+2 )- j31 (v,._1 - 2v,. + v,.+1 )
- f31(vH -2v,. +v1+¡}+ j3,._1(v,._2 -2v,._1 +v,.)
Obteniendo finalmente:
Ec. 3.15.
Discretización del Tercer Término de la ecuación 3.12. Dependiendo del tipo de funcionales
de energía externa a utilizar, simplemente lo que debe realizarse es una aproximación por
diferencias fmitas de las derivadas de dichos funcionales, cada una de las derivadas generadas,
van a representar las fuerzas externas aplicadas al modelo, de allí que:
Ec. 3.17.
La formulación discreta de las ecuaciones de Eul.er (ecuación 3.11 ), vendrá dada
entonces en forma matricial por:
Ax + fx(x,y)= O
Ay+fy(x,y)=O Ec. 3.18.
donde los vectores x e y, representan la posición de un determinado punto del "snake" en el
plano imagen.
FUNDAMENTOS DE LOS MODELOS DEFORMABLES 46
La matriz A, constituye la matriz principal de un sistema lineal, y representa la matriz de
deformaciones del modelo [Brend 93]. El sistema presenta como vector forzante o término no
homogéneo los vectores f. Los coeficientes de las ecuaciones 3.14 y 3.16, se encuentran
agrupados en A, de allí que la misma debe ser una matriz de banda, con ancho de banda igual a
5 (matriz pentadiagonal), esto permite que los algoritmos de descomposición se simplifiquen
considerablemente [Burden 98], ya que una gran cantidad de ceros aparecen en dichas matrices.
Debido a que el modelo de contorno propuesto es un modelo activo, el mismo debe estar
sujeto a cambios para lograr una efectiva minimización de los funcionales de energía, es decir,
que los términos de la formulación discreta propuesta deben variar de un instante de tiempo t0
al instante t¡. Al darle solución al sistema lineal de la ecuación 3.18, se obtienen los vectores de
posición del "snake" en un instante determinado que satisfacen dicha ecuación. Si ahora se
quiere obtener el comportamiento dinámico del modelo, se debe calcular en este sistema lineal
los vectores de posición en un instante t, como función de los vectores posición en el instante t-
1, es decir, las fuerzas deben ser función de esos vectores en t - 1, y la ecuación debe
satisfacerse cuando los vectores en t y t -1 sean iguales; en tal sentido, la ecuación 3.18 debe
reformularse encontrando que:
Ax, +fx(x,_1,y,_1)= -y(x, -x,_J Ay, +fy(xt-l,y,_1)= -y(y, -y,_1)
Ec. 3.19.
donde y representa el tamaño de paso que define la discretización en el tiempo. Una razón de
convergencia para el método podría establecerse cuando x1 ---¿. x1_1, y esto se podría lograr,
estimando la norma 11 x1 - x,_, ll2· Existen diversos métodos que pueden ser utilizados para
resolver la ecuación 3.19. Se propone resolver este sistema por algoritmos de descomposición
LU [Burden 98].
Los modelos de contorno activo, permiten unificar la forma de atacar una gran colección
de problemas en visión por computadora que han sido tratados de diferentes formas. Contornos,
líneas y contornos subjetivos pueden ser encontrados utilizando esencialmente el mismo
FUNDAMENTOS DE LOS MODELOS DEFORMABLES 47
mecanismo. Adicionalmente, permiten la incorporación de conocimiento a priori, de manera
interactiva, ya que al modelo se le puede incorporar fuerzas de restricciones externas.
Los spline de energía minimizante, han sido utilizados en procesos de extracción de
objetos en imágenes sintéticas, puesta en correspondencia en imagenología estéreo, y
seguimiento del movimiento [Kass 87]. Además, ha permitido obtener resultados exitosos al
segmentar huesos de las manos en imágenes de rayos X [Radeva 95a]. Este tipo de modelos ha
sido aceptado como técnica estándar para segmentar diferentes características en imágenes
faciales [Radeva 95b]. Uno de los inconvenientes del modelo de Terzopoulos, es que el mismo
puede oscilar entre dos mínimos locales, entrando en estados de inestabilidad, ubicando los
elementos del spline sobre puntos de la imagen que no corresponden al mínimo local deseado,
esto se debe a que estos modelos deben ser inicializados muy cerca del contorno deseado, ya
que el proceso de deformación dinámica depende esencialmente de la fuerza de imagen
impuestas al mismo (ecuación 3.4), por ejemplo si los puntos del modelo inicial se ubican en
regiones de la imagen donde se presenten valores muy grandes del gradiente de los niveles de
gris, los mismos pueden ser alejados considerablemente del contorno deseado, o si por el
contrario, los puntos se ubican en regiones con valores de grises constantes la influencia del
funcional de contorno será nula, no lográndose la convergencia del mismo al contorno deseado.
Por otro lado, si no existe un control adecuado del proceso de deformación en el tiempo, todos
los puntos de control del "snake" pueden converger a un mismo punto, lo cual corresponde a un
problema de contracción total del modelo.
3.3 MODELOS DEFORMARLES SEGÚN DAVID YOUNG [Young 95a]
Uno de los aspectos más importantes en la Visión por Computadora, es el
reconocimiento de objetos de una escena en particular. El reconocimiento de objetos se basa en
técnicas de representación de formas, las cuales deben cumplir con tres propiedades básicas: ser
lo suficientemente generales para poder describir un amplio rango de formas, permitir al mismo
tiempo la extracción del objeto de la escena que lo contiene, y por último, facilitar la
comparación con formas similares.
FUNDAMENTOS DE LOS MODELOS DEFORMARLES 48
Se debe tratar de encontrar los modelos de formas tanto en 2D como en 3D. La
aproximación jerárquica de Marr, basada en cilindros generalizados, constituye uno de los
modelos más utilizados para el modelado de formas en 3D [Marr 82]. En el trabajo de Young
[Young 95b], se realiza una revisión de los modelos usados para la representación de formas
bidimensionales. Una de las técnicas más utilizadas para la representación de formas 2D, se
basa en realizar la detección de contornos, considerando por ejemplo los modelos de contorno
activos o modelos deformables ("snake"). Tal procedimiento permite establecer un conjunto de
condiciones (que debe cumplir el detector de formas), para encontrar las estructuras presentes
en una imagen en base a tal modelaje.
3.3.1 Definición de un snake
De acuerdo a Young [Young 95b]; un modelo de contorno activo, constituye un
conjunto de puntos de control conectados por líneas. Cada punto de control, tiene una posición
representada por coordenadas (x,y) del plano imagen, por lo tanto un "snake" se especifica
completamente por la cantidad de puntos de control y las coordenadas de los mismos. Al mover
dichos puntos se realizan ajustes en el snake, para de esa manera definir la forma del objeto que
se quiere extraer.
3.3.2 Propiedades de un snake. Funciones de energía y fuerzas
Los "snake" permiten un amplio rango de propiedades, donde cada una de las mismas
debe ser establecidas por una función de energía. De allí, que la idea fundamental es la de
realizar una reducción de la energía establecida en el "snake". Por lo tanto para que el modelo
involucre una propiedad en particular, se le debe especificar una función de energía apropiada.
La función de energía de un "snake" se divide en, energía interna y energía externa:
Esnake = Einterna +E externa Ec. 3.20.
FUNDAMENTOS DE LOS MODELOS DEFORMARLES 49
La energía interna depende de las propiedades intrínsecas del "snake", como la longitud
y curvatura, mientras que la energía externa depende de la estructura de la imagen, y de
restricciones particulares impuestas por el usuario.
Energía Elástica. Si se toma como energía interna una función que describa el comportamiento
de una banda elástica o membrana, se le está adicionando al "snake" la propiedad de
contracción. Una función de energía elástica, puede defmirse como aquella tal que, su valor se
incremente con respecto a la longitud del snake, obteniendo un mejor comportamiento del
modelo, si los puntos de control se encuentran igualmente espaciados. Una forma conveniente
para una función de energía, la cual le dará la propiedad de contracción al snake, es la suma de
los cuadrados de las distancias entre los puntos de control adyacentes. Esta forma de energía,
hace que los puntos de control se encuentren conectados por un resorte, lo cual indica que la
misma puede ser modelada por la Ley de Hooke, entonces se puede escribir:
N
Eelastica = K 1L(distancia entre puntos adyacentesY i=l
Ec. 3.21.
donde N representa el número de puntos de control, K 1 es una constante arbitraria, y la distancia
entre puntos adyacentes esta dada por la fórmula de Pitágoras. Si (x;,y;) representan las
coordenadas del punto de control i y (x;_ 1,y;_1) un punto de control adyacente, entonces el
cuadrado de las distancias fi vendrá dado por:
Ec. 3.22.
La fuerza que se encarga de cargar de energía al "snake" en un punto de control i, tiene
las siguientes componentes:
Felastica_x = 2Kl [(xi-1- X¡}+ (xi+l -X¡}] Fe/astica_y = 2KI[(Yi-l- Yi) + (yi+l- Yi )]
Ec. 3.23.
FUNDAMENTOS DE LOS MODELOS DEFORMARLES 50
La evolución temporal del modelo debido a las variaciones de energía elástica, se realiza
al actualizar cada una de las coordenadas de los puntos de control:
xi,t-1 + K2Fetasuca_x -)o X;,,
Yi,t-1 + K2Fe/aslica_y -)o Yi,l
Ec. 3.24.
donde K2 es otra constante arbitraria. La evolución de la ubicación de los puntos, es controlado
además por una constante a que es igual2K1K2, la cual debe tener un valor comprendido entre
o y l.
Energía de Curvatura. Este tipo de energía es utilizada como parte de la energía interna, de un
"snake" cuyo comportamiento sea el de una placa delgada. De allí, que la solución del modelo
presenta curvas bastante suaves. Y oung en su trabajo, no presenta una expresión detallada de
esta función de energía, pero él indica que la misma se expresa como la suma de las curvaturas
del "snake" al cuadrado medidas en cada punto de control, el ángulo formado entre los vecinos
más cercanos a un punto de control, impone un nivel de curvatura muy grande. La energía de
curvatura es traduce en fuerza de curvatura (Fcurvatura), la cual depende de los cuatro vecinos
más cercanos al punto de control donde es aplicada la fuerza, dicha fuerza hace que el "snake"
se estire hasta que se alcance el mínimo de energía que la genera. Al igual que los puntos en la
energía elástica, la suavidad del modelo es controlada por una constante, llamada p, la cual se
encarga de establecer el efecto de la energía de curvatura (comportamiento de membrana). En
el modelo de contorno activo propuesto por Y oung, la energía interna está dada por la suma de
la energía elástica y de la energía de curvatura, donde la contribución de cada una de ellas, es
controlada por las constantes a y p.
Energía de Gradiente de Imagen. La energía de imagen está determinada por las propiedades
de la escena, y constituye el término de energía externa del modelo. Si se quiere que el "snake"
tienda a cierta región de la imagen donde existan, estructuras brillantes u opacas, entonces la
función de energía debe ser el mínimo de la suma de los niveles de gris de los pixeles bajo el
snake. Al ser negativo el valor mínimo de esta función de energía, el "snake" tenderá hacia la
región brillante de la imagen, mientras que al ser positivo tenderá hacia las regiones oscuras.
FUNDAMENTOS DE LOS MODELOS DEFORMARLES
N
Eimagen = -K3 Limagen(x;,y;) i=l
51
Ec. 3.25.
donde imagen(x;,yJ representa el nivel de gris en la coordenada (x;,yJ de la imagen, y K3 es una
constante arbitraria. La fuerza que se encarga de generar la energía de imagen se encuentra en
la dirección del gradiente de los niveles de gris.
F,magen_x,; = ~3 (imagen(x; + l,y;}- imagen(x; -l,y; ))
F;magen_r,; = ~3 (imagen(x; ,y;+ 1)- imagen(x; ,y¡ -1))
Ec. 3.26.
El movimiento del modelo debido a las fuerzas externas, está determinado por una
constante de contro lllamada y.
3.3.3 Combinación de funciones de energía
El modelo de contorno activo propuesto para el análisis de imágenes, intenta minimizar
su energía total, la cual es la suma de la energía interna y externa. Cuando éstos funcionales de
energías son adicionados al modelo, su fuerza asociada es adicionada también. Es decir, si se
controlan las fuerzas asociadas al modelo, se estará intentando minimizar la energía total del
mismo. En las secciones anteriores, se mostró que las fuerzas presentes en el modelo, están
básicamente controladas por los valores de las constantes a, ~y y. La escogencia de los valores
de esos parámetros es empírica. Y oung en su trabajo, establece de forma Eurística rangos de
variación de esas tres constantes, los cuales se muestran en la tabla 3.1.
Tabla 3.1. Rangos de a, ~ y y.
a
0-1 o- 0.1
FUNDAMENTOS DE LOS MODELOS DEFORMARLES 52
Colocar al modelo valores de esas constantes fuera del rango establecido por Y oung,
ocasionará inestabilidad del mismo, permitiendo que los puntos de control asuman valores
mayores a las dimensiones de la imagen. La evolución temporal del modelo está representada
entonces por la siguiente ecuación:
x,,,_l + K2Felaslica_x + ~Fcurvatura_x + 2-yF¡magen_xi ~ x1,t
Yi,t-1 + K2Felastica_y + ~Fcurvatura_y + 2-yF'¡magen_yi ~ Yi,t
3.3.5 Inicialización de un snake
Ec. 3.27
La mayoría de los estudios de contornos activos, defmen como "snake" inicial aquel que
ha sido generado en forma interactiva por el usuario. A continuación se mencionan algunas
alternativas para la defmición del contorno activo inicial:
i. Técnicas convencionales de detección de contornos, pueden ser usadas para encontrar alguna
estructura que inicialice al "snake".
u. La transforma de Hough u otras técnicas de reconocimiento de formas pueden generar los
puntos iniciales.
iii. Grupos de segmentos de líneas, texturas inusuales, o color pueden ser usados.
El modelo propuesto por Y oung, es una simplificación del modelo propuesto por
Terzopoulos. El modelo permite segmentar imágenes sintéticas de forma precisa a un muy bajo
costo computacional. Es aplicable solo para la extracción de objetos con contornos cerrados. El
modelo está enfocado hacia las leyes de la mecánica de sólidos, no necesita un tratamiento
matemático formal. Las ecuaciones que rigen el comportamiento dinámico del mismo, son
ecuaciones algebraicas simples, de allí que se evita resolución de sistemas lineales, y por lo
tanto no hay la necesidad de utilizar algoritmos de descomposición, tales como los reseñados en
el trabajo de Terzopoulos. Este modelo, no da ninguna contribución importante al desarrollo de
las técnicas de segmentación de imágenes basadas en contornos deformables. Adicionalmente,
no permite incorporar conocimiento a priori, debido a que en su implantación, no se toma en
cuenta las fuerzas de restricción externas propuestas por Terzopoulos. Como fuerza externa,
solamente se utiliza el gradiente de los niveles de gris, lo cual puede causar que el modelo
FUNDAMENTOS DE LOS MODELOS DEFORMARLES 53
presente severas oscilaciones en su comportamiento dinámico, al momento de encontrar
gradientes muy pronunciados. La F;mage al no ser calculada sobre una imagen debidamente
preprocesada [Kass 97], tiende a ser el término dominante de la ecuación 3.27, de allí que el
proceso de deformación es impuesto por él. Para módulos del gradiente grandes, el modelo
entonces, trataría de ir a regiones de la imagen bastante alejadas del contorno deseado.
3.4 MODELOS DEFORMABLES SEGÚN STEVEN LOBREGT [Lobregt 95]
La estructura de los modelos dinámicos discretos para la definición de contornos es un
conjunto de vértices conectados. Con un mínimo de interacción, un modelo inicial de contorno
puede ser defmido, el cual es automáticamente modificado (deformado) por un proceso de
minimización de energía. La energía interna del modelo depende de la curvatura local del
contorno, mientras que la energía externa es derivada de las características de la imagen. El
proceso de deformación se detiene cuando un mínimo local de la función de energía es
encontrado. La forma fmal del modelo es una aproximación reproducible del contorno deseado.
En el trabajo de Lobregt, se corrigen algunos problemas comunes de los modelos de contornos
activos (snakes) propuestos por Terzopoulos [Kass 87], tales como la convergencia a un mismo
punto, de todos los puntos de control del modelo.
3.4.1 Estructura básica del modelo
Un modelo dinámico discreto consiste en un conjunto de vértices conectados por
segmentos de líneas o contornos. La posición de un vértice v; está representada por un vector p;
(medido desde el centro de gravedad del modelo), y el contorno entre v; y V;+J por un vector d;
como se muestra en la figura 3.3.
El proceso de deformación es originado por las fuerzas aplicadas sobre cada uno de los
vértices. Este es un proceso dinámico, por lo tanto deben existir vectores de velocidad (u;) y
aceleración (a;) asociados al vértice V;. La longitud d; de un segmento de línea, representa la
FUNDAMENTOS DE LOS MODELOS DEFORMARLES 54
resolución local del modelo, por lo tanto la misma debe tratar de mantenerse dentro de un
límite, es decir, se debe tratar de que los vértices del modelo estén igualmente espaciados.
3¡
Fig. 3.3. Estructura básica del modelo.
3.4.2 Fuerzas y Campos de fuerzas
Fuerzas Internas. Las fuerzas internas defmidas para el modelo, están relacionadas con la
curvatura local del contorno, de acuerdo con los modelos de contornos activos. El hecho de
introducir al modelo fuerzas internas tiene como principal objetivo la minimizacion de la
curvatura local. La curvatura local, sobre los segmentos de líneas o contornos que unen a dos
vértices es igual a cero, no cumpliéndose lo mismo en la posición que ocupan los vértices, ya
que allí se presenta una discontinuidad de primer orden. Lobregt [Lobregt 95] define como
curvatura local en un vértice, a la diferencia entre las direcciones de los dos segmentos de
contorno que se unen en ese vértice. El segmento de contorno asociado al vértice v; está
representado por el vector d;, donde su dirección está descrita por el vector unitario d; .
Entonces de acuerdo a lo expuesto por Lobregt, el vector curvatura local c; asociado al vértice
v;, se puede escribir como:
Ec. 3.28.
La curvatura local en la unión de dos segmentos de contorno, mide el ángulo formado
entre los dos segmentos, además la longitud del vector e; depende solamente de este ángulo, ya
FUNDAMENTOS DE LOS MODELOS DEFORMARLES 55
que no es influenciado por las longitudes de los dos segmentos, como se muestra en al figura
3.4.
Y \ ;
V¡ ' \
... ········
.... ······ .. ·········
Fig. 3.4. Curvatura local C;.
V¡ 1/
Estableciendo un sistema coordenado local, figura 3.5, defmido por las direcciones
radiales (r;) y tangenciales (t;) a un vértice V;, esto permite calcular las fuerzas internas y
externas con respecto a los vértices. Donde:
Ec. 3.29.
y la dirección radial se encuentra al rotar rt/2 radianes el vector tangencial:
r. = [ o 1]¡ 1 -1 o 1
Ec. 3.30.
La curvatura local, ahora puede ser descrita en términos del sistema coordenado local
(r,t), ya que e;, es un vector ubicado a lo largo del eje local r, el cual puede ser descrito como:
Ec. 3.31.
FUNDAMENTOS DE LOS MODELOS DEFORMARLES 56
V¡' 1
V¡_¡
Fig. 3.5. Sistema coordenado local.
Las fuerzas internas aplicadas a los vértices del modelo se corresponden con la
curvatura local de cada uno de esos vértices, de allí que se debe cumplir con:
Ec. 3.32.
Uno de los inconvenientes encontrados en los modelos de contorno activos, era que para
contornos cerrados, el proceso de minimización podría conllevar a que los puntos de control del
snake, convergieran a un mismo punto, es decir, no se podía establecer un control adecuado
sobre el proceso de deformación. En tal sentido, Lobregt [Lobregt 95] propone como método de
control, la aplicación de un filtro a la secuencia que describe las fuerzas internas de cada uno de
los vértices, entonces el módulo de las fuerzas internas vendría dado por:
Ec. 3.33.
donde k;, es un filtro discreto simétrico centrado (de media igual a cero), este filtro fue escogido
tal que en la posición i su valor sea 1, mientras que en las posiciones i-1 Y. i+ 1, su valor es -1/2.
k = {· ... o o - _!_ 1 - _!_ o o ... ·} 1
''' 2'' 2'' Ec. 3.34.
FUNDAMENTOS DE LOS MODELOS DEFORMARLES 57
La aplicación de este filtro permite la reducción de la curvatura local, sin afectar las
áreas de curvatura constante, debido a que para tales regiones la magnitud del vector fuerza
interna es igual a cero luego de convolucionar la secuencia con el filtro. Esto se puede observar
en la figura 3.6; del lado izquierdo se muestra el proceso de defromación sin la palicación del
filtro , y del lado derecho de la figura se muestran los resultados del proceso de deformación
luego de aplicar el filtro. Para todas las figuras, el contorno en color azul representa el contorno
incial, los marcados en amarrillo, constituyen los contornos obtenidos en el proceso de
deformación, mientras que el contorno en color rojo, identifica la forma fmal encontrada. Al
modelo cerrado (figura 3.6a) se le aplican fuerzas de curvatura en todos sus vértices, mientras
que al contorno abierto (figura 3.6c) la fuerza es aplicada solo en los vértices que forman
esquinas. En el modelo cerrado, la magnitud del vector curvatura es igual en todos los vértices,
es decir, existen niveles de curvatura constante, de allí que el vector fuerza debe ser igual a
cero, por lo tanto el modelo inicial no debe cambiar de posición. En el modelo abierto, los
vértices adyacentes a las esquinas, no deben tener un nivel de curvatura igual a cero, de acuerdo
a la ecuación 3.28, y como se observa en la figura 3.6c, lo que efectivamente se corrige al
aplicar el filtro (figura 3.6d).
(a) (b)
(e) (d)
Fig. 3.6. Aplicación del filtro a contornos cerrados y abiertos. Modelo inicial representado en
azul, y el modelo final en rojo
FUNDAMENTOS DE LOS MODELOS DEFORMARLES 58
Fuerzas Externas. La fuerza externa en los modelos dinámicos discretos, va a estar determinada
por una distribución de energía potencial externa, dada por alguna características de la imagen.
La característica de la imagen utilizada generalmente es el gradiente de los niveles de gris, de
allí que el modelo debe seguir la dirección del máximo gradiente. Al aplicar este tipo de fuerza
sobre cada vértice del modelo, se debe tener presente que la misma no solo tiene componentes
perpendiculares (localmente radial) a la dirección local del modelo de contorno, sino que
también existe una componente a lo largo (localmente tangencial) del mismo. La componente
tangencial de la fuerza de imagen (fim.1;), hace que los vértices se muevan a lo largo del contorno
y se agrupen en un mínimo local de la distribución de energía externa, lo cual es un efecto no
deseado para el modelo. Entonces se debe usar, solamente la componente localmente radial de
las fuerzas de imagen (f;m,r;), de allí que:
Ec. 3.35.
3.4.3 Deformación y Remuestreo
Deformación. La fuerza total f; que actúa sobre los vértices, es una suma pesada de la fuerza
interna y de la fuerza externa, de la forma:
Ec. 3.36.
donde los factores de peso se escogen para cada aplicación. Al aplicar estas fuerzas sobre los
vértices del modelo, los mismos se comenzarán a mover cambiando su posición p;. Este vector,
al igual que los vectores aceleración y velocidad de los vértices, describen el estado dinámico
del modelo. De allí que un vértice no dejará de moverse hasta que u; = O y a; = O. Por lo tanto,
el proceso de deformación del modelo no será completado, antes de que la condición u;= a;= O
sea encontrada para todos los vértices. En el análisis de determinadas imágenes, culminar con el
proceso de deformación puede llevar algún tiempo, o en otras ocasiones el modelo puede caer
en un estado oscilatorio, entre dos puntos los cuales representen un mínimo local de energía.
Para dar solución a estas situaciones, se le adiciona al modelo una tercera componente de
fuerza, llamada fuerza de amortiguamiento fdamp, la cual es proporcional a la velocidad U¡.
FUNDAMENTOS DE LOS MODELOS DEFORMARLES 59
Ec. 3.37.
Ec. 3.38.
donde el factor de peso f4:tamp es negativo y determina la cantidad de amortiguamiento.
El proceso de deformación es implantado, como un proceso de integración numérica en
el tiempo, en el cual el estado fmal del modelo es calculado en una secuencia de posiciones
discretas en el tiempo. Entonces el proceso de deformación al incrementar en M el tiempo
puede ser descrito como:
p 1 ~+M)=p1 (t)+u 1M
u 1(t + !J..t)= u 1(t )+a1M
a1(t+M)=-1
f 1(t+M) m¡
Ec. 3.39.
Ec. 3.40.
Ec. 3.41.
donde m; representa la masa del vértice v;. Este valor se asume de modo que sea igual para
todos los vértices, su valor se elige de manera arbitraria, debido a que va a representar un factor
de escala.
Remuestreo. En el modelo implantado por Lobregt, el usuario puede controlar interactivamente
el parámetro ldes que establece la longitud de los segmentos de contorno del modelo, lo cual
permite escoger la resolución del modelo. Otros dos parámetros lm;n y lmax pueden ser
deducidos, y representan la mínima y máxima distancia permitida entre dos vértices vecinos. El
remuestreo es implantado como un proceso de dos pasos. El primer paso se encarga de revisar a
lo largo de todo el contorno, si alguna longitud de segmento es menor a lmin· Si ese es el caso,
ese segmento de contorno es removido del modelo, reemplazando los dos vértices que lo
formaban, por un solo vértice. El segundo paso revisa todo el contorno en búsqueda de aquellos
segmentos con longitud mayor a lmax, cuando uno de ellos es detectado, se divide en dos
segmentos de igual tamaño, lo cual introduce un vértice adicional al modelo. Los valores de lm;n
y lmax son estimados de acuerdo a las siguientes ecuaciones:
FUNDAMENTOS DE LOS MODELOS DEFORMARLES 60
Ec. 3.42
3 /max = 2/des Ec. 3.43
El modelo propuesto, esta basado en una estructura simple (figura 3.1 ), donde sus
deformaciones son controladas por las reglas básicas de la física (ecuaciones 3.39, 3.40, 3.41).
El mismo incorpora una solución elegante y eficiente a los problemas que los "snakes"
propuestos por Terzopoulos presentan. Por otro parte, el modelo es fácil de usar, ya que
presenta un número reducido de parámetros que controlan el proceso de deformación. El mismo
requiere una mínima interacción con el usuario debido a que no necesita la defmición de
fuerzas de restricción externa. Lobregt incorpora un proceso de remuestreo, al algoritmo que
implanta el proceso de deformación, esto permite que los vértices del modelo que él propone no
se encuentren espaciados uniformemente. Además, adiciona al modelo una fuerza de
amortiguamiento que permite controlar de forma adaptativa (ecuaciones 3.37, 3.38), las
oscilaciones bruscas que la curva pueda presentar. Dicho modelo ha sido probado en imágenes
sintéticas, y en imágenes médicas de tomografia computarizada, ultrasonido, angiografia
vascular y resonancia magnética.
3.5 MODELOS DEFORMABLES SEGÚN LAURENT COHEN [Cohen 90]
Cohen presenta un modelo de deformación el cual resuelve algunos de los problemas
encontrados en el modelo original propuesto por Terzopoulos. Las fuerzas externas que
empujan la curva a los contornos son modificadas generando resultados más estables. El
"snake" original, cuando no se encuentra lo suficientemente cercano al contorno, no es atraído
por él, y no sigue las líneas. El modelo hace que la curva se comporte como un balón, el cual es
inflado por fuerzas adicionales.
FUNDAMENTOS DE LOS MODELOS DEFORMABLES 61
3.5.1 Curvas de energía minimizante
Modelo de contorno activo. El modelo de contorno deformable (s) es un mapeo de la forma:
Ec. 3.44.
Un modelo deformable se defme como un espacio de deformaciones admisibles
denotado por Ad y un funcional E a minimizar. Este funcional representa la energía del modelo,
y se puede expresar como:
E: Ad---+ m E(v )= jajv s(s t + Pjv.,., (st + Eext (v(s ))ds Ec. 3.45.
n
Q: [0,1]
donde los subíndices de v, denotan diferenciación y donde Eext representa un potencial asociado
a las fuerzas externas, Cohen [Cohen 90] denota éste término por P, ese potencial es calculado
como una función de los datos de la imagen, de acuerdo a un objetivo global, por ejemplo, si se
quiere que el "snake" sea atraído por los puntos del contorno, el potencial dependerá del
gradiente de la imagen. El espacio admisible de deformaciones Ad es restringido por
condiciones de frontera v(O), Vs(O), v(l), Vs(l), adicionalmente se pueden usar curvas periódicas
u otros tipos de condiciones de frontera. Las propiedades mecánicas del modelo son controladas
por las funciones a(s) y P(s), ellas establecen la elasticidad y rigidez del mismo.
Si v es un mínimo local para E, él satisface la ecuación de Euler - Lagrange asociada:
{-(u(s)vJs +(p(s)v.J .. s +VP(v)=O v(O~ v..{O~ v(l~ vs(l) dadas también
Ec. 3.46.
En esta formulación, cada término aparece como una fuerza aplicada a la curva. Una
solución puede encontrarse al considerar el equilibrio de las fuerzas en la ecuación, o
FUNDAMENTOS DE LOS MODELOS DEFORMARLES 62
encontrando el mínimo de energía. De allí, el comportamiento de la curva es entonces
controlado bajo la influencia de las siguientes fuerzas:
• Fuerzas internas (los primeros dos términos) las cuales imponen la regularidad de la curva.
Los coeficientes a.(s) y ~(s) imponen la elasticidad y rigidez de la curva.
• Fuerzas de imagen (el termino potencial) empujan la curva hacia líneas significativas las
cuales corresponden a los atributos deseados, y están definidas por un potencial de la forma
! P(v(s ))ds donde:
P(v)= -IVI(vt Ec. 3.47.
1 denota a la imagen de niveles de gris. La curva es atraída por un mínimo local del
potencial, el cual corresponde al máximo gradiente, que es el contorno.
• Otras fuerzas externas que pueden ser adicionadas para imponer restricciones definidas por
el usuario, tales como fuerzas de repulsión y resortes [Kass 87].
Solución Numérica. La discretizando de la ecuación se realiza por diferencias finitas. Si F(v)
representa la suma de las fuerzas de imagen y las fuerzas externas, entonces la ecuación 3 .46,
luego de aplicar diferencias fmitas en el espacio (tamaño de paso h), tendrá la forma:
1 ¡;(a; (v; - V¡_1 )- ai+l (vi+I -V;))
bi-l ( ) +----¡;¡-- v¡_2 - 2v¡_1 +V;
-2 !; (v;_1 - 2v; + vi+I) Ec. 3.48.
donde v; = v(ih), a;= a(ih) y b; = ~(ih).
Esto puede ser escrito en forma matricial como:
FUNDAMENTOS DE LOS MODELOS DEFORMARLES 63
Av=F Ec. 3.49.
donde A es una matriz pentadiagonal que representa la matriz de deformaciones del modelo
[Brend 93], v y F denotan los vectores posición v; y fuerzas en esos puntos F(v;).
La ecuación de evolución asociada a la ecuación 3.46, se representa como:
{~ (~ () -- a S + S = -F V 8t ~ S t (J3( ~SS l..., v(t,O), v .. ~,0 ~ v~,l~ vs (t,l), v(O,s) dadas también
Ec. 3.50
Cuando el término ~de la ecuación 3.50 tiende a cero, se encuentra una solución al 8t
problema estático, es decir, el problema estático es resuelto cuando la solución previa de v(t) es
estable. El problema de evolución, luego de aplicar diferencias finitas en el tiempo (tamaño de
paso iJ, y en el espacio (tamaño de paso h), es de la forma:
Ec. 3.51
la cual se puede reescribir [Kass 87] como:
Ec. 3.52
donde Id denota la matriz identidad.
De allí, se obtiene un sistema lineal donde su matriz principal es positiva defmida y
pentadiagonal. La solución al sistema es calculada por descomposición LU [Burden 98] de
(Id + r A). La descomposición necesita calcularse una sola vez, si los coeficientes a(s) y ~(s)
permanecen constantes a través del tiempo, ya que los mismos formas los elementos de la
matriz A. El criterio de parada se establece al considerar que la diferencia de los valores de los
vectores posición x e y entre dos iteraciones es suficientemente pequeña.
FUNDAMENTOS DE LOS MODELOS DEFORMARLES 64
3.5.2 Mejoras del modelo de Cohen respecto al modelo de Terzopoulos
Inestabilidad de las fuerzas de imagen.
La fuerza de imagen defmida F = -V P, hace que las fuerzas sigan la dirección en la que
P desciende, lo cual es natural debido a que se desea encontrar un mínimo de P. El equilibrio es
obtenido en los puntos donde P es un mínimo en la dirección normal a la curva. Si la
aproximación inicial esta muy cercana al contorno, el proceso puede volverse inestable debido
a la discretización del problema de evolución temporal. Se puede observar de la ecuación 3.52,
que la posición en un tiempo t, v1, es obtenida después de mover v1
-1 a lo largo del vector
~(v1-1) y luego resolver el sistema, obteniendo una curva suave. Esto conlleva a las siguientes
observaciones:
Discretización temporal. Si ~(v1-1 ) es grande, el punto v1-1 puede ser movido lejos del mínimo
deseado y nunca regresar a él. La curva puede pasar sobre contorno, realizando grandes
oscilaciones en búsqueda del equilibrio, o puede estabilizarse en un mínimo diferente. Si se
escoge y lo suficientemente pequeño tal que, el movimiento generado por ~(v1- 1) nunca sea
grande, por ejemplo que nunca supere el tamaño de un pixel, entonces el problema señalado en
el párrafo anterior pudiera ser evitado. Sin embargo, muy pocos puntos con gradientes
pronunciados serán atraídos a la curva y pequeñas F no afectarán mucho a la misma, debido a
que esas fuerzas son demasiado pequeñas en comparación con las fuerzas internas. Las fuerzas
se sustituyen por la normalización de las mismas, tomando F = -k 11
;;
11
, donde rk es del orden
del tamaño del pixel, este proceso de normalización establece la regularización [Bertero 87] de
la fuerza F. Los pasos en el tiempo no son muy grandes, por lo tanto la magnitud de F es
cercana a la longitud de un pixel, cuando un punto de la curva esta muy cercano a un punto del
contorno, él es atraído al contorno consiguiendo su estabilidad, y no interfiriendo en el proceso
de suavidad. De esta forma, pequeños o grandes gradientes en la imagen tendrán la misma
influencia en la curva, en ambos casos los puntos de la curva encuentran su equilibrio en el
mínimo local del potencial, a lo largo de los puntos del contorno.
FUNDAMENTOS DE LOS MODELOS DEFORMABLES 65
Discretización espacial. La fuerza F es conocida solamente en una malla discreta
correspondiente a la imagen, y por consiguiente, allí puede existir un cruce por cero sin que se
detecte el cero en la malla. Este problema se resuelve por una interpolación lineal de F en una
posición no entera. Así se tendrá una definición continua de F y puntos de equilibrio
correspondientes a los ceros de F.
Consideraciones de la detección de contornos local. Se considera para una previa detección de
contornos, el detector de Canny- Deriche. La fuerza de atracción se obtiene por la simulación
de un potencial, defmido por la convolución de la imagen con la respuesta impulsiva de una
Gaussiana. Esto puede ser usado como la única fuerza de imagen, o junto con la intensidad del
gradiente para enfatizar la detección del contorno.
Localización del contorno inicial
Modelo del Balón. Para que un "snake" encuentre su forma, una forma inicial del contorno debe
ser dada. Esto tiene las siguientes consecuencias para la evolución de la curva:
• Si la curva no está lo suficientemente cercana al contorno, no será atraído por él.
• Si la curva no esta sometida a algún tipo de fuerza externa, la misma se contraerá.
Si las fuerzas de imagen en los puntos del mallado (obtenido al aplicar el método de
diferencias fmitas) son iguales a cero, la curva se contraerá y tenderá a un punto o a una línea,
dependiendo de las condiciones de contorno.
Debido a las consecuencias antes señaladas, es necesario adicionar fuerzas que permitan
que el contorno tenga un comportamiento más estable. Se considera a la curva como un balón
(en 2D), el cual debe ser inflado. A las fuerzas que presenta la curva inicial, se le adiciona una
fuerza de presión, que modela al balón, y que se encarga de empujar la curva hacia afuera,
como si la misma fuese inflada. La fuerza tendrá ahora la forma:
Ec. 3.53
FUNDAMENTOS DE LOS MODELOS DEFORMARLES 66
donde n(s) es el vector unitario normal a la curva en el punto v(s) y k1 es la amplitud de esta
fuerza, es decir, k1n(s) representa una fuerza que es aplicada en la dirección normal al punto s
del modelo. Si se cambia el signo de la constante k1, o la orientación de la curva, ella tendrá un
efecto de desinflamiento en vez de inflamiento. k¡ y k se escogen tales que sean del mismo
orden de magnitud, y menores que el tamaño de un pixel. La curva entonces se expande, es
atraída y detenida por los contornos. Si el contorno presenta una esquina, la curva puede pasar
sobre el mismo, considerando que el resto de la curva está inflada. La figura 3.7, muestra este
efecto, el contorno inicial marcado en color azul, es inflado hasta obtener un contorno con
estado de energía estable, marcado en rojo. En esta figura, se puede observar que el contorno
fmal se adhiere a la forma del objeto a extraer, excepto en las esquinas que el objeto tiene en su
parte derecha. La esquina inferior derecha del objeto no es discriminada por el modelo, el cual
pasa sobre la misma; mientras que la esquina superior derecha tampoco es detectada por que el
modelo de balón no logra inflarse hasta ese punto. El efecto de suavidad con el cual cuenta la
fuerza de inflación, remueve la discontinuidad y la curva pasa a través del contorno. Cuando el
balón encuentra equilibrio, los puntos que se adhieren al contorno son ligeramente sacados del
contorno real, puesto que las fuerzas de contorno han estado en equilibrio con las fuerzas de
inflación y regularización.
Fig. 3.7. Modelo del balón. El contorno inicial se representa en azul, y en fmal en rojo.
Se puede observar los inconvenientes en las esquinas.
Optimización de los coeficientes de elasticidad y rigidez.
Los coeficientes de elasticidad y rigidez tienen gran importancia en el comportamiento
de la curva en el tiempo. Si a y~ están alrededor de la unidad, la energía interna tiene mayor
FUNDAMENTOS DE LOS MODELOS DEFORMARLES 67
influencia y las fuerzas de imagen tienen un pequeño efecto, debido al proceso de
regularización. En este caso la curva es solamente regularizada.
Una correcta escogencia de estos parámetros esta guiada por consideraciones de análisis
numérico. Se desea que todos los coeficientes de la matriz de rigidez A sean del mismo orden
de magnitud, para que al darle solución al sistema de la ecuación 3.52 no sea un problema mal
condicionado numéricamente [Burden 98]. Se obtienen buenos resultados cuando los
parámetros son del orden de h2 para a, y h4 para p, donde hes el tamaño de paso usado en la
discretización espacial.
Al igual que el modelo propuesto por Lobregt, el propuesto por Cohen trata la forma de
eliminar los problemas observados en los modelos cerrados de contorno activo de Terzopoulos.
Cohen propone para ello, adicionar al modelo una fuerza de presión, que hace que la curva se
comporte como un balón. Esa fuerza se aplica en la dirección normal de cada uno de los puntos
de la curva, permitiendo así, obtener la solución deseada a partir de un modelo inicial que se
encuentre bastante lejano de la misma. Adicionalmente, aplica un proceso de normalización de
las fuerzas de imagen, logrando con ello eliminar los problemas de oscilación que pueda
realizar la curva en el proceso dinámico de búsqueda del equilibrio.
Cohen ha logrado segmentar eficientemente objetos de imágenes sintéticas, igualmente
la cavidad ventricular en imágenes de ultrasonido y de resonancia magnética. Tales problemas
de segmentación de imágenes médicas han sido planteados en dos dimensiones y que han
servido como plataforma básica para el desarrollo de técnicas de extracción de superficies en
imágenes en 3D [Metaxas 97].
3.6 CONCLUSIONES
El diagnóstico y tratamiento de enfermedades con ayuda de la imagenología médica,
esta focalizado en la aplicación de modelos geométricos de estructuras anatómicas de gran
exactitud. Los modelos deformables ofrecen una aproximación atractiva para tratar tales
FUNDAMENTOS DE LOS MODELOS DEFORMARLES 68
problemas, ya que estos modelos son capaces de representar las formas complejas de las
estructuras anatómicas. Los modelos deformables superan algunas de las limitaciones de las
tradicionales técnicas de procesamiento de imágenes de bajo nivel, debido a que generan una
representación compacta y analítica de la forma del objeto, y a que incorporan interactividad y
conocimiento a priori.
En el presente capitulo, se han revisado una variedad de técnicas de segmentación de
imágenes basadas en modelos deformables. El objetivo es realizar una revisión general de las
mismas, para de esa manera establecer los fundamentos globales de los modelos deformables, y
además mostrar que el proceso de segmentación de imágenes es un problema abierto.
CAPITUL04
SEGMENTACIÓN DE IMÁGENES USANDO
MODELOS DEFORMARLES
4.1 INTRODUCCIÓN
Los modelos deformables han sido utilizados para la segmentación de imágenes
sintéticas, imágenes provenientes de escenas reales, e imágenes generadas por alguna
modalidad de imagenología médica. Los fundamentos teóricos de este tipo de modelos, han
sido descritos en el capitulo anterior. En el presente capitulo, se realiza la implantación de los
modelos antes analizados, mostrando así, las virtudes y limitaciones de cada uno de ellos, al
realizar pruebas con imágenes de ventriculogramas reales. La determinación de las virtudes y
limitaciones de los principales modelos deformables reportados en la literatura, ha permitido
adicionalmente proponer en el presente capitulo, un nuevo modelo de contorno activo ("snake")
formado por las principales características de los modelos deformables analizados en el capitulo
anterior. Básicamente este modelo constituye una extensión de los modelos activos propuestos
por Terzopoulos, debido a que el mismo está representado como un spline de energía
minimizante. En tal modelo, las fuerzas asociadas, se obtienen en base a funcionales de energía
tales como, energía interna (ecuación 3.3), y energía de imagen (ecuación 3.6). El proceso de
deformación del "snake" planteado, es implantado como un proceso de integración numérica en
el tiempo, en el cual, el estado final del modelo es calculado como una secuencia de posiciones
discretas en el tiempo. En tal sentido, el modelo propuesto, incorpora características del modelo
de Lobregt [Lobregt 95], donde sus deformaciones son controladas por las reglas básicas de la
fisica (ecuaciones 3.39, 3.40, 3.41).
SEGMENTACIÓN DE IMÁGENES USANDO MODELOS DEFORMABLES 70
El proceso de segmentación que se quiere implantar en base a los modelos deformables,
requiere para su ejecución, de un conjunto de parámetros asociados a los funcionales de energía
utilizados para defmir el modelo. En el modelo propuesto, se ha tratado de usar un conjunto
reducido de parámetros, en comparación con los modelos analizados en el capitulo anterior, ya
que el mismo se defme en base a dos funcionales de energía, por lo tanto se utilizaran
solamente los parámetros asociados a cada uno de estos funcionales. La selección de estos
parámetros se realiza en base a la tabla propuesta por Y oung. Se han tomado para las pruebas,
imágenes de ventriculogramas reales.
Se comienza por evaluar el comportamiento de algunos de los algoritmos, presentados
en la literatura para la segmentación de imágenes. Los resultados de dicha evaluación son
considerados, para proponer un nuevo modelo deformable que permite realizar la
discriminación óptima de la cavidad ventricular.
4.2 MODELO PROPUESTO POR TERZOPOULOS
Los modelos de contorno activo propuestos por Terzopoulos, como se señaló en la
sección 3.2, son observados como un spline de energía minimizante, controlados por fuerzas
externas y fuerzas derivadas de la imagen. Los spline de energía minimizante, son establecidos
inicialmente por un conjunto de puntos, ubicados en el plano imagen, y deben ocupar
posiciones considerablemente cerca del contorno del objeto a reconocer; este conjunto de
puntos defme el modelo inicial. Terzopoulos, no propone un proceso sistemático para la
defmición de este contorno inicial, simplemente establece que los puntos que conforman este
modelo, los defme el operador de forma manual e interactiva con ayuda del ratón (M o use). La
figura 4.1, muestra un contorno inicial trazado sobre una imagen del ventrículo izquierdo en
diástole.
El modelo inicial, establecido de la forma antes mencionada, debe someterse a un
proceso de deformación. La deformación se realiza, mediante un proceso de minimización de
SEGMENTACIÓN DE IMÁGENES USANDO MODELOS DEFORMARLES 71
ciertos funcionales de energía asociados al modelo; en la sección 3.2 se analizaron los diversos
funcionales de energía que el modelo de Terzopoulos puede manejar.
Fig. 4.1. Contorno Inicial
En esta sección, se muestran los resultados obtenidos de la implantación computacional
del modelo de Terzopoulos. El modelo de Terzopoulos presentado acá, considera para el
proceso de minimización el funcional de energía interna, que combina la capacidad del modelo,
de comportarse como una placa delgada o como una membrana. El funcional de energía externa
propuesta por Terzopoulos, esta compuesto por energía de restricciones y energía de imagen.
La energía de restricciones no es utilizada acá, ya que sobre el modelo inicial no existen puntos
que se quieran fijar a cierta región de la imagen con ayuda de un resorte, y tampoco se
considera la utilización de volcanes, que den la posibilidad de empujar el "snake" fuera de un
mínimo deseado. De las tres componentes de la energía de imagen (ecuación 3.4), energía de
línea, energía de contorno y energía de terminaciones, en la implantación realizada, se
considera solamente la energía de contorno, debido a que el reconocimiento del objeto puede
lograrse, al defmir de forma eficiente el contorno del mismo. De allí, que solo dos funcionales
de energía son utilizados en el proceso de deformación. La energía asociada a cada uno de esos
funcionales, es establecida por la defmición sobre el modelo de tres fuerzas, dos de ellas
controlan la curvatura y la suavidad que el spline puede adoptar, mientras que una tercera se
encarga de que el "snake" sea atraído a contornos con gradientes pronunciados. Las fuerzas
antes señaladas, son controladas por factores de peso, los cuales defmen el comportamiento del
modelo como fue señalado en las secciones 3.2.2 y 3.2.4, donde se reporta que los factores de
o
SEGMENTACIÓN DE liD GENES USANDO MODELOS DEFORMARLES 72
peso que se deben tener en cuenta acá son, a, p y úl?dge, que controlan la elasticidad, rigidez y
la capacidad del modelo de ser atraído a contornos con gradientes pronunciados.
La escogencia de los valores de los factores de peso, se realiza de forma heurística,
basándose inicialmente en los valores reportados en los trabajos de Terzopoulos. Es importante
señalar, que la literatura no reporta criterios para la escogencia de los valores de estos factores,
por ello el método de escogencia de los mismos es el antes mencionado. El método propuesto
para el establecimiento de los valores de los pesos, consiste en tomar valores utilizados por
Terzopoulos, y empezar a variar uno de ellos dejando los demás constantes. En la tabla 4.1, se
muestran valores de a, p y úl?dge, utilizados para segmentar la cavidad ventricular, partiendo
del contorno inicial mostrado en la figura 4.1. Adicionalmente la tabla 4.1, muestra la cantidad
de iteraciones ejecutadas, así como también la energía final que modelo presenta. La escogencia
de los valores de los factores se peso, debe realizarse, en función del mejor contorno que el
modelo genere al variar los valores de dichos factores de peso. En tal sentido, se debe utilizar
algún método estimador de eficiencia, el cual permita cuantificar la diferencia existente entre el
contorno obtenido por el modelo activo utilizado, y un contorno ideal, trazado de forma manual
por un especialista, como el que se puede observar en la figura 4.2
Fig. 4.2. Contorno Ideal o de Referencia
En la tabla 4.1, se presentan los valores del error suma (e) y de la media de la distancia
mínima (e), los cuales representan estimadores de eficiencia que permiten cuantificar la
diferencia entre dos contornos, estos estimadores se analizan en el Apéndice A.
SEGMENTACIÓN DE IMAGENES USANDO MODELOS DEFORMARLES 73
Tabla 4.1. Determinación de los valores de los factores de peso.
Iter.
0.20 0.055 0.90 19 17359.83 11.72 5.60
0.25 0.055 0.90 22 24709.18 11.06 5.31
0.35 0.055 0.90 18 22415.51 10.27 4.88
0.45 0.055 0.90 30 19069.57 6.20 3.07
0.35 0.035 0.90 18 19941.40 9.01 4.21
SEGMENTACIÓN DE IMÁGENES USANDO MODELOS DEFORMARLES 74
e(%) e
0.35 0.045 0.90 18 21256.45 9.79 4.63
0.35 0.065 0.90 18 23906.65 10.52 5.01
0.35 0.055 0.30 14 29276.68 10.38 4.83
0.35 0.055 0.60 18 24792.28 10.64 5.02
0.35 0.055 1.20 17 20148.55 9.72 4.62
SEGMENTACIÓN DE IMÁGENES USANDO MODELOS DEFORMABLES 75
Evidentemente, el método heurístico no es el más acertado, debido a que hay que
realizar múltiples pruebas para encontrar el valor adecuado que debe asignarse a cada uno de
los factores de peso. La escogencia de los valores de los factores de peso, adicionalmente se
basa en el análisis de los valores que adoptan los estimadores de eficiencia en el proceso de
deformación del modelo activo. De acuerdo a los resultados observados en la tabla 4.1, el
modelo obtenido, que según los estimadores de eficiencia, se asemeja mejor, al modelo ideal
trazado por el especialista, es el que corresponde a valores de a = 0.45, P = 0.055 y l4dge =
0.90, el cual alcanza su estado de energía estable en la iteración número 30. Si bien este
modelo, es el que menos difiere, según los estimadores del modelo ideal, el mismo no
corresponde con un contorno que discrimine, según el especialista, de forma óptima la cavidad
ventricular, ya que presenta evidentes discontinuidades en la curva que lo modela. Los
siguientes dos contornos encontrados, con menor error de estimación (error suma y media de la
distancia mínima), corresponden a aquellos donde los factores de peso adoptan los siguientes
valores:
i. a= 0.35, p = 0.035 y l4dge = 0.90. El cual alcanza su mínimo valor de energía en la iteración
18.
ü. a = 0.35, J3 = 0.055 y l4dge = 1.20. Con energía estable encontrada en la iteración número
17.
El primero de ellos, presenta una ligera curvatura a nivel del apex, que ocasiona perdida
de la información contenida en la región que dicho contorno no puede cubrir. El segundo
contorno estimado, con menor error, no discrimina de forma adecuada la región ventricular,
pero se puede observar, que es el que mejor se comporta, en comparación con los demás
modelos generados para la escogencia del conjunto de parámetros óptimos, que el modelo de
Terzopoulos debe utilizar. Un aspecto importante, que habría que señalar, es que este último
contorno es el que mejor se comporta, es decir, es el presenta menor error, y que alcanza un
estado estable de energía en menor número de iteraciones.
Adicionalmente, se debe señalar que estos factores, defmen la estabilidad y
convergencia del modelo de Terzopoulos, de allí que una escogencia errada de los mismos hará
que la energía del spline, empiece a oscilar entre distintos mínimos locales, o en el caso más
extremo, tienda a aumentar hasta valores infmitos. La figura 4.3, muestra los resultados
SEGMENTACIÓN DE IMÁGENES USANDO MODELOS DEFORMARLES 76
obtenidos al aplicarle el modelo de Terzopoulos a un ventriculograma real. Los valores de los
factores de peso usados en el modelo aplicado al contorno inicial mostrado en la figura 4.3.a,
corresponden a a= 0.35, p = 0.055 y ákdge = 1.20, los cuales representan los pesos que generan
una mejor solución del modelo de Terzopoulos aplicado a un ventriculograma real, según la
tabla 4.1. La figura 4.3.b, muestra el contorno final obtenido al aplicar el modelo de
Terzopoulos.
(a) (b)
Fig. 4.3. Modelo de contorno activo de Terzopoulos.
a) Contorno inicial. b) Contorno resultante
En la figura 4.4, se muestra el resultado de aplicar el modelo de Terzopoulos, al mismo
ventriculograma de la figura 4.3, con los mismos factores de peso, pero utilizando un modelo
inicial defmido muy cerca de la forma ventricular. La figura 4.4.b muestra el contorno obtenido
luego de aplicar a la imagen de la figura 4.4.a el proceso de deformación propuesto por
Terzopoulos, este modelo alcanza un estado estable para una energía igual a 21554.58, en la
iteración número 29, con un error suma del 15.53 %, y una media de la distancia mínima de
7.51. El contorno obtenido, discrimina de forma correcta la parte anterior del ventrículo,
presentando algunas oscilaciones en la parte inferior del mismo.
El modelo de Terzopoulos, adicionalmente es aplicado a un contorno definido muy
cerca del contorno que defme la cavidad ventricular. La figura 4.5, muestra los resultados del
SEGMENTACIÓN DE IMÁGENES USANDO MODELOS DEFORMARLES 77
proceso de deformación antes señalado. El contorno obtenido, presenta un estado estable
energía en la iteración número 6, con errores de estimación del15.02% y 8.04. Debido a que el
contorno inicial, esta defmido muy cerca del contorno ventricular, el mismo cumple con ciertas
características de los modelos deformables, como son la suavidad y curvatura, de allí que su
deformación es muy pequeña.
(a) (b)
Fig. 4.4. Modelo de contorno activo de Terzopoulos.
a) Contorno inicial. b) Contorno resultante
(a) (b)
Fig. 4.5. Modelo de contorno activo de Terzopoulos.
a) Contorno inicial. b) Contorno resultante
SEGMENTACIÓN DE IMÁGENES USANDO MODELOS DEFORMARLES 78
Las soluciones obtenidas en las figuras 4.3, 4.4 y 4.5, como se puede observar, si bien
obtienen la forma ventricular, presentan limitaciones, como lo son, la falta de suavidad y
curvatura en ciertas regiones, y adicionalmente perdidas considerables del máximo gradiente
que la imagen presenta. De allí, que con los funcionales de energía establecidos, el modelo de
Terzopoulos permite segmentar el ventrículo izquierdo, no siendo la forma encontrada, la que
mejor discrimine la cavidad ventricular, al realizar comparaciones con el contorno ideal trazado
por el especialista; lo cual no indica que el modelo sea ineficiente en otras áreas de aplicación.
La figura 4.6, muestra una gráfica de la evolución de la energía del "snake" aplicado al
contorno inicial mostrado en la figura 4.3.a. Se puede observar que el modelo progresivamente,
sin entrar en estado de oscilación, obtiene el mínimo de la energía asociada al mismo. En tal
sentido, el proceso de minimización propuesto por Terzopoulos, se cumple en el modelo
implantado, lo cual puede reafrrmarse, al revisar los resultados mostrados en la tabla 4.1, allí se
puede observar que el modelo va siempre en búsqueda de un mínimo global, donde la
obtención de ese mínimo no implica la determinación del contorno que mejor discriminaría la
región ventricular. Una conclusión importante acá, es entonces, que la energía asociada al
modelo fmal encontrado, no puede ser utilizada como un cuantificador de la calidad del
contorno generado, simplemente puede ser usado, como un criterio que determine, hasta cuando
el modelo puede sufrir deformaciones.
Las fallas para la detección de la forma ventricular, que en el modelo analizado se
observan, se deben según Cohen [Cohen 90], a la inestabilidad de las fuerzas de imagen, a la
discretización temporal y espacial, y a las consideraciones de la detección de contornos local,
que han sido analizadas en la sección 3.5.2. Por otro lado, el proceso de deformación de este
tipo de modelos, se basa en la solución de sistemas de ecuaciones lineales, donde la matriz
principal del mismo, está conformada por los coeficientes de elasticidad y rigidez asociados a
cada punto del modelo. En el modelo implantado, a todos los puntos se le asigna un único
coeficiente de elasticidad y rigidez, una alternativa para mejorar las soluciones obtenidas con
estos modelos, es la de asignar distintos valores a esos coeficientes en cada uno de los puntos.
Esta alternativa, es altamente costosa a nivel computacional, ya que para la evolución de cada
SEGMENTACIÓN DE IMÁGENES USANDO MODELOS DEFORMABLES 79
uno de los puntos habría que resolver un sistema lineal, donde su matriz principal esta
determinada por los coeficientes de elasticidad y rigidez asociados a cada punto.
Energía del Snake
3.5 ....................................... l.. .................. .L ................... ¡ ..................... .i.. ................... ~ .................... ~ ..................... L .................. .L . i . ¡ ! ¡ ¡ i '
3 ~ ~ ~
···················+·············· ·····¡-·············· ···-¡--.................. r .................... : .................... -r : : .................. ¡ ...................... ¡ .... .
Energía
2.5 . . . ¡ ¡ 1 . .
................... ..¡. ..................... (················· .. ···1··············· .... , ............................................ ( ..................... .,. ..................... ¡ ..•.•.•••••••.••..• ·!··················· : . ~ ~ : ¡ ¡ ;
2 --+ l -¡ i -¡- __ , -¡ -- , __ _
1.5~--~--~----~--~----~--~--~----~--~--~ o 2 4 6 8 10 12 14 16 18 20
iteraciones
Fig. 4.6. Evolución de la Energía del Snake.
Como se ha señalado, un aspecto importante en la implantación de los modelos
propuestos por Terzopoulos, es la escogencia adecuada de los valores de los factores de peso.
Adicionalmente, se había señalado, que una escogencia errada de los mismos podía conllevar a
la inestabilidad y no convergencia del modelo. Esos factores de peso, van a conformar los
coeficientes de la matriz principal del sistema lineal a resolver, de allí, que estos valores
impondrán las características de esa matriz, lo cual representa un aspecto muy importante para
el establecimiento del método numérico a escoger para la solución del sistema lineal.
Terzopoulos propone, resolver dicho sistema utilizando el método de descomposición LU. Tal
esquema es ampliamente utilizado en la solución de problemas en ingeniería aplicada. Sin
embargo, el método es estable y converge, bajo ciertas características de la matriz principal del
sistema. Tal matriz, debe ser una matriz de banda, definida positiva y aceptar la eliminación
Gaussiana. Tales propiedades, pueden perderse debido a la mala escogencia de los factores de
SEGMENTACIÓN DE IMAGENES USANDO MODELOS DEFORMARLES 80
peso. La figura 4.7, muestra el modelo de Terzopoulos aplicado a una imagen ventriculográfica,
usando como factores de peso a= 0.5, 13 = 0.005 y C4dge = 0.7. Estos factores de peso hacen al
modelo inestable y no convergente, la figura 4.7.b, muestra el contorno obtenido en la iteración
número 20, mientras que la figura 4.7.c, muestra el contorno obtenido una iteración antes de
que la energía se haga infmita (iteración número 52), el cual alcanza valores de error del 40.39
% y 28. 73, para el error suma y la media de las distancias mínimas respectivamente. Se puede
observar que el contorno, tiende a separarse considerablemente de la forma ventricular, ya que
los factores de peso escogidos no permiten que las ecuaciones de Euler-Lagrange (ecuación
3.11 ), alcancen mínimos locales en algunos de los puntos que defmen al spline.
(a) (b)
(e)
Fig. 4.7. Modelo de contorno activo de Terzopoulos utilizando parámetros inadecuados
. a) Contorno inicial. b) Contorno resultante en la iteración 20. e) Contorno resultante en la
iteración 52
SEGMENTACIÓN DE IMÁGENES USANDO MODELOS DEFORMARLES 81
En ]a figura 4.8, se muestra la evolución de la energía del "snake" aplicado al contorno
de la figura 4.7.a. Allí se puede observar, que la energía de dicho modelo, presenta oscilaciones
considerables, y que la misma tiende a valores considerablemente altos.
X 104 Energía del Snake
5.-------~------,--------.------~-------,,-------,
4 5 ~ ~
• . ............................... .;. .................................... ¡ ..................................... ¡ .............•...................... .¡. ••••••••••••••••••••••••••••••••••• ; .......................... . ¡ ' ¡ ! .
4 ................................ .;. .................................... ¡ ..................................... ¡ ................................... .;. ................................ ¡ ............. . . 1 i ¡ :
3. 5 ................................ ~ .................................... , ................................... ! .................................. t ............................... + ......... ..
Energía
3 . . ¡ ~
•················· .............. .;. ..............•..................... ¡ ................................ ~ ................................. t ............................. f .............................. .. ¡ ~ ¡ l
2 ............. ~ ..................................... i. ................................... l .................................... i .............................. .. ¡ ¡ . .
1.5~------~------~------~------~------~~----~ o 10 20 30
iteraciones 40
Fig. 4.8. Evolución de la Energía del Snake.
50 60
El análisis del modelo de Terzopoulos realizado en la sección 3.2, y la implantación de
ese modelo en el presente capitulo, permiten realizar las siguientes conclusiones:
i. No se presentan métodos automáticos para la definición del contorno iniciaL El modelo debe
ser inicializado de forma manual e interactiva.
u. Terzopoulos no propone un procedimiento sistemático para elegir los factores de peso
asociados a los funcionales de energía que definen al modelo.
iii. El modelo es muy susceptible a variaciones en función de los valores de los factores de peso.
Logrando, inclusive, alcanzar estados de inestabilidad por la escogencia errada de los
mismos.
SEGMENTACIÓN DE IMÁGENES USANDO MODELOS DEFORMABLES 82
iv. El valor de energía asociada a los modelos resultantes de cada iteraciones, no es factor que
mida la calidad del contorno encontrado para esta aplicación. Alcanzar un estado estable de
energía, no determina necesariamente un buen contorno.
4.3 MODELO PROPUESTO POR YOUNG
Los modelos de contorno activos propuestos por David Y oung, representan una
extensión de los "snake" propuestos por Terzopoulos, donde la evolución temporal del modelo
debido a las variaciones de energía asociadas al mismo, se realiza al actualizar cada una de las
coordenadas de los puntos de control, como se describe en la ecuación 3.27. El proceso de
deformación del modelo activo de Young, al igual que el modelo de Terzopoulos es controlado
por factores de peso, asociados a cada uno de los funcionales de energía utilizados para la
defmición del modelo. El modelo de Young implantado, solamente considera dos funcionales
de energía para la definición del proceso de deformación, dichos funcionales corresponden a la
energía elástica y a la energía de imagen, definidas por las ecuaciones 3.23 y 3.26
respectivamente.
La escogencia de los factores de peso, al igual que en el modelo de Terzopoulos, se
realiza de forma heurística, donde los valores iniciales de este método de escogencia,
corresponde a los reportados por Young en sus trabajos, y donde las variaciones de los valores
del conjunto de parámetros, debe realizarse entre los rangos establecidos por Young en la tabla
3.1. Los resultados del método de escogencia heurístico, son presentados en la tabla 4.2. Dicha
tabla, muestra los valores del conjunto de parámetros utilizados, el número de iteraciones donde
el modelo alcanza su estado estable de energía, así como también los distintos valores obtenidos
al aplicarle al contorno obtenido, los valores de los estimadores de eficiencia que cuantifican la
diferencia con respecto al modelo ideal, trazado por el especialista y que se muestra en la figura
4.2.
El parámetro a controla el comportamiento del modelo como una banda elástica o
membrana, es decir, controla la propiedad de contracción. Por su parte y, es el parámetro que
SEGMENTACIÓN DE IMÁGENES USANDO MODELOS DEFORMARLES 83
pondera la influencia de la energía de imagen asociada al modelo, los valores de este parámetro,
permitirán que el modelo siga o no la dirección del máximo gradiente. El modelo de Y oung, al
igual que el modelo de Terzopoulos, se fundamenta en la minimización de funcionales de
energía, de allí, que el proceso de deformación propuesto por Young, debe culminar, cuando se
detecten estados de energía estable. La figura 4.9, muestra una imagen angiográfica del
ventrículo izquierdo, sobre la cual se ha trazado el contorno inicial, utilizado en la implantación
del método heurístico.
Fig. 4.9. Contorno Inicial
Tabla 4.2. Determinación de los valores de los factores de peso.
0.2 -0.025 6 8232.80 8.96 4.01
0.1 -0.025 5 8534.05 8.99 4.01
SEGMENTACIÓN DE IMÁGENES USANDO MODELOS DEFORMARLES 84
a
0.4 -0.025 6 7782.50 11.44 5.00
0.5 -0.025 7 7550.85 14.00 6.03
0.4 -0.0125 6 7707.08 11.66 5.10
0.4 -0.00625 8 7552.24 12.62 5.49
0.4 0.00625 6 7649.99 11.49 5.03
De los resultados mostrados en la tabla 4.2, el correspondiente a a = 0.2 y y = -0.025,
presenta el menor error suma y la menor media de la distancia mínima, lo que indicaría que el
mismo debe ser el candidato a mejor contorno. Según el especialista, el mejor contorno que se
puede observar de la tabla 4.2, corresponde al obtenido con a = 0.4 y y = 0.00625, el cual
SEGMENTACIÓN DE IMÁGENES USANDO MODELOS DEFORMARLES 85
presenta un error del 11.49 %y 5.03. Como se puede observar, para el método de Young, al
igual que para el método de Terzopoulos, no existe un elemento que cuantifique efectivamente,
la diferencia del contorno encontrado, con respecto a un contorno trazado de forma manual por
un experto.
La figura 4.1 O, muestra el resultado de la segmentación de una imagen
ventriculográfica, con el modelo de Young implantado. Para ello, se utilizan el conjunto de
valores de los factores de peso, del contorno que el especialista señaló como el que mejor
discriminaba la cavidad ventricular. La energía estable de este contorno, es alcanzada en la
iteración número 6. La forma final encontrada, genera errores de estimación del 11.49 % para el
error suma, y 5.03 para la media de las distancias mínimas.
(a) (b)
Fig. 4.1 O. Modelo de contorno activo de Young.
a) Contorno inicial. b) Contorno resultante
La figura 4.11, muestra el proceso de deformación propuesto por David Young, aplicado
a la misma imagen ventriculo gráfica de la figura 4.1 O, con los mismos factores de peso, pero
usando otro contorno inicial. El error suma obtenido es igual a 30.89 %, y la media de la
mínima distancia corresponde a 12.64. El contorno obtenido, se encuentra por dentro de la
cavidad ventricular, lo cual ocurre porque el modelo no puede seguir la dirección del máximo
gradiente, lo que esta muy relacionado con el valor asignado al factor de peso y. El estado de
energía estable, se consigue luego de ejecutar el proceso durante 11 iteraciones.
SEGMENTACIÓN DE IMÁGENES USANDO MODELOS DEFORMABLES 86
(a) (b)
Fig. 4.11. Modelo de contorno activo de Young.
a) Contorno inicial. b) Contorno resultante
Una última prueba del modelo de Young, es mostrada en la figura 4.12, y corresponde al
mismo ventriculograma de la figura anterior, y asumiendo los mismo factores de peso, pero con
un contorno inicial defmido considerablemente cerca de la forma ventricular.
(a) (b)
Fig. 4.12. Modelo de contorno activo de Young.
a) Contorno inicial. b) Contorno resultante
SEGMENTACIÓN DE IMÁGENES USANDO MODELOS DEFORMARLES 87
Para el ventriculograma de la figura anterior, se obtienen valores estables de energía en
la iteración número 8. Los estimadores de eficiencia toman valores de 7.01 % para el error
suma, y 3.50 para la media de la distancia mínima. La solución obtenida, se encuentra
considerablemente cerca del contorno ideal, de allí que el contorno inicial aplicado al modelo
de Y oung, debe encontrarse cerca del contorno deseado, para así lograr una discriminación
aceptable del objeto a extraer.
La figura 4.13, muestra una gráfica de la energía asociada al modelo fmal observado en
la figura 4.1 O, como una función de las iteraciones realizadas. Se puede observar que el modelo
alcanza de forma rápida estados de energía estable.
Energía del Modelo Activo 8600r------.------~------~------~----~------~
¡ . ! ................................. r····················· .. ·············i·····································¡····································+····································~·······························
. .
8400 -- - r-----+-- _ t-- ¡ ____ +--8300 ·················· ·············t···················· .. ··············¡·····································!····································-···································¡·············
8200 ···························· ···t····································j·····································!··································+································.) ................ .
Energía ! ! , , ,
81 00 ··································t········ ·························i·····································!····································f····································¡ ................................. . ¡ . ¡
8000 .................................. t···························· ······l·····································i····································f····································i··································
7900 ---¡ ¡--1----+ ~ 7800 ........................................................................................................................ ·····················•····································f··································
77oo ································T···································r···································r··································r·············
7600L-------~------~------~------~------~----~ 1 2 3 4
iteraciones 5 6
Fig. 4.13. Evolución de la Energía del modelo activo de Young.
7
Es importante señalar que modelo de Young, al igual que el modelo de Terzopoulos
puede presentar estados de energía inestable, que hacen al modelo no convergente, esto se debe
SEGMENTACIÓN DE IMÁGENES USANDO MODELOS DEFORMABLES 88
a la mala escogencia de los parámetros asociados al mismo. La figura 4.14, muestra una gráfica,
donde la energía asociada al modelo que la genera tiende a infmito.
X 104 Energía del Modelo Activo
4.5~----r-----r-----r-----r-----.-----.-----.-----,
4 ......................... ¡ ........................... l .......................... ~ ............................ ; ........................... ¡., ......................... i. .......................... ¡ ....................... . 1 ! ¡ ¡ 1 1 '
3
: ~~- : t ---r~ : =-=~=:- : : I __ _ ! ! ! ' . ! '
Energía
2.5 ·························~············· .............. ~ .......................... f ........................... ¡ ........................... ~ .............. ..
2 ......................... ! ........................... .¡. •••••••••••••••••••••••••• L ........................... j .......................... .l ........................... i ......................... ¡ ........................ .
1 5 -- ~----~ -~-- - i------: - : r ························l························1 ............. ·····t························¡······ ............................. ¡ ............. ...... ! ..
: : :
0.5L-----L-----L-----L-----L-----L-----L-----~--~ 1 1.5 2 2.5 3
iteraciones 3.5 4 4.5 5
Fig. 4.14. Evolución de la Energía del modelo activo de Young, con parámetros inadecuados.
Como se ha podido observar, el modelo de Young aplicado a una ventriculografia en
fase diastólica, a la cual se le han aplicado distintos contornos iniciales, permite segmentar la
cavidad ventricular de una forma medianamente eficiente. Se debe señalar que en algunos
casos, como el mostrado en la figura 4.9 y 4.10, el contorno fmal obtenido se aproxim<}
considerablemente a la forma del ventrículo izquierdo·. Los errores de estimación se encuentran
dentro de los rangos establecidos por los especialistas, se debe señalar, que para un especialista,
un contorno obtenido por métodos computacionales, debe tener una diferencia menor al 13 %,
respecto al trazado de forma manual.
La implantación computacional de los modelos activos Y oung, permiten entonces,
exponer las siguientes conclusiones:
SEGMENTACIÓN DE IMÁGENES USANDO MODELOS DEFORMARLES 89
1. El contorno utilizado para inicializar el proceso de deformación propuesto por Y oung, se
establece de forma manual, aunque el mismo propone algunas alternativas que pueden ser
utilizadas para la determinación de ese modelo inicial, las cuales se mencionan en la sección
3.3.5.
11. Los valores del conjunto de parámetros asociados al modelo de Y oung, se escogen de forma
heurística, donde las pruebas para su escogencia, se realizan sobre valores contenidos en los
rangos defmidos en la tabla 2.1.
iii. El modelo de Y oung, esta completamente defmido para la extracción de formas con
contornos cerrados. Acá se realiza una extensión, para usar dicho modelo, como técnica de
extracción de formas con contornos abiertos.
iv. El modelo de Young, a diferencia del de Terzopoulos, no es tan susceptible a variaciones en
función de los valores de los factores de peso.
v. Computacionalmente sencillo, alcanzando valores estables de energía en pocas iteraciones.
Teniendo presente, que el valor de energía asociada a los modelos resultantes de cada
iteraciones, no es factor que mida la calidad del contorno encontrado.
4.4 MODELO PROPUESTO POR LOBREGT
Lobregt propone un modelo dinámico discreto, el cual modela un contorno deformable,
donde el proceso de deformación se origina por la aplicación de fuerzas a cada uno de los
vértices o puntos que definen al modelo, y es considerado como un proceso de integración
numérica en el tiempo, en el cual, el estado fmal del modelo, es calculado como una secuencia
de posiciones discretas en el tiempo.
De acuerdo al análisis realizado en la sección 3.4, el modelo de Lobregt, al igual que el
de Terzopoulos y el de Young, es un modelo que requiere ciertos parámetros. Lobregt en su
trabajo [Lobregt 95], logra segmentar imágenes de angiografia vascular, de las arterias del
abdomen y de las piernas. Al conjunto de parámetros se le asignan, los siguientes valores: !des =
1 O, úl?xt = ú}¡nt = 0Jdamp = 0.5.
SEGMENTACIÓN DE IMÁGENES USANDO MODELOS DEFORMARLES 90
El modelo dinámico discreto de Lobregt, es aplicado a una imagen ventriculográfica en
fase diastólica, para ello .se utiliza el mismo conjunto de parámetros utilizado por Lobregt para
segmentar las arterias del abdomen y de las piernas. Los resultados de este proceso se pueden
observar en la figura .4.15. La figura 4.15.a, muestra la imagen ventriculográfica a utilizar. El
modelo inicial trazado sobre el ventriculograma, puede observarse en la figura 4.15.b. El
resultado obtenido, se muestra en la figura 4.15.c.
(a) (b)
(e)
Fig. 4.15. Modelo de contorno discreto de Lobregt utilizando parámetros inadecuados.
a) Imagen Original. b) Contorno inicial. e) Contorno resultante.
SEGMENTACIÓN DE IMÁGENES USANDO MODELOS DEFORMARLES 91
En el análisis de angiografia cardiaca, culminar con el proceso de deformación puede
llevar algún tiempo, o en otras ocasiones el modelo puede caer en un estado oscilatorio donde
no se logre alcanzar un estado fmal estable, como en el ejemplo observado en la figura 4.15,
donde el modelo no converge por la utilización de parámetros inadecuados. El proceso de
deformación de este tipo de modelos, culmina cuando todos los puntos que definen al mismo,
alcanzan su estado estacionario, lo cual se logra para condiciones de velocidad y aceleración
nulas (u; = a; = O) para todos los vértices. Las ecuaciones 3.40 y 3.41, definen los vectores
velocidad (u;) y aceleración (a;) respectivamente.
Un estado estable para el modelo dinámico discreto de Lobregt, puede cuantificarse, con
ayuda de la norma Euclideana de los vectores velocidad y aceleración, la cual representa la
diferencia en el espacio Euclideano, que puede encontrase entre dos posiciones discretas del
modelo en el tiempo, es decir, como la implantación del modelo constituye un proceso discreto,
existe la posibilidad de que la velocidad no alcance valores nulos para todos los vértices, de allí,
que con la norma euclideana, se está cuantificando la diferencia del vector velocidad en dos
instantes de tiempo consecutivos. Para diferencias muy pequeñas, entonces se puede establecer
que el modelo ha alcanzado su estado estable.
Una solución al problema de segmentación ventricular, encontrada de forma heurística
luego de realizar una serie de pruebas con el modelo de Lobregt, se presenta en la figura 4.16.
El modelo fmal, se obtiene luego de 42 iteraciones, con una norma de 0.000213 para el vector
velocidad, y que alcanza valores de 16.60% para el error suma, y de 7.07 para la media de las
distancias mínimas. El conjunto de parámetros adopta los siguientes valores: !des = 1 O, ~xt = -
0.065, (J)¡nt = 2.9, ~amp = -0.8.
De la figura 4.16, se puede observar que el modelo discreto de Lobregt, se comporta
considerablemente bien, en cierta región del contorno ventricular (parte inferior), mientras que
su forma difiere considerablemente del modelo ideal (figura 4.2), en la región anterior del
mismo. En la figura 4.17, se puede observar una gráfica de la norma, en función de las
iteraciones obtenidas al ejecutar el modelo de la figura 4.16, hasta obtener un estado de energía
estable.
SEGMENTACIÓN DE IMÁGENES USANDO MODELOS DEFORMARLES 92
Norma
(a) (b)
Fig. 4.16. Modelo de dinámico discreto de Lobregt.
a) Contorno inicial. b) Contorno resultante.
Evolución de los Contornos Dinámicos Discretos 6.----.----.----.----r----.----r----.----r---~
4 ................... , .................... .. ········¡··················· .. ···!·······················-r .. ··············· .. ··~·················
3 ---f --j--+- ¡---¡ -¡ --¡- __ j -
2 - -¡--:-t-- ~----¡ ¡--r -1 -
--:-+----¡--- +--+ -¡--~ --L
5 10 15 20 25 30 35 40 45 iteraciones
Fig. 4.17. Evolución de los Contornos Dinámicos Discretos.
SEGMENTACIÓN DE IMÁGENES USANDO MODELOS DEFORMARLES 93
En la tabla 4.3, se muestran algunos resultados encontrados realizando variaciones del
conjunto de parámetros asociados al modelo de Lobregt. Las variaciones se realizan alrededor
de los valores de los factores de peso utilizados en el proceso de deformación mostrado en la
figura 4.16. En esa tabla, se muestran los valores de los factores usados, el número de
iteraciones, en que el modelo alcanza valores de velocidad y aceleración aproximadamente
cero, que corresponde al momento en que el modelo logra un estado de energía estable, y que se
mide con la norma presentada en dicha tabla. Adicionalmente, la tabla 3.3 muestra los valores
asociados al error suma, y a la media de núnima distancia, que se utilizan para cuantificar la
diferencia del contorno encontrado, con respecto a un contorno trazado de forma manual por un
especialista, como el ilustrado en la figura 4.2.
Tabla 4.3. Determinación de los valores de los factores de peso.
Norma e
2.3 0.065 -0.8 31 0.000904 22.63 9.73
2.6 0.065 -0.8 49 0.000259 24.69 10.54
3.2 0.065 -0.8 51 0.000257 25.37 10.78
SEGMENTACIÓN DE IMÁGENES USANDO MODELOS DEFORMARLES 94
Iter Norma e
3.5 0.065 -0.8 55 0.000282 26.00 11.06
2.9 0.005 -0.8 8 0.000511 13.25 6.18
2.9 0.035 -0.8 44 0.000612 19.56 8.74
2.9 0.095 -0.8 19 1.297359 25.14 10.65
2.9 0.125 -0.8 24 10.936638 28.79 11.93
SEGMENTACIÓN DE IMÁGENES USANDO MODELOS DEFORMARLES 95
Iter Norma e(%)
2.9 0.065 -0.2 10 2.379257 36.74
2.9 0.065 -0.5 100 0.669054 27.22
2.9 0.065 -1.1 50 0.000238 22.57
2.9 0.065 -1.4 65 0.000549 21.72
Como se puede observar de la tabla 4.3, la variación de los valores del conjunto de
parámetros, no genera mejores aproximaciones del modelo de Lobregt a la forma ventricular.
Por el contrario, esta variación ha permitido establecer, que bajo ciertos valores de los
parámetros, el proceso de deformación se convierte en oscilatorio y no convergente. Esto se
puede observar para el resultado obtenido cuando ~xt = -0.125, ú}¡nr = 2.9, C4famp = -0.8. La
SEGMENTACIÓN DE IMAGENES USANDO MODELOS DEFORMARLES 96
figura 4.18, muestra una gráfica de la norma en función de las iteraciones, correspondiente al
proceso de deformación .implantado con el conjunto de factores antes señalados.
La figura 4.19, muestra el resultado de aplicar el modelo de Lobregt, a la imagen
ventriculográfica de la figura 4.15.a, utilizando el contorno inicial mostrado en la figura 4.19.a.
El conjunto de parámetros, corresponde a los utilizados en el proceso de deformación descrito
en la figura 4.16. El modelo fmal, figura 4.19.b, se encuentra para una norma igual 0.000445.
El error suma obtenido es igual al24.02 %, mientras que la media de las distancias mínimas es
igual a 10.15.
El modelo encontrado, no logra segmentar de manera apropiada la cavidad ventricular,
solo logra seguir parte del contorno de dicha cavidad. Este contorno, no difiere
considerablemente del encontrado con la aproximación inicial de la figura 4.16.a.
Evolución de los Contornos Dinámicos Discretos 25,--------.---------.---------.--------.---------,
20 ...................................... , ......................................... , ...................... '""""""""'"!""""""""""""""""""" ""!"'"' ............................. ..
15 ............................. """""!"""""""'"""""""'"' ""l""""""""'""""""""""'""l"""'"'""""""'""""""""""'i ................................... .
Norma
10
5
0~------~--------~--------L--------L--------~ o 5 10 15 20 25 iteraciones
Fig. 4.18. Evolución de los Contornos Dinámicos Discretos.
SEGMENTACIÓN DE IMÁGENES USANDO MODELOS DEFORMARLES 97
(a) (b)
Fig. 4.19. Modelo de dinámico discreto de Lobregt.
a) Contorno inicial. b) Contorno resultante.
Una tercera prueba con ventriculogramas reales, del modelo de Lobregt, se puede
observar en la figura 4.20. Los parámetros utilizados, corresponden a los mismos del ejemplo
anterior. Se utiliza un contorno inicial, defmido muy cerca de la cavidad ventricular, obteniendo
un contorno fmal en la iteración número 47, con una norma de 0.000200, y con errores de 23.14
%y 10.55 ..
(a) (b)
Fig. 4.20. Modelo de dinámico discreto de Lobregt.
a) Contorno inicial. b) Contorno resultante.
SEGMENTACIÓN DE IMÁGENES USANDO MODELOS DEFORMARLES 98
Como se pudo observar, en la tabla 4.3, y en las figuras de la 4.16 a la 4.20, el modelo
de Lobregt, tiene considerables fallas en la segmentación de la cavidad ventricular, aunque el
mismo trate de conseguir estados estables de la energía asociada al mismo, estos no
corresponde a un contorno que logre discriminar de forma óptima el ventrículo izquierdo.
Los modelos dinámicos discretos de Steven Lobregt, son modelos deformables que
presentan las siguientes características:
i. Los contornos iniciales deben establecer de forma manual.
ii. Los valores del conjunto de parámetros asociados al modelo, son dificiles de establecer.
Lobregt, no presenta algún proceso sistemático para la escogencia de los mismo. El método
heurístico, utilizado para la determinación de los parámetros de los modelos de Terzopoulos
y Young, no permite determinar de forma sencilla dichos parámetros para este modelo.
iii. El modelo es computacionalmente complejo para su implantación, debido a los múltiples
cambios de sistemas de referencia que es necesario realizar, y que fueron discutidos en la
sección 3.4.2
iv. El modelo es reproducible, es decir, para un mismo conjunto de parámetros, y para distintos
contornos iniciales, los contornos obtenidos, no difieren considerablemente en su forma,
como se puede observar, en las figuras 4.16, 4.19 y 4.20.
v. De las pruebas realizadas con el modelo de Lobregt, tanto para imágenes de objetos como
para ventriculogramas reales, se puede concluir, que el modelo es considerablemente
sensible a los valores asignados a los parámetros asociados al mismo. Valores usados para
modelar formas de imágenes de objetos, no pueden ser utilizados, para extraer la forma
ventricular en imágenes de angiografia cardiaca. De allí, que es recomendable realizar un
estudio detallado que permita establecer un proceso sistemático para la escogencia de los
parámetros del modelo.
SEGMENTACIÓN DE IMÁGENES USANDO MODELOS DEFORMARLES 99
4.5 MODELO DEFORMABLE PROPUESTO
El modelo de contorno activo propuesto, se fundamenta en el trabajo realizado por
Terzopoulos [Kass 87], donde este tipo de modelos es considerado, como un spline de energía
minimizante, tal como han sido definidos en la sección 3.2.1. Su fundamentación se basa, en
que los modelos de contorno activo, pueden ser aplicados como una herramienta eficaz para la
segmentación de imágenes ventriculográficas, debido a que los spline de energía minimizante
poseen la capacidad de encontrar dinámicamente la suavidad y la curvatura, al momento de
ajustarse al borde de la cavidad ventricular.
En el modelo propuesto, la energía asociada, esta formada por energía interna y energía
de imagen, de acuerdo a la siguiente ecuación:
1
E.make = j[Eint{v{s))+E;mage{v{s))]ds Ec. 4.1 o
donde E;m representa la energía interna del spline y E;mage es la energía asociada a las fuerzas de
imagen. La energía interna en nuestro modelo, obedece a la ecuación 4.2, donde ves un arreglo
que contiene las coordenadas de los puntos que conforman al modelo, los subíndices asociados
a dicho arreglo, denotan derivación. Los factores de peso a y p, constituyen los coeficientes de
elasticidad y rigidez asociados a un cuerpo deformable, que son utilizados para ponderar la
suavidad y la curvatura que el modelo activo puede adoptar.
Ec. 4.2
Mientras que la energía de imagen sufre algunas variaciones respecto a lo propuesto por
Terzopoulos, la misma se establece como:
Ec. 4.3
SEGMENTACIÓN DE IMÁGENES USANDO MODELOS DEFORMARLES 100
Esta variación, esta fundamentada en la teoría de detección de bordes propuesta por
Marr y Hildreth en 1980 [Marr 80], donde se establece que los cambios en las intensidades de
una determinada imagen, pueden ser detectados encontrando los máximos ó mínimos de
Gu(x,y)*I(x,y), para una imagen 1 y donde G(x,y) es una distribución Gaussiana de dos
dimensiones. Bajo esta teoría, los cambios en las intensidades pueden ser detectadas
convolucionando la imagen con un operador DoG [Bravo 98], lo cual generaría una imagen de
salida, a la cual habría que buscarle sus máximos o mínimos. Este análisis involucra la
selección de la dirección a la cual debe ser asociada la primera derivada. Esta dirección debe
coincidir con orientación formada localmente por sus máximos o mínimos, siempre que se
cumpla la condición de variación lineal [Haralick 92][Brend 93], la cual establece que la
variación de la intensidad cerca y paralela a la línea del máximo o mínimo debe ser localmente
lineal, según los teoremas B.l y B.2, mostrados en el apéndice B.
La teoría de detección propuesta por Marr y Hildeth, ha sido usada para definir el
funcional de energía de imagen, en modelos deformable aplicados a los procesos de
segmentación de imágenes radiológicas de las manos [Radeva 95a], para la extracción de
características faciales [Radeva 95b], y para el análisis de arterias en angiografía coronaria
[Klein 97].
Los filtros Gaussianos pueden ser implantados por operadores discretos binomiales
[Bravo 98], los cuales convergen rápidamente a una función Gaussiana, por lo tanto, para
valores discretos, la distribución Gaussiana puede ser remplazada por la distribución binomial
[Brend 93], de allí que los filtros Gaussianos no son más que filtros de suavizamiento. La figura
4.21, muestra dos imágenes de objetos a las cuales se les ha aplicado filtros Gaussianos con
desviación estándar igual a 3 e igual a 5. Las figura 4.2l.a y 4.21.d, muestran las imágenes a
procesar. Las figuras 4.2l.b, 4.12.c, 4.12.e, 4.12.f, muestran el proceso de suavizamiento con
distintos filtros Gaussianos, en ellas se puede observar que los contornos de las imágenes
originales pasan a ser borrosos; a medida que se incrementa el valor de la desviación estándar
asociado al filtro, también se incrementa la borrosidad. Adicionalmente, estructuras muy fmas,
pueden llegar a ser suprimidas de la escena. Esta es una técnica, utilizada rutinariamente, en
procesamiento digital de imágenes para suprimir ruido presente en las escenas. Los filtros
SEGMENTACIÓN DE IMÁGENES USANDO MODELOS DEFORMABLES 101
Gaussianos pueden reducir con~iderablemente los niveles de nJ.ido, agregando borrosidad a
algunos detalles contenidos en la imagen. La utilización de este tipo de f¡ltraje, en el modelo
propuesto, pretende aprovechar los efe9tos antes señalados. Se desea que la imagen que defina
el funcioruU de energía de imagen, no posea niveles considerables de ruido, y que sus contornos
se encuentren defmidos en un amplio rango espacial, tratando atenuar las regiones de la imagen
donde no se encuentre cambios bruscos de intensidad.
~ ~ 00 Fig. 4.21. a) Imagen Original. b) Imagen filtrada con a-=3. e) Imagen filtrada con a-=6.
d) Imagen Original. e) Imagen filtrada con a-=3. f) Imagen filtrada con a-~6.
A la imagen suavizada por el filtro Gaussiano, se le aplica un operador basado en
técnicas de gradiente, el cual se va a encargar de enfatizar los bordes de las componentes de la
escena, mientras atenúa los valores de nivel de gris de las regiones casi constantes en la imagen.
Este proceso puede implantarse, al realizar el siguiente procedimiento:
SEGMENTACIÓN DE IMÁGENES USANDO MODELOS DEFORMARLES 102
iii. Calcular de forma independiente los gradientes de la imagen tanto en dirección x como en
dirección y. Para ello, se aplica a la imagen operadores derivativos [Bravo 98], en cada
dirección. Este proceso, genera dos imágenes, Dx y Dy, las cuales van a representar las
componentes del vector gradiente en las dos dimensiones.
iv. Elevar al cuadrado los valores de grises de las dos imágenes resultantes.
v. Sumar estos valores.
vi. Calcular la raíz cuadrada de la suma.
El cálculo del gradiente debe realizarse, tal que, su sensibilidad frente a la presencia de
ruido sea considerablemente baja, ya que existe la posibilidad, de que la imagen suavizada por
el operador Gaussiano contenga componentes de ruido, que el mismo no ha podido eliminar.
Por ello, se utiliza como operador gradiente el propuesto por Pipelier [Pipelier 97], donde las
componentes del gradiente en las direcciones x e y son calculadas según las máscaras mostradas
en la figura 4.22.
o -1 o 1 o o -1 -1 -1 o -1 -2 o 2 1 -1 -2 -2 -2 -1
G = X -1 -2 o 2 1 G = y o o o o o -1 -2 o 2 1 2 2 2 1 o -1 o 1 o o 1 o
Fig. 4.22. Máscaras usadas para el cálculo del gradiente.
La figura 4.23, muestra el proceso para la determinación del funcional de energía de
imagen del modelo propuesto, aplicado a una imagen sintética. A la imagen original, figura
4.23.a, se le aplica un filtro Gaussiano de desviación estándar igual a tres (3), este resultado se
muestra en la figura 4.23.b. La imagen suavizada, es tratada con las máscaras de convolución
[Medina 95a] del operador gradiente propuesto por Pipelier, obteniendo las imágenes que
defmen las componentes del vector gradiente, éstas se pueden observar, en las figuras 4.23.c, y
4.23.d, respectivamente. Una vez obtenidas las componentes tanto en el eje x como en eje y, del
gradiente, se calcula el módulo del mismo, resultado este mostrado en la figura 4.23.e. Este
proceso, como se puede observar, genera componentes del gradiente de la imagen, que
establecen en un rango espacial bastante amplio, los cambios de niveles que definen, los
SEGMENTACIÓN DE IMÁGENES USANDO MODELOS DEFORMARLES 103
contornos de las formas contehidas en la escena, así como también, atenúa considerablemente,
las regiones de intensidades estables de la imagen.
~ ~ ~ Fig. 4.23. a) Imagen Original. b) Imagen filtrada con Gaussiano de cr = 3. e) Gradiente en
dirección x. d) Gradiente en dirección y. e) Módulo del Gradiente.
Por su parte, la figura 4.24, muestra el proceso aplicado a la imagen de la figura 4.23,
pero a una imagen en fase diastólica del ventrículo izquierdo. A la imagen ventricular, figura
4.24.a, se le aplica un filtro Gaussiano con cr = 3, con la fmalidad de eliminar el ruido presente
en la misma, y que se genera por distintas fuentes, como por ejemplo, ruido generado por el
sistema de generación, y movimiento involuntario del paciente, cuyas distribuciones no
necesariamente siguen una distribución Gaussiana, por otra parte, el filtro permite ampliar la
ubicación espacial del contorno ventricular. Las componentes del gradiente de la imagen, se
muestran en las figuras 4.24.c y 4.24.d, en ellas se puede observar la defmición del contorno
ventricuÍar en las direcciones x e y, pero también se realzan ciertas estructuras que no
pertenecen al objeto que se desea extraer. Por su parte, la figura 4.24.e, muestra el modulo del
gradiente de la imagen ventricular, donde se puede realmente observar, donde comienza a
delimitarse la cavidad ventricular. Adicionalmente, en la imagen del modulo del gradiente,
SEGMENTACIÓN DE IMÁGENES USANDO MODELOS DEFORMARLES 104
también se pueden observar las distíntas estructuras, que no pudieron ser elimínadas por el filtro
de suavizamiento.
~ ~ 00 Fig. 4.24. a) Ventrículo izquierdo en diástole. b) Imagen filtrada con Gaussiano de cr = 3. e)
Gradiente en dirección x. d) Gradiente en dirección y. e) Módulo del Gradiente.
Brend [Brend 93], propone, que el módulo del gradiente, se aproxime como la suma de
los módulos de cada una de las componentes. Esta aproximación no se realiza en el modelo
propuesto, ya que se trata de buscar la forma de mínimizar los errores de cálculo numérico que
se puedan presentar en la implantación del mismo.
El proceso de mínimización, asociado a los modelos de cuerpos deformables, constituye
un problema matemático íncluido en el Cálculo Variacional [Mikhlin 64][Washizu 68]. Los
funcionales que forman al modelo de contorno activo propuesto, se visualizan cbmo
funcionales de energía, donde cada uno de dichos funcionales, se generan sobre cada punto del
modelo, por la aplicación de fuerzas en cada uno los mismos. Es decir, la primitiva matemática
asociada a los funcionales del problema variacional, puede ser representada fisicamente, por las
fuerzas que íntervienen en el modelo. El problema de encontrar, las fun-ciones mínimas
asociadas al modelo variacional, ha sido propuesto por Terzopoulos [Kass 97], y conlleva a
SEGMENTACIÓN DE IMÁGENES USANDO MODELOS DEFORMARLES 105
resolver un sistema de ecuaciones diferenciales independientes, el cual esta compuesto, por las
ecuaciones de Euler-Lagrange. En nuestro modelo, cada uno de sus términos independientes
puede ser considerado, como una fuerza, recordando que la energía asociada a un cuerpo, se
genera por medio las fuerzas aplicadas al mismo [Malverm 69]. En tal sentido, el modelo
propuesto, busca aquellas posiciones que permiten alcanzar los estados donde la energía
asociada al mismo, sea la mínima, y que evidentemente se encontrará, en el instante de tiempo
donde la fuerza total aplicada a la curva se anule o adopte un estado estable.
El proceso dinámico de deformación del modelo propuesto se basa en el trabajo de
Lobregt [Lobregt 95], donde las deformaciones son controladas por las reglas básicas de la
fisica (ecuaciones 3.39, 3.40, 3.41). La primera de tales reglas, corresponde a la primera Ley de
Newton, donde:
f=ma Ec. 4.4
Como el modelo se considera un modelo discreto, la ecuación 4.4, puede asociarse a
cada punto V; que forma al modelo, según la ecuación 4.5.
Ec. 4.5
A diferencia del trabajo de Lobregt, nuestro modelo activo, la fuerza esta básicamente
constituido por tres (3) componentes: una que se va a encargar de establecer la suavidad que el
cuerpo deformable debe adquirir (fsuavidad), otra que establece los niveles de curvatura que el
cuerpo deformado asumirá (fcurvatura), y una última, encargada de que la curva se deforme hasta
alcanzar una característica de la imagen, que en nuestro modelo, está constituida por el
contorno del objeto contenido en la imagen, que se quiere extraer (fimagen)- Como se había
señalado, las dos primeras componentes, se corresponden con los primeros dos términos de la
ecuación de Euler-Lagrange, ecuación 3.11, y se pueden observar en la ecuación 4.6. Mientras
que la fuerza de imagen, está dada por el gradiente de una imagen, que resulta de aplicar la
teoría de Marr y Hilderth, y que se analizó en los párrafos anteriores, ecuación 4.7.