Post on 28-Sep-2020
UNIVERSIDAD DE GRANADA
E.T.S. DE INGENIERÍA INFORMÁTICA
Departamento de Cien ias de la Computa ión
e Inteligen ia Arti� ial
Desarrollo de un modelo omputa ional de
representa ión de imágenes y su apli a ión
a la sele ión de es alas naturales y al
ál ulo de medidas de distorsión
TESIS DOCTORAL
JAVIER MARTÍNEZ BAENA
Granada, Marzo de 1999
Desarrollo de un modelo omputa ional de
representa ión de imágenes y su apli a ión
a la sele ión de es alas naturales y al
ál ulo de medidas de distorsión
MEMORIA QUE PRESENTA
Javier Martínez Baena
PARA OPTAR AL GRADO DE DOCTOR EN INFORMÁTICA
Marzo de 1999
DIRECTORES
JOSE ANTONIO JOAQUÍN
GARCÍA SORIA FERNÁNDEZ VALDIVIA
DEPARTAMENTO DE CIENCIAS DE LA COMPUTACIÓN
E INTELIGENCIA ARTIFICIAL
E.T.S. de Ingeniería Informáti a Universidad de Granada
La memoria titulada Desarrollo de un modelo omputa ional de repre-
senta ión de imágenes y su apli a ión a la sele ión de es alas naturales
y al ál ulo de medidas de distorsión, que presenta D. Javier Martínez Baena
para optar al grado de Do tor, ha sido realizada en el Departamento de Cien ias
de la Computa ión e Inteligen ia Arti� ial de le Universidad de Granada bajo la
dire ión de los do tores D. Joaquín Fernández Valdivia y D. Jose Antonio Gar ía
Soria.
Granada, Marzo de 1999.
El Do torando: Los Dire tores:
Fdo. J. Martínez Baena Fdo. J. Fdez. Valdivia Fdo. J. A. Gar ía
AGRADECIMIENTOS
Quisiera expresar mi gratitud ha ia todos aquellos que han he ho posible el de-
sarrollo de esta Tesis, espe ialmente a los que la han estado supervisando desde que
empezó a gestarse hasta que vió la luz, a Joaquín y Jose Antonio.
Igualmente quiero dedi ar este trabajo a otros que también lo han he ho posible,
aunque de forma distinta: a mis padres y a mi hermano. A unos por soportarme
durante varios años y al otro por a� ionarme a estas osas de la té ni a. También
quiero agrade er a M
a
Ángeles su apoyo, que ha he ho más soportable esta tarea, que
aunque tiene sus satisfa iones también tiene sus desespera iones. Por supuesto, no
puede faltar aquí una espe ial men ión a esa entrañable (... on el tiempo) entidad,
ono ida omo El Despa ho (aunque tiene otros sinónimos), a la que tantos ratos
agradables le debo y que de vez en uando toma aires gallegos.
Finalmente, y no por ello on menos intensidad, he de agrade er la ayuda que
obtenido de todos mis ompañeros del grupo de investiga ión de Análisis de Imágenes
Digitales y sus Apli a iones y, en general, de todo el Departamento de Cien ias de
la Computa ión e Inteligen ia Arti� ial de la Universidad de Granada.
Las publi a iones [80℄, [77℄, [82℄, [78℄, [81℄, [79℄, [83℄ y [30℄ han visto la luz omo
onse uen ia de parte de la investiga ión realizada en esta Tesis Do toral.
Quiero expresar mi agrade imiento al proye to TIC97-1150 por la aporta ión de
fondos y medios materiales para la realiza ión de esta Tesis.
a M
a
Ángeles,
Ángela y María
Índi e General
Agrade imientos vii
Índi e General xi
Lista de Tablas xiii
Lista de Figuras xvi
1 Introdu ión 1
1.1 El Sistema Visual Humano . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Objetivos de la memoria . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3 Des rip ión por apítulos . . . . . . . . . . . . . . . . . . . . . . . . 5
2 Modelo de representa ión de imágenes propuesto 7
2.1 Introdu ión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 Parti ión del espe tro de fre uen ias . . . . . . . . . . . . . . . . . . 11
2.2.1 Sele ión de sensores a tivos . . . . . . . . . . . . . . . . . . . 15
2.3 Modeliza ión de los ampos re eptivos . . . . . . . . . . . . . . . . . 21
2.4 Resumen del modelo de representa ión propuesto . . . . . . . . . . . 28
3 Dete ión de es alas globales 31
3.1 Dete ión de es alas signi� ativas . . . . . . . . . . . . . . . . . . . . 33
3.1.1 Fun iones de enfoque . . . . . . . . . . . . . . . . . . . . . . . 33
3.1.2 Resultados experimentales . . . . . . . . . . . . . . . . . . . . 37
3.1.2.1 Imagen sintéti a . . . . . . . . . . . . . . . . . . . . 37
3.1.2.2 Imagen biomédi a . . . . . . . . . . . . . . . . . . . 42
3.1.2.3 Imagen astronómi a . . . . . . . . . . . . . . . . . . 47
3.1.3 Robustez frente al ruido . . . . . . . . . . . . . . . . . . . . . 51
3.1.4 Comentarios �nales . . . . . . . . . . . . . . . . . . . . . . . . 56
xi
xii Índice General
3.2 Compara ión on otros métodos de autoenfoque . . . . . . . . . . . . 57
3.2.1 Autoenfoque en el dominio espa ial . . . . . . . . . . . . . . . 57
3.2.2 Autoenfoque en el dominio fre uen ial . . . . . . . . . . . . . 59
3.2.3 Compara ión de resultados . . . . . . . . . . . . . . . . . . . 59
3.3 Con lusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4 Dete ión de es alas naturales lo ales 73
4.1 Método de dete ión de es alas lo ales . . . . . . . . . . . . . . . . . 74
4.1.1 Dete ión de puntos de interés . . . . . . . . . . . . . . . . . 75
4.1.2 Determina ión de las es alas lo ales sobre los puntos de interés 76
4.2 Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . 77
4.2.1 Imagen biomédi a . . . . . . . . . . . . . . . . . . . . . . . . 77
4.2.2 Es ena natural . . . . . . . . . . . . . . . . . . . . . . . . . . 81
5 Desarrollo de una Medida de Distorsión Per eptual 85
5.1 Medidas existentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
5.1.1 Medidas lási as no per eptuales . . . . . . . . . . . . . . . . 87
5.1.2 Medidas per eptuales . . . . . . . . . . . . . . . . . . . . . . 89
5.2 Medida de distorsión per eptual . . . . . . . . . . . . . . . . . . . . . 90
5.3 Experimento de enmas aramiento . . . . . . . . . . . . . . . . . . . . 94
5.4 Efe to de pixelado . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
5.5 Distinguibilidad de objetos . . . . . . . . . . . . . . . . . . . . . . . . 102
5.5.1 Ordena ión de imágenes en base a la visibilidad de objetos
presentes en ellas . . . . . . . . . . . . . . . . . . . . . . . . . 103
5.5.2 Predi ión de la distinguibilidad visual de objetos . . . . . . . 107
5.5.3 Ordena ión de imágenes de la base de datos del TNO HFRI . 111
5.5.4 Búsqueda visual . . . . . . . . . . . . . . . . . . . . . . . . . 115
5.6 Evalua ión de la alidad de imágenes omprimidas . . . . . . . . . . 115
5.6.1 Rela ión entre la medida de distorsión d
1
y el fa tor de alidad
de ompresión . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
5.6.2 Experimento 2 . . . . . . . . . . . . . . . . . . . . . . . . . . 122
5.6.3 Rela ión entre la alidad visual de imágenes omprimidas y la
onspi uidad visual . . . . . . . . . . . . . . . . . . . . . . . . 124
Con lusiones y líneas futuras 129
A Nota ión 131
Índice General xiii
B Fun iones gaussianas y Gabor 133
B.1 Fun iones gaussianas . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
B.2 Fun iones de Gabor . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
Bibliografía 137
Índi e de Materias 149
xiv Índice General
Índi e de Tablas
2.1 Campos re eptivos y respuestas de las élulas de un anal orti al. . 25
3.1 Parámetros de los sensores a tivos de la imagen sintéti a. . . . . . . 38
3.2 Es alas signi� ativas dete tadas por ada uno de los riterios estudia-
dos para los sensores a tivos de la imagen sintéti a. . . . . . . . . . . 38
3.3 Parámetros de los sensores a tivos de la imagen biomédi a de la �gura
3.5. Para ada sensor S (�las) se muestra la fre uen ia radial mínima
S
rmin
, la fre uen ia radial máxima S
rmax
, el ángulo mínimo S
amin
y
el ángulo máximo S
amax
. Las fre uen ias se dan en i los por pixel
( pp) y los ángulos en grados. . . . . . . . . . . . . . . . . . . . . . . 43
3.4 Es alas de la imagen biomédi a obtenidas para ada sensor y on los
uatro riterios de enfoque. . . . . . . . . . . . . . . . . . . . . . . . 43
3.5 Parámetros de los sensores a tivos de la imagen astronómi a. . . . . 47
3.6 Es alas signi� ativas dete tadas por ada uno de los riterios estudia-
dos para los sensores a tivos de la imagen astronómi a. . . . . . . . . 49
3.7 Es alas signi� ativas de la imagen sintéti a obtenidas por los tres mé-
todos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.8 Parámetros de los sensores a tivos de la imagen natural. Las tres
últimas olumnas muestran las es alas obtenidas por ada uno de los
métodos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
4.1 Parámetros de los sensores a tivos dete tados para la imagen biomé-
di a junto on la es ala global de ada uno de ellos. . . . . . . . . . . 79
4.2 Parámetros de los sensores a tivos de la es ena natural junto on las
es alas dete tadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
5.1 Valores de RMSE y d
1
entre la imagen original y ada una de las
imágenes on ruido uniforme de la �gura 5.3. . . . . . . . . . . . . . 95
xv
xvi Índice de Tablas
5.2 Valores de RMSE y d
1
entre la imagen original y ada una de las
imágenes on ruido no uniforme de la �gura 5.4. . . . . . . . . . . . . 95
5.3 Valores de las medidas de distorsión entre la imagen original (Einstein)
y las imágenes pixeladas. . . . . . . . . . . . . . . . . . . . . . . . . . 100
5.4 Valores de las medidas de distorsión entre la imagen original (es ena
de los bar os) y las imágenes pixeladas. . . . . . . . . . . . . . . . . 100
5.5 Valores de las medidas de distorsión y ordena iones para las parejas
de imágenes de la �gura 5.10. . . . . . . . . . . . . . . . . . . . . . . 107
5.6 Datos de las 17 imágenes de la base de datos del TNO HFRI. Para
ada imagen se muestra el luster al que pertene e y las tres ordena-
iones onsideradas: subjetiva, RMSE y d
1
. También se muestran
los valores del área que hay por debajo de la urva de probabilidad de
dete ión a umulada y de las otras dos medidas usadas. . . . . . . . 112
5.7 Tasas de error de d
1
y RMSE en los sub onjuntos sele ionados. . . 114
5.8 Valores de las medidas de distorsión d1 y RMSE entre la imagen ori-
ginal de la �gura 5.18 y ls misma imagen omprimida mediante el
algoritmo JPEG on fa tores de alidad (qf ) entre 1 y 99. . . . . . . 121
5.9 Valores de las medidas de distorsión entre la imagen original y las
imágenes omprimidas. . . . . . . . . . . . . . . . . . . . . . . . . . . 124
Índi e de Figuras
1.1 Corte transversal del ojo y organiza ión elular de la retina. . . . . . 2
1.2 Se ión transversal del erebro que muestra el amino que sigue la
informa ión visual. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Esquema de desarrollo de la Tesis. . . . . . . . . . . . . . . . . . . . 5
2.1 Diferentes rosetas propuestas por varios autores. (A) Daugman. (B)
Ebrahimi y Kunt. (C) Watson. (D) Navarro. . . . . . . . . . . . . . 9
2.2 Per�l 3D de una fun ión de Gabor on simetría par. (A) en el dominio
espa ial y (B) en el dominio fre uen ial. . . . . . . . . . . . . . . . . 11
2.3 Parti ión del espe tro en bandas de orienta ión. Izquierda: Imagen
de referen ia. Dere ha: espe tro de la imagen suavizada a es ala 1 y
la parti ión en uatro bandas de orienta ión. . . . . . . . . . . . . . . 13
2.4 (A) Índi e de antialiasing obtenido sobre la banda B
0
de la imagen de
la �gura 2.3. (B) Los anales para esta banda serían ada uno de los
intervalos entre máximos y mínimos alternativos de la segunda derivada. 15
2.5 Ejemplo del ál ulo de la parti ión multisensor sobre una imagen digital. 16
2.6 Sele ión de sensores a tivos. . . . . . . . . . . . . . . . . . . . . . . 20
2.7 Modelos de ampo re eptivo propuestos por De Valois et al.. (A)
Suma de 2 gaussianas. (B) Suma de 3 gaussianas. (C) Modelo de
entro on entrado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.8 Per�les 3D de fun iones Gabor on diferentes simetrías y desfases. (A)
Simetría par. (B) Simetría impar. (C) Simetría par on desfase de
180
Æ
. (D) Simetría impar on desfase de 180
Æ
. . . . . . . . . . . . . . 24
2.9 Fila superior: per�l 2D de las respuestas orrespondientes a las 4
élulas simples que forman un anal orti al. Fila inferior: resultado
de apli ar la re ti� a ión de media onda (RMO). . . . . . . . . . . . 26
3.1 (A) Imagen sintéti a. (B) Sensores a tivos. . . . . . . . . . . . . . . 38
xvii
xviii Índice de Figuras
3.2 Fun iones de autoenfoque para los sensores de la imagen sintéti a.
En la primera olumna están las fun iones orrespondientes al riterio
de la Varianza, en la segunda las de Tenengrad, en la ter era las de
Brenner y en la uarta las del Gradiente Cuadráti o. . . . . . . . . . 39
3.3 Es alas dete tadas on el riterio de Brenner. . . . . . . . . . . . . . 41
3.4 Algunas de las es alas dete tadas on el riterio de la varianza. . . . 42
3.5 (A) Imagen biomédi a. (B) Sele ión de sensores a tivos. . . . . . . . 42
3.6 Fun iones de autoenfoque de la imagen biomédi a para los riterios
de la Varianza y Tenengrad. . . . . . . . . . . . . . . . . . . . . . . . 44
3.7 Fun iones de autoenfoque de la imagen biomédi a para los riterios
de Brenner y Gradiente uadráti o. . . . . . . . . . . . . . . . . . . . 45
3.8 Imagen biomédi a �ltrada de a uerdo a distintos sensores a tivos y
algunas de las es alas signi� ativas dete tadas. (A) Sensor S
0
, � = 3.
(B) Sensor S
1
, � = 4:5. (C) Sensor S
1
, � = 13. (D) Sensor S
2
, � = 2.
(E) Sensor S
2
, � = 7:5. (F) Sensor S
3
, � = 3:5. (G) Sensor S
3
, � = 9.
(H) Sensor S
4
, � = 3:5. (I) Sensor S
5
, � = 8:5. . . . . . . . . . . . . 46
3.9 (A) Imagen astronómi a. (B) Sensores a tivos. . . . . . . . . . . . . 47
3.10 Fun iones de autoenfoque para los sensores S
0
, S
1
, S
3
, S
7
y S
8
de
la imagen astronómi a. En la primera olumna están las fun iones
orrespondientes al riterio de la Varianza, en la segunda las de Te-
nengrad, en la ter era las de Brenner y en la uarta las del Gradiente
Cuadráti o. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.11 Imagen astronómi a �ltrada de a uerdo a distintos sensores a tivos y
algunas de las es alas signi� ativas dete tadas. (A) Sensor S
0
, � =
3:5. (B) Sensor S
1
, � = 5:5. (C) Sensor S
1
, � = 12:5. (D) Sensor S
3
,
� = 2. (E) Sensor S
3
, � = 6. (F) Sensor S
6
, � = 9. (G) Sensor S
7
,
� = 7:5. (H) Sensor S
7
, � = 3. (I) Sensor S
7
, � = 11. . . . . . . . . . 50
3.12 Imagen biomédi a on diferentes niveles de ruido. . . . . . . . . . . . 52
3.13 Evolu ión de las es alas de la imagen biomédi a en presen ia de ruido. 53
3.14 Imagen sintéti a on diferentes niveles de ruido. . . . . . . . . . . . . 54
3.15 Evolu ión de las es alas de la imagen sintéti a en presen ia de ruido. 55
3.16 Imagen sintéti a suavizada a las distintas es alas obtenidas on ada
uno de los métodos sobre el sensor S
0
. (A) Área que ubre el sensor
S
0
. (B.1) � = 4:5. (C.1) � = 1. (C.2) � = 3. . . . . . . . . . . . . . . 61
3.17 Imagen sintéti a suavizada a las distintas es alas obtenidas on ada
uno de los métodos sobre el sensor S
1
. (A) Área que ubre el sensor
S
1
. (B.1) � = 4:5. (C.1) � = 1. (C.2) � = 3. . . . . . . . . . . . . . . 62
Índice de Figuras xix
3.18 Imagen sintéti a suavizada a las distintas es alas obtenidas on ada
uno de los métodos sobre el sensor S
2
. (A) Área que ubre el sensor
S
2
. (B.1) � = 5. (C.1) � = 1. (C.2) � = 3. . . . . . . . . . . . . . . . 63
3.19 Imagen sintéti a suavizada a las distintas es alas obtenidas on ada
uno de los métodos sobre el sensor S
3
. (A) Área que ubre el sensor
S
3
. (B.1) � = 4:5. (C.1) � = 1. (C.2) � = 3:5. . . . . . . . . . . . . . 64
3.20 Imagen sintéti a suavizada a las distintas es alas obtenidas on ada
uno de los métodos sobre el sensor S
4
. (A) Área que ubre el sensor
S
4
. (B.1) � = 18. (C.1) � = 1. (C.2) � = 14:5. . . . . . . . . . . . . 65
3.21 Re onstru ión de la imagen sintéti a usando la informa ión aso iada
a los sensores a tivos para la representa ión (A) en el dominio espa ial,
(B) en el dominio fre uen ial, (C) en el dominio de Gabor. . . . . . . 66
3.22 (A) Es ena natural. (B) Sensores a tivos dete tados para la es ena
natural. (C) Re onstru ión de la imágen original usando el método
basado en la representa ión en el dominio de Gabor. . . . . . . . . . 67
3.23 Es ena natural �ltrada para los sensores (A) S
2
, (B) S
3
, (C) S
4
, (D)
S
15
y (E) S
19
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
3.24 (A) Imagen �ltrada on el sensor S
15
usando la es ala dete tada por el
método basado en la representa ión fre uen ial. (B) Imagen �ltrada
on el sensor S
15
usando la es ala dete tada por el método basado en
la representa ión espa ial. . . . . . . . . . . . . . . . . . . . . . . . . 70
4.1 (A) Imagen biomédi a, (B) Parti ión multi anal, (C) Sensores a tivos,
(D) Re onstru ión usando el método presentado en la se ión 5. . . 78
4.2 Muestra de los ál ulos para los sensores (A) S
1
, (B) S
11
y (C) S
3
.
La primera �la muestra la región del espe tro re ogida por el sensor.
La segunda �la muestra el mapa de energía lo al. En la ter era están
superpuestos los máximos (más os uros) y mínimos (más laros) de
los mapas de energía lo al. La uarta �la muestra las regiones de
in�uen ia W (x; y) de los máximos. En la última �la se puede ver un
histograma que muestra en el eje verti al la fre uen ia de apari ión de
ada una de las es alas lo ales dete tadas (eje horizontal). . . . . . . 80
4.3 (A) Es ena natural. (B) Sele ión de sensores a tivos. . . . . . . . . 81
4.4 (A) Sensor S
1
. (B) Mapa de energía lo al. (C) Máximos del mapa
de energía lo al. (D) Zonas de in�uen ia de los máximos lo ales. (E)
Representa ión 3D de las es alas lo ales. (F) Histograma de es alas
lo ales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
xx Índice de Figuras
4.5 (A) Sensor S
2
. (B) Mapa de energía lo al. (C) Máximos del mapa
de energía lo al. (D) Zonas de in�uen ia de los máximos lo ales. (E)
Representa ión 3D de las es alas lo ales. (F) Histograma de es alas
lo ales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
4.6 (A) Sensor S
3
. (B) Mapa de energía lo al. (C) Máximos del mapa
de energía lo al. (D) Zonas de in�uen ia de los máximos lo ales. (E)
Representa ión 3D de las es alas lo ales. (F) Histograma de es alas
lo ales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
5.1 Esquema general de la medida de distorsión. . . . . . . . . . . . . . . 92
5.2 (A) Imagen sintéti a usada en el experimento de enmas aramiento.
(B) Parti ión multisensor y sensores a tivos dete tados. . . . . . . . 94
5.3 Imágenes obtenidas añadiendo ruido normal uniforme a la imagen de
la �gura 5.2(A). Las desvia iones estandar de ada una de las imágenes
son (A) � = 10. (B) � = 20. (C) � = 30. (D) � = 45. (E) � = 55.
(F) � = 70. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
5.4 Imágenes obtenidas añadiendo ruido normal no uniforme a la imagen
de la �gura 5.2(A). El ruido se ha apli ado sólo sobre algunas zonas
de la imagen (idénti as para todas las imágenes). Las desvia iones
estandar de ada una de las imágenes son (A) � = 15. (B) � = 30.
(C) � = 50. (D) � = 65. (E) � = 95. (F) � = 120. . . . . . . . . . . 97
5.5 Grá� a omparativa de la medida d
1
(eje verti al) frente a RMSE
(eje horizontal). La línea dis ontínua muestra la omparativa para las
imágenes on ruido uniforme y la ontínua para las de ruido no-uniforme. 98
5.6 (A) Imagen original. (B) Imagen pixelada 8x8. (C) Imagen pixelada
12x12. (D) Imagen pixelada 16x16. . . . . . . . . . . . . . . . . . . . 99
5.7 (A) Parti ión multisensor de la imagen original de la �gura 5.6 (Eins-
tein). (B) Sensores a tivos. . . . . . . . . . . . . . . . . . . . . . . . 100
5.8 (A) Imagen original. (B) Imagen pixelada 8x8. (C) Imagen pixelada
12x12. (D) Imagen pixelada 16x16. . . . . . . . . . . . . . . . . . . . 101
5.9 (A) Parti ión multisensor de la imagen original de la �gura 5.8 (es ena
de los bar os). (B) Sensores a tivos. . . . . . . . . . . . . . . . . . . 102
5.10 6 parejas de imágenes usadas en el experimento de dete ión de ob-
jetos. Cada pareja onsta de una es ena natural va ía (dere ha) y la
misma es ena on un objeto en el entro (izquierda). (Continúa en
la figura 5.11). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
5.11 (Continua ión de la figura 5.10). . . . . . . . . . . . . . . . . . 105
Índice de Figuras xxi
5.12 Parti ión del espe tro de la imagen on objeto de la pareja A de la
�gura 5.10 y re onstru ión de la imagen usando la e ua ión 5.12. . . 106
5.13 Ordena iones de mejor a peor visibilidad de las imágenes de la �gura
5.10. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
5.14 Muestra de las imágenes de la base de datos del TNO HFRI. (A) n
o
34, (B) n
o
20, (C) n
o
36, (D) n
o
29, (E) n
o
15, (F) n
o
32. . . . . . . . 109
5.15 Rela ión entre la medida omputa ional d1 y la medida psi ofísi a de
distinguibilidad visual. . . . . . . . . . . . . . . . . . . . . . . . . . . 110
5.16 Fun iones de distribu ión teóri as del tiempo de dete ión para las 17
imágenes de la base de datos. Con un ír ulo se indi an los lusters
dete tados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
5.17 Rela ión entre la medida d
1
y el tiempo medio de búsqueda. La línea
ontínua representa el ajuste por mínimos uadrados. . . . . . . . . . 116
5.18 Muestra de las imágenes usadas en el experimento (1). En la esqui-
na superior izquierda está la imagen original y el resto son imágenes
omprimidas on el algoritmo JPEG a distintos niveles de alidad
(80,40,30,25,20). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
5.19 Muestra de las imágenes usadas en el experimento (2). Imágenes
omprimidas on el algoritmo JPEG a distintos niveles de alidad
(17,14,11,8,5,2). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
5.20 Comparativa entre los valores de las medidas de distorsión d1 y RMSE
frente al fa tor de alidad del algoritmo de ompresión JPEG. . . . . 120
5.21 Derivadas de las fun iones de la �gura 5.20. . . . . . . . . . . . . . . 122
5.22 (A) Imagen de una mamografía. (B) Mamografía omprimida on un
fa tor de alidad de 80. (C) Mamografía omprimida on un fa tor de
alidad de 20. (D) Mamografía omprimida on un fa tor de alidad
de 10. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
5.23 (A) Parti ión multisensor de la mamografía. (B) Sensores a tivos
dete tados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
5.24 Primera pareja de imágenes. (A) Imagen original on objeto. (E)
Imagen original sin objeto. (B), (C), (D) Imagen (A) omprimida a
niveles de alidad de 10, 9 y 5 respe tivamente. (F), (G), (H) Imagen
(E) omprimida on fa tores de alidad 10, 9 y 5 respe tivamente. . 125
5.25 Segunda pareja de imágenes. (A) Imagen original on objeto. (E)
Imagen original sin objeto. (B), (C), (D) Imagen (A) omprimida a
niveles de alidad de 10, 9 y 8 respe tivamente. (F), (G), (H) Imagen
(E) omprimida on fa tores de alidad 10, 9 y 8 respe tivamente. . 126
xxii Índice de Figuras
5.26 Rela ión entre la métri a d1 y el fa tor de alidad (A) para la primera
pareja y (B) para la segunda pareja (B). . . . . . . . . . . . . . . . . 127
5.27 Rela ión entre la métri a d1 y la medida psi ofísi a de dintinguibilidad
para la primera pareja (línea ontínua) y para la segunda pareja (línea
dis ontínua). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
B.1 Obten ión de una gaussiana 3D on orienta ión a partir de dos gaus-
sianas 2D orientadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
B.2 Muestra de fun iones gaussianas on diferentes parámetros. . . . . . 135
Capítulo 1
Introdu ión
1.1 El Sistema Visual Humano
El pro eso que se desen adena desde que una señal luminosa atraviesa la órnea hasta
que se produ e algún tipo de per ep ión en el erebro es muy largo aunque o urre
de forma asi instantánea. Esta señal lumíni a sufre una serie de transforma iones
durante el pro eso que ha en posible que seamos apa es de re ono er objetos.
El sistema visual humano (SVH) es bastante omplejo y aún hoy día no es om-
prendido en su totalidad, aunque se ono en iertos aspe tos. Por ejemplo, algo que
pare e laro, sin entrar en ex esivo detalle, son las etapas que sigue el pro eso de
per ep ión visual:
✮ Forma ión de la imagen en la retina. La luz re�ejada por los objetos del mundo
exterior es proye tada en la retina.
✮ Codi� a ión de la imagen retinal y transmisión al órtex visual.
✮ Representa ión. La imagen odi� ada es pro esada por los distintos grupos de
neuronas que hay en el órtex erebral. En este nivel se realizan algunas tareas
simples omo dete ión, dis rimina ión o re ono imiento de formas simples.
✮ Interpreta ión de la imagen. Esta es sin duda la etapa más ompleja, quizá
por ser la menos ono ida. Esta fase se podría onsiderar omo la auténti a
fase de per ep ión de la imagen retinal ya que es ahora uando el erebro
aso ia propiedades per eptuales a las sensa iones presentes en la imagen ( olor,
movimiento, formas, ...).
La estru tura �siológi a del ojo se puede ver en la �gura 1.1. Una vez que la luz
atraviesa la órnea, el humor a uoso, el ristalino y el humor vítreo, esta es proye tada
1
2 Capítulo 1. Introducción
������������������������������������������������������������������������������������������������������������������������������������
��������������������������������������������������������������������������������������������������������������������������������
������������������������������������������������
������������������������������������������������
������������������������
����
��������������
��������������
������������
������������
��������������������
��������������������
������������������
������������������
������
������
������������
������������
Córnea
Cristalino
Humor acuoso
Nervio óptico
Energía eléctrica
Energía luminosa
Retina
Fóvea
BastonesBipolares
AmacrinasHorizontales
Conos
Ganglionares
Humor vítreo
Figura 1.1: Corte transversal del ojo y organiza ión elular de la retina.
sobre la retina, que no es más que una apa de élulas fotorre eptoras, situada en
la parte posterior del ojo, y que está ompuesta de distintos tipos de neuronas,
ada una de los uales tiene un ometido diferente. Estas élulas onvierten la
informa ión lumíni a en señales elé tri as que pueden ser interpretadas o pro esadas
por el erebro.
Aunque en la retina la luz in ide sobre las élulas ganglionares, ama rinas, bi-
polares, horizontales y onos y bastones, por ese orden, el lugar donde empieza a
ser transformada es en estos últimos, las llamadas élulas fotorre eptoras. Esto es
posible debido a que las que están por delante de ellas son transparentes y, por tan-
to, dejan pasar la luz. Los bastones son las élulas que se en argan de la visión en
ondi iones pobres de ilumina ión y son muy numerosos (sobre 100 millones). Están
presentes en toda la retina ex epto en la fóvea y en el llamado punto iego que es la
zona desde donde parte el nervio ópti o ha ia el interior del erebro y en el que no
hay ningún tipo de élula fotorre eptora. Los onos son bastante menos numerosos
(unos 5 millones) y están on entrados en la fóvea, dejando el resto de la retina
bastante despoblada. Estos son los en argados de la visión en buenas ondi iones de
ilumina ión. La fóvea es el punto entral donde se proye tan las imágenes. En este
punto es donde se tiene una mayor agudeza visual debido a la presen ia masiva de
onos.
En de�nitiva, la tarea de las élulas fotorre eptoras onsiste en onvertir los
1.1. El Sistema Visual Humano 3
Nervio óptico
LGN
Córtex visual
Retina
Figura 1.2: Se ión transversal del erebro que muestra el amino que sigue la informa ión
visual.
estímulos luminosos que impa tan en la retina en señales elé tri as que serán trans-
portadas ha ia otras zonas del erebro mediante las élulas ganglionares que son las
en argadas de dirigir estos impulsos nerviosos ha ia el nervio ópti o. Estos impulsos
sufren iertas transforma iones a su paso por las élulas ama rinas, horizontales y
bipolares [42℄[107℄.
Tras salir del ojo, estos impulsos pasan por diferentes estru turas erebrales, omo
el LGN, antes de llegar a la zona del erebro donde es pro esada la informa ión visual
(�gura 1.2). La zona donde llegan estas señales, situada en la parte posterior del
erebro, se denomina órtex estriado. Más on retamente, el lugar donde se pro esan
los estímulos visuales es la denominada área V1. En esta región hay esen ialmente
tres tipos de élulas distintas: las simples, las omplejas y las hiper omplejas. Cada
una de ellas se espe ializa en dete tar un determinado tipo de estímulos. Hubel y
Wiesel fueron los primeros que investigaron las fun iones de ada una de estas élulas
[49℄[51℄.
Por ejemplo, las élulas simples forman agrupa iones que son apa es de anali-
zar estímulos uyo espe tro onsiste en un rango on reto de fre uen ias espa iales
mientras que las omplejas e hiper omplejas dete tan determinados tipos de movi-
mientos en la señal que se presenta omo estímulo. Cuando de imos que una élula
dete ta un estímulo, queremos de ir que hay un ambio en la a tividad de di ha
neurona (positivo o negativo) uando se le presenta di ho estímulo. Por supuesto,
4 Capítulo 1. Introducción
la a tiva ión o no de una neurona dependerá de la posi ión espa ial del estímulo.
Se denomina ampo re eptivo visual de una neurona al área retinal en la que la luz
in�uye en la respuesta de la neurona.
1.2 Objetivos de la memoria
El objetivo de esta Tesis es el desarrollo de un modelo que permita obtener una re-
presenta ión e� iente de imágenes digitales de niveles de gris. Al hablar de e� ien ia,
no se ha e referen ia tanto a la omplejidad en espa io o tiempo que pueda requerir,
omo al aprove hamiento posterior que se pueda derivar de di ha representa ión. En
este sentido, puesto que en el ampo de la visión arti� ial, el objetivo �nal siempre
es la identi� a ión de formas y su lasi� a ión ( on mayor o menor nivel de abstra -
ión), partimos de la idea de que una representa ión óptima es aquella que ha e un
observador humano uando registra una imagen a través del SVH. Watson [120℄ pro-
pone un modelo de representa ión y evalúa su bondad en base a dos ara terísti as:
la su� ien ia y la ne esariedad. De�ende que una odi� a ión ha de ser su� iente,
en el sentido de que sea apaz de retener toda la informa ión que es apaz de per ibir
un ser humano, y ne esaria porque sólo retiene esa informa ión.
Pero tan importante omo la simula ión de di ho omportamiento inteligente son
los datos de los que se parte. Tanto el SVH omo las té ni as de visión arti� ial,
tienen omo datos de partida la proye ión de la luz en la retina. La retina, omo
se ha di ho antes, es un mosai o bidimensional de fotorre eptores que registran esa
luz y la transmiten ha ia el erebro. La pregunta que se plantea es la siguiente
¾donde empieza el denominado omportamiento inteligente durante el pro eso de
re ono imiento de formas? La razón de esta pregunta es la siguiente: si sabemos
donde omienza di ho omportamiento, podríamos separar la parte del SVH que se
limita a representar la informa ión lumíni a, de la parte que es apaz de interpretar
esa representa ión. Posiblemente, este omportamiento omenzará a estar presente
desde el momento de in idir la luz en la retina, ya que esa energía lumíni a va a
ir sufriendo una serie de transforma iones, durante su amino ha ia el erebro, de
forma que uando llegue al órtex visual ya habrá determinado iertas ara terísti as
del estímulo visual que tengan algún tipo de interpreta ión más o menos dire ta por
parte de las zonas del erebro en argadas del pro eso de per ep ión propiamente
di ho. Pero el verdadero omportamiento inteligente omenzará, sin duda alguna,
uando el estímulo esté representado en el órtex visual. Esta separa ión de fun iones
en el SVH puede mar ar la diferen ia entre un sistema de visión arti� ial inteligente
y un sistema de visión ad-ho . Normalmente, en los sistemas ad-ho tradi ionales,
1.3. Descripción por capítulos 5
Seccion 2.2
Seccion 2.3
PSfrag repla ements
Parti ión
Multisensor
Se ión 2.2
Modelo
Modelo
de
de
Representa ión
Cap. 2
Dete ion
Es alas
Cap. 3
Modeliza ión
de los
Campos Re eptivos
Se ión 2.3
Dete ión de Es alas Lo ales
Cap. 4
Medida de Distorsión Per eptual
Cap. 5
Apli a iones
Figura 1.3: Esquema de desarrollo de la Tesis.
se parte de una representa ión similar a la que hay en la retina, donde tenemos
una matriz bidimensional de intensidades lumíni as, y se realiza el pro eso que se
podría llamar inteligente a partir de di ha representa ión. Di hos sistemas tienen
apli a iones muy espe í� as y limitadas, en parte porque a túan de forma distinta
a omo lo ha e el SVH, ya que éste no apli a la inteligen ia dire tamente sobre
la representa ión retinal. El SVH apli a la inteligen ia sobre la representa ión que
tiene en el órtex de la imagen retinal, donde, en lugar de intensidades lumíni as
tenemos la des rip ión del estímulo en base a un onjunto de des riptores que agrupan
determinado tipo de ara terísti as.
Por tanto, si lo que pretendemos ha er es una tarea que implique similaridad on
el omportamiento humano, pare e lógi o partir de una representa ión similar a la
que usa el SVH para re ono er formas. En esta Tesis se propone una representa ión
para imágenes de niveles de gris que ha e uso de algunas de las ara terísti as del SVH
y que tiene omo objetivo fundamental fa ilitar tareas posteriores de pro esamiento
de di ha imagen.
1.3 Des rip ión por apítulos
El desarrollo de esta memoria se puede ver en el esquema de la �gura 1.3. Esen ial-
mente hay dos partes diferen iadas en la Tesis:
✮ Parte I. En este bloque se desarrolla el modelo de representa ión de imágenes
digitales que se propone. Para ese modelo se usan distintas propiedades del
SVH. En on reto se hará uso de la sele tividad frente a fre uen ial espa ial
6 Capítulo 1. Introducción
y orienta ión de las élulas simples del órtex visual. Este he ho ha e ne e-
saria la parti ión del espa io fre uen ial y la sele ión de aquellos anales que
produz an una repuesta fuerte frente a un determinado estímulo visual; esto
se detalla en la se ión 2.2. Por otra parte, además de la parti ión en anales,
se ne esitará un modelo para los ampos re eptivos (C.R.) de di has élulas;
esto se expli a en la se ión 2.3. Para llevar a abo di ha modeliza ión se ha e
uso de una herramienta de sele ión de es alas globales que se expli a en el
apítulo 3.
✮ Parte II. En esta segunda parte se proponen dos apli a iones del modelo de
representa ión. La primera de ellas ha e uso de él para determinar las es alas
lo ales naturales presentes en imágenes digitales de niveles de gris (Capítulo 4).
La segunda apli a ión usa el modelo para la implementa ión de una medida
de distorsión per eptual entre imágenes (Capítulo 5).
Tras el desarrollo del modelo y sus apli a iones, se ha e una pequeña exposi ión de
líneas futuras a seguir en la investiga ión y se añaden 2 apéndi es on informa ión
adi ional sobre la nota ión usada en la Tesis (apéndi e A) y sobre la genera ión de
fun iones gaussianas y de Gabor (apéndi e B).
Para errar la Tesis se in luye la bibliografía y el índi e de referen ias.
Capítulo 2
Modelo de representa ión de
imágenes propuesto
2.1 Introdu ión
Es ono ido que en las fases ini iales del pro eso de per ep ión visual, el ser huma-
no des ompone la informa ión que re ibe en anales separados de fre uen ias para
analizar por separado ada uno de ellos (Campbell y Robson [14℄, Movshon [86℄, De
Valois et al. [22℄). Este he ho se ha omprobado usando diversos tipos de té ni as:
psi ofísi as (Campbell y Robson [14℄), neuro�siológi as (Campbell et al. [12℄, Blake-
more et al. [10℄), et . Bási amente, todos los investigadores siguen una misma línea
de trabajo para demostrarlo. Sus resultados se basan en experimentos en los que,
tras presentar un estímulo de luz on unas ara terísti as on retas a un sujeto, se
mide la respuesta que produ en las élulas simples del órtex frente a di ho estímulo.
Esa respuesta se medirá de forma distinta según sea el método elegido. Se ha po-
dido omprobar que hay grupos de élulas que se espe ializan en analizar estímulos
on retos. Hay élulas que sólo se a tivan uando el estímulo se mueve o uando el
estímulo está formado por un determinado onjunto de fre uen ias espa iales. La
mayor parte de los experimentos se han llevado a abo on gatos o monos debido
a que tienen iertas similaridades on el SVH (Poggio [93℄, Marg et al. [74℄, Field
[32℄). Ini ialmente fueron Hubel y Wiesel [50℄ quienes des ubrieron en 1962 la sele -
tividad frente a orienta ión de las élulas simples de la región V1 del órtex visual.
Posteriormente fueron Campbell y Robson [14℄ los que postularon que existían ana-
les independientes que operaban de forma lineal y eran sele tivos frente a un rango
limitado de fre uen ias. Finalmente Bla kemore y Campbell [10℄ demostraron que
esos anales eran sele tivos también frente a orienta ión. Los resultados de diferentes
7
8 Capítulo 2. Modelo de representación de imágenes propuesto
tipos de experimentos llegan a la misma on lusión: la del pro esamiento en anales
independientes; en todos ellos subya e la idea de que en etapas tempranas del pro-
eso de visión se realiza algún tipo de análisis de Fourier (Kabrisky [57℄, Ginsburg
[41℄, Ma�ei et al. [69℄, Pollen et al. [95℄).
Del trabajo de Campbell y Robson [14℄ se dedu ía que el ontraste de uno de los
anales espa io-fre uen iales debía superar un ierto umbral para que el observador
fuese apaz de dete tar esas fre uen ias. La existen ia de este pro eso de sele ión
espa io-fre uen ial fué estable ida por Enroth-Cugell y Robson [28℄. Posteriormente,
fué de nuevo Campbell [13℄ quien veri� ó la sele tividad de fre uen ias del sistema
visual del mono. Los experimentos de adapta ión on gratings realizados por otros
investigadores pusieron de mani�esto la existen ia de anales sele tivos en el SVH
humano similares a los que poseían los animales de los experimentos (Pantle et al.
[90℄, Blakemore et al. [10℄, Tynan et al. [115℄). Fueron Sa hs, Na hmias y Robson
[101℄ y Graham y Na hmias [44℄ quienes, mediante un estudio estadísti o, des artaron
los modelos mono anal en favor de modelos multi anal. Georgeson y Sullivan [40℄
des artaron el enfoque mono anal de Hay y Chesters [47℄ argumentando la gran
limita ión que tiene este tipo de enfoque on la presen ia de ruido.
Uno de los problemas prin ipales on el que nos en ontramos siempre que usamos
un enfoque multi anal a la hora de analizar una imagen, es sele ionar el onjunto
ade uado de anales, es de ir, hay que de idir sobre el número de anales, la fre-
uen ia espa ial entral de ada anal, su orienta ión y su an ho de banda. Hasta
ahora ha habido varias aproxima iones para en ontrar una solu ión razonable a este
problema omo por ejemplo el muestreo del espa io de fre uen ias a intervalos �jos
o el uso de un número �jo de anales prede�nidos sobre el espe tro de fre uen ias
(éste se ono e omo roseta). Dentro de esta parti ión �ja también hay varia ión en
uanto al número de anales y su posi ión en el espe tro. En la �gura 2.1 se pueden
ver distintos modelos propuestos por Watson [120℄ [119℄, Daugman [21℄, Ebrahimi
y Kunt [24℄ y Navarro [88℄. Aquí se puede ver que hay autores que muestrean más
determinados grupos de fre uen ias en detrimento de otros. Por ejemplo, Ebrahimi
y Kunt, usan más anales en las dire iones horizontal y verti al basándose en el
he ho de que el SVH es más sensible a estru turas que tienen esas orienta iones.
Este he ho es debido a la mayor presen ia de neuronas sensibles a di has orienta io-
nes (Mans�eld [71℄, Mans�eld et al. [72℄). Si observamos el espe tro fre uen ial de
es enas naturales, podremos observar una on entra ión mayor de energía en esas
dos orienta iones, este fenómeno es debido al efe to de la gravedad sobre los objetos
del mundo real.
Watson [119℄ propone en 1987 una parti ión on 4 orienta iones y 4 bandas de
2.1. Introducción 9
PSfrag repla ements
(A) (B) (C) (D)
Figura 2.1: Diferentes rosetas propuestas por varios autores. (A) Daugman. (B) Ebrahimi
y Kunt. (C) Watson. (D) Navarro.
fre uen ias además de dos �ltros residuales, uno paso alto y otro paso bajo (transfor-
mada del órtex). Para modelizar ada anal usa un �ltro paso banda que onstruye
en el dominio fre uen ial y que se pare e a una fun ión Gabor aunque no es exa ta-
mente igual. En un trabajo posterior [120℄ evalúa la apli a ión de ese modelo a la
ompresión de imágenes obteniendo buenos resultados.
Sin embargo, el uso de este tipo de parti iones tiene varios in onvenientes:
✮ Puede haber mu hos anales. Esto puede impli ar un serio in onveniente es-
pe ialmente si lo que ha emos es un muestreo fre uen ial a intervalos �jos y la
imagen es grande.
✮ Es ine� iente. Al haber mu hos anales las ne esidades omputa ionales au-
mentan mu ho.
✮ No todos los anales tienen informa ión útil. Habrá anales que tengan sólo
ruido o estru turas no esen iales.
✮ Es posible que los anales sele ionados no hagan una parti ión ade uada.
Se puede dar el aso de la existen ia de estru turas que tengan omponentes
fre uen iales que se separen en varios de estos anales; si apli amos uno de
estos modelos puede que no onsigamos analizar di has estru turas omo una
úni a forma, sino que anali emos sus partes por separado, siendo por tanto más
ompleja la tarea posterior de determinar la presen ia de di has estru turas.
En esta Tesis se propone un modelo que solventa los in onvenientes men ionados
anteriormente, al menos en parte. Teniendo en uenta que no todas las imágenes
tienen el mismo ontenido informa ional, es obvio que tampo o tendrán los mismos
requisitos omputa ionales de ara a su pro esamiento. Sería lógi o pensar, por
tanto, en un modelo de parti ión que fuese dependiente de la imagen, es de ir, dada
10 Capítulo 2. Modelo de representación de imágenes propuesto
una imagen ha er un estudio sobre los posibles anales que ontienen estru turas
más o menos independientes. Posteriormente se podría determinar uales de esos
anales tienen estru turas que son de interés para el pro esamiento posterior que se
vaya a realizar.
El modelo de parti ión propuesto en esta Tesis onsta de dos etapas:
✮ Primera. Parti ión del espe tro fre uen ial en bandas de fre uen ias que
ontengan informa ión homogénea en base a algún riterio objetivo (sensores).
Este paso se detalla en la se ión 2.2. El objetivo de esta fase es obtener una
des omposi ión adaptativa del espe tro que permita llevar a abo la seguda
etapa.
✮ Segunda. Sele ión de aquellos anales que ontengan informa ión su� iente
para realizar la tarea visual que estemos llevando a abo (sensores a tivos).
Este paso se detalla en la se ión 2.2.1.
En este sentido, pare e razonable que si nuestra inten ión es simular de alguna forma
el omportamiento del SVH, para pro esar la informa ión lumíni a de forma análoga
a omo lo ha e un ser humano, tengamos que des omponer la informa ión de entrada
en base a algún riterio objetivo que sea lo más pare ido posible al que usa el SVH.
El problema que se plantea es elegir ese riterio de parti ión de la informa ión que
re ibe el sistema visual. En este trabajo sólo se tendrán en uenta parte de las
ara terísti as de las élulas simples del órtex y del SVH para �ltrar la informa ión
que llega. En on reto se usará la sele tividad frente a orienta ión y fre uen ia
espa ial y la apa idad de enfoque de estru turas.
El riterio que nosotros vamos a tomar es ampliamente a eptado por la omu-
nidad ientí� a aunque se introdu irán varia iones que lo ha en novedoso. Vamos
a onsiderar que las élulas simples se espe ializan en el análisis de bandas de fre-
uen ias espa iales. Por tanto, dado un estímulo luminoso, lo que haremos será
des omponer su espe tro de fre uen ias en bandas, ada una de las uales será anali-
zada por un grupo distinto de élulas. Aquí apare e la no ión de sensor : de�niremos
un sensor omo ada una de las bandas de fre uen ias en las que hemos parti ionado
el espe tro.
Una vez he ha esa parti ión, es de ir, una vez que hemos determinado qué bandas
del espe tro van a ser pro esadas por ada grupo de élulas, habremos de de idir omo
van a ser pro esadas di has bandas. Para ha er esto nos basaremos en experimentos
ya desarrollados por varios autores en los que se estudia omo responden las élulas
frente a estímulos luminosos. Aquí apare e el on epto de ampo re eptivo (C.R.) de
2.2. Partición del espectro de frecuencias 11
PSfrag repla ements
(A) (B)
Figura 2.2: Per�l 3D de una fun ión de Gabor on simetría par. (A) en el dominio espa ial
y (B) en el dominio fre uen ial.
las élulas, que no es más que la región del ampo visual dentro de la ual la luz puede
ausar algún ambio en la respuesta de la élula; por tanto, un grupo de élulas dado
responderá sólo ante aquellas fre uen ias que estén próximas al entro de su C.R.. Se
ha podido omprobar que esos ampos re eptivos tienen aproximadamente el per�l
de una fun ión de Gabor (Figura 2.2). Si observamos el espe tro de Fourier de una
fun ión de Gabor (Figura 2.2.(B)) podemos apre iar que no es más que un �ltro paso
banda sele tivo frente a orienta ión y fre uen ia radial. Por otra parte si miramos
el per�l espa ial de este tipo de fun iones (Figura 2.2.(A)) se pueden apre iar zonas
ex itatorias (la respuesta frente a un estímulo es positiva) y zonas inhibitorias (la
respuesta ante un estímulo es negativa), esto impli a que uando una élula se a tiva
inhibe a las élulas próximas a ella, este efe to es ono ido omo inhibi ión lateral .
A ontinua ión se pro ederá, en una segunda etapa, a espe i� ar uales de es-
tas bandas serán su� ientes de ara a representar la informa ión visual de manera
robusta, es de ir, resistente frente a ruido o detalles inne esarios.
2.2 Parti ión del espe tro de fre uen ias
En esta se ión se desarrollará el método que nos va a permitir parti ionar el espe tro
de fre uen ias de una imagen para su posterior pro esamiento. Puesto que partimos
de las élulas simples del órtex omo unidades bási as para el pro esamiento que
vamos a realizar, habrá que tener en uenta algunas de sus propiedades a la hora
de de idir que áreas del espe tro van a ser analizadas por ada una de ellas. Una
de estas propiedades es la sele tividad frente a orienta ión, es de ir, determinadas
12 Capítulo 2. Modelo de representación de imágenes propuesto
élulas se espe ializarán en el análisis de estímulos que tengan una determinada
orienta ión espa ial. En este sentido Thomas et al. [111℄ omprobaron en 1978 que
el an ho de banda medio que son apa es de pro esar estas élulas estaba entre 10
Æ
y 20
Æ
. Estudios posteriores (1982) de De Valois et al. [23℄ on luyen que el an ho
de banda medio que son apa es de pro esar estas élulas es de alrededor de 40
Æ
.
En ese estudio se llega a esta on lusión aunque hay que tener en uenta algunos
mati es omo que la distribu ión de an hos de banda obtenida para 387 élulas era
muy variada. En sus estudios se on luyó que la mediana de esa distribu ión era
un buen estimador del an ho de banda medio de las élulas simples del órtex (la
mediana era de aproximadamente 40
Æ
).
También hay trabajos donde se habla del an ho de banda medio que han de tener
di hos anales. De Valois et al. [22℄ y Webster et al. [122℄ on luyen que el rango
medio de fre uen ias ubiertas en un anal es de aproximadamente 1.4 o tavas.
Sea f(x; y) la imagen de referen ia on un tamaño de NxN pixeles y sea F
�
(u; v)
la transformada de Fourier dis reta de f(x; y) suavizada a es ala �, es de ir:
F
�
(u; v) = FFT (f (x; y) gs (x; y; �)) (2.1)
donde es el operador de onvolu ión, FFT () es el operador Transformada de
Fourier Dire ta (ver apéndi e A) y donde gs(x; y; �) es un nú leo de onvolu ión
gaussiano simétri o de es ala � de�nido omo:
gs (x; y; �) =
1
2��
2
exp
�
x
2
+ y
2
2�
2
!
(2.2)
Para ver más detalles sobre los parámetros que pueden de�nir una fun ión gaus-
siana onsultar la se ión B.1.
Puesto que f(x; y) es una fun ión real, su transformada de Fourier es simétri-
a (por la propiedad de simetría onjugada) y por tanto de aquí en adelante sólo
trabajaremos on la mitad superior del espe tro de fre uen ias. También usaremos
nota ión polar en lugar de nota ión artesiana, es de ir, dadas las oordenadas ar-
tesianas (u; v) trabajaremos on las oordenadas polares (�; �) donde � =
p
u
2
+ v
2
es el radio y � = ar tan
�
v
u
�
es el ángulo.
Una forma ini ial de plantear la sele tividad frente a orienta ión es onsiderar una
serie de orienta iones �jas on el an ho de banda medio propuesto por De Valois y
otros autores, es de ir, vamos a onsiderar 4 bandas de orienta ión de 45
Æ
. Por tanto,
el primer paso del modelo onsistirá en dividir el plano fre uen ial en uatro bandas
de orienta ión B
i
(i = 0; 1; 2; 3) on un ángulo medio de �
i
= i � 45 + 22:5 grados
2.2. Partición del espectro de frecuencias 13
PSfrag repla ements
f(x; y) F
�=1
(u; v)
B
0
B
1
B
2
B
3
(0; 0)
Figura 2.3: Parti ión del espe tro en bandas de orienta ión. Izquierda: Imagen de referen-
ia. Dere ha: espe tro de la imagen suavizada a es ala 1 y la parti ión en uatro
bandas de orienta ión.
(i = 0; 1; 2; 3) y on un an ho de banda de 45
Æ
(Figura 2.3). Cada una de estas bandas
será parti ionada en anales de fre uen ias espa iales de forma que en ada uno de
ellos aislaremos datos espe trales que umplan un ierto riterio de homogeneidad.
Este riterio ha de impli ar que los omponentes espa io-fre uen iales de un sensor
tienen similar importan ia en uanto a la aporta ión que ha en en la imagen. Una
onse uen ia inmediata de esto es la separa ión de anales que ontienen ruido de
otros anales, on un nivel de a tividad mayor, que ontienen diferentes tipos de
estru turas. Esto se hará ha iendo uso del índi e de antialiasing �
B
i
(�
sup
), de�nido
sobre ada una de las bandas B
i
, y que representa la antidad relativa de informa ión
espe tral que hay en la banda B
i
onsiderando el rango de fre uen ias [0; �
sup
):
�
B
i
(�
sup
) =
R R
B
�
sup
i
jF
�=1
(�; �)j d�d�
R R
B
i
jF
�=1
(�; �)j d�d�
(2.3)
donde el numerador es la suma de los omponentes fre uen iales para la banda
de orienta ión B
i
en el rango de fre uen ias [0; �
sup
) de la imagen de referen ia
suavizada a es ala � = 1 y el denominador es la suma de todos los omponentes
espe trales de la banda B
i
para la imagen de referen ia suavizada a es ala � = 1.
El suavizado de la imagen se ha e para eliminar las fre uen ias muy altas debidas al
ruido de uantiza ión o digitaliza ión de la imagen.
En otras palabras, el índi e de antialiasing representa la antidad de informa ión
que hay por debajo de una fre uen ia dada (esto para ada una de las bandas B
i
).
14 Capítulo 2. Modelo de representación de imágenes propuesto
Una vez que tenemos los uatro índi es (uno para ada banda), haremos uso de
ellos para parti ionar ada una de las bandas en anales de fre uen ias de a uerdo a
un riterio de homogeneidad. En nuestro aso, lo que haremos será bus ar aquellos
rangos de fre uen ias en los que se produz a una varia ión signi� ativa en la velo idad
de re imiento de la fun ión de antialiasing. Esta fun ión es monótona re iente
(�gura 2.4) y en ella se va a umulando progresivamente la energía ontenida de la
banda B
i
; por tanto, un in remento en la velo idad de re imiento de la misma, nos
está indi ando que en la imagen hay estru turas uya energía está on entrada en
B
i
a partir del punto donde se in rementa la velo idad. Por otra parte uando la
velo idad de re imiento de re e hasta al anzar un valor mínimo tendremos el aso
ontrario, es de ir, tendremos el límite superior del rango de fre uen ias de mayor
ontribu ión, en B
i
, para alguna de las estru turas presentes en la imagen.
Para determinar la velo idad de re imiento de �
B
i
(�
sup
) al ularemos su segun-
da derivada y sobre ella bus aremos los extremos (máximos y mínimos) lo ales que
representarán la máxima y mínima velo idad de re imiento de di ha fun ión. Sean
�
i;0
, �
i;1
, ..., �
i;n
i
los extremos lo ales en ontrados (donde n
i
+1 es el número total de
extremos en ontrados). Esta se uen ia de extremos lo ales nos está dando la parti-
ión espe tral bus ada, es de ir, ahora tenemos la banda B
i
partida en n
i
anales de
fre uen ias [�
j
; �
j+1
) on j = 0; :::; n
i
�1, ada uno de los uales ontiene un rango de
fre uen ias espa iales de importan ia relativa semejante dentro de B
i
. En la �gura
2.4 se puede observar la fun ión de antialiasing �
B
i
(�
sup
) al ulada sobre la banda
B
0
de la imagen de la �gura 2.3 (izquierda) y su segunda derivada on los extremos
lo ales mar ados. Para el ál ulo de la segunda derivada se debe apli ar un método
que sea robusto frente al ruido (Mokhtarian et al. [84℄, Jain et al. [53℄). Esto es
debido a que el espe tro de fre uen ias de una imagen tiene una gran antidad de
pi os ( asi de pixel a pixel) que no son signi� ativos y que si no son eliminados de
alguna forma lo úni o que ha en es rear multitud de anales que no aislan ninguna
informa ión de utilidad. La esen ia del método es la determina ión de grupos de
fre uen ias que umplan una determinada ondi ión, aunque haya alguna fre uen ia
intermedia aislada que no la umpla estri tamente. Para el desarrollo de este trabajo
se ha elegido el operador LoG (Lapla iana de Gaussiana) sele ionando el parámetro
de es ala de la gaussiana � = 2. En el aso de la �gura 2.4 se ha usado un � mayor
para apre iar mejor los extremos de la segunda derivada.
A ada uno de los anales que obtenemos lo llamaremos de ahora en adelante
sensor y por tanto a la parti ión obtenida la llamaremos parti ión multisensor . En
la �gura 2.5 se puede ver un esquema ompleto del pro eso de ál ulo de la parti ión
multisensor. Partimos de la imagen ini ial, f(x; y), y del espe tro de fre uen ias de
2.2. Partición del espectro de frecuencias 15
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0 20 40 60 80 100 120-0.002
-0.0015
-0.001
-0.0005
0
0.0005
0 20 40 60 80 100 120
PSfrag repla ements
(A) (B)
Figura 2.4: (A) Índi e de antialiasing obtenido sobre la banda B
0
de la imagen de la �gura
2.3. (B) Los anales para esta banda serían ada uno de los intervalos entre
máximos y mínimos alternativos de la segunda derivada.
la imagen onvolu ionada on un nú leo gaussiano de es ala � = 1, F
�=1
(u; v). Pos-
teriormente, pro esaremos por separado ada una de las uatro bandas, B
0
, B
1
, B
2
y
B
3
obteniendo para ada una de ellas el índi e de antialiasing �
B
i
(�
sup
) y los orres-
pondientes extremos lo ales de su segunda derivada. Estos extremos determinarán
la parti ión del espe tro que estamos bus ando.
Dado un sensor S, llamaremos S
rmin
a la fre uen ia radial mínima que de�ne
el sensor, S
rmax
a la fre uen ia radial máxima que de�ne el sensor, S
amin
al ángulo
mínimo que de�ne el sensor y S
amax
al ángulo máximo que de�ne el sensor. De estos
parámetros podemos obtener el ángulo medio del sensor �
S
y la fre uen ia radial
media �
S
omo:
�
S
=
S
amin
+S
amax
2
y �
S
=
S
rmin
+S
rmax
2
En la siguiente se ión se puede ver omo la parti ión multisensor obtenida se
puede apli ar para evitar los problemas que plantean las parti iones �jas dis utidas.
2.2.1 Sele ión de sensores a tivos
Una vez que tenemos la parti ión multisensor analizaremos la importan ia de la
informa ión ontenida en ada sensor. El objetivo de esta fase es sele ionar el
sub onjunto de sensores que, dentro de la parti ión, aislan informa ión espe tral o-
rrespondiente a estru turas signi� ativas presentes en la imagen de entrada f(x; y).
Los sensores de este sub onjunto serán los llamados sensores a tivos. Esto tiene dos
ventajas importantes, por una parte redu imos el osto omputa ional del pro eso
al des artar el análisis de gran parte de la informa ión y por otra evitamos analizar
sensores que ontengan ruido y detalles po o relevantes. Esta sele ión de sensores
16 Capítulo 2. Modelo de representación de imágenes propuesto
PSfrag repla ements
f(x; y)
F
�=1
(u; v)F
�=1
(u; v)F
�=1
(u; v)F
�=1
(u; v)
F
�=1
(u; v)
F
�=1
(u; v)
B
0
B
1
B
2
B
3
�
B
0
(�
sup
) �
B
1
(�
sup
) �
B
2
(�
sup
) �
B
3
(�
sup
)
�
00
B
0
(�
sup
) �
00
B
1
(�
sup
) �
00
B
2
(�
sup
) �
00
B
3
(�
sup
)
Parti ión B
0
Parti ión B
1
Parti ión B
2
Parti ión B
3
Parti ión multisensor
Figura 2.5: Ejemplo del ál ulo de la parti ión multisensor sobre una imagen digital.
2.2. Partición del espectro de frecuencias 17
está inspirada en la do trina de Barlow [7℄ [8℄. El segundo de sus dogmas di e: �El
sistema sensorial está organizado para de�nir omo ompleta una representa ión del
estímulo sensorial on el menor número posible de neuronas a tivas�. Barlow se basa,
además de en eviden ias �siológi as, en la teoría de la informa ión de Shannon [105℄
[106℄ de la que se desprende que es posible disminuir el número de unidades a tivas
sin pérdida de informa ión. Por otra parte es ono ida la alta redundan ia de la
informa ión visual por lo que pare e lógi o ha er una sele ión de la informa ión
que vamos a pro esar. No es tarea fá il obtener un modelo de representa ión que
sea ompleto en el sentido de Barlow, por tanto, estas ideas sólo nos van a servir
de punto de partida para proponer un modelo de parti ión que intenta a er arse a
esa ompletitud. Esta parti ión estará ompuesta por aquellos sensores que onten-
gan su� iente informa ión omo para des ribir las estru tras signi� ativas presentes
en la imagen. De esta forma, des artaremos aquellos otros sensores que ontienen
informa ión redundante de ara a un pro esamiento posterior de la imagen.
El problema se entra enton es en determinar uantos y uales de los sensores
serán su� ientes para des ribir el ontenido informativo de la imagen sin perder las
estru turas signi� ativas y on la menor redundan ia posible.
Para determinar la importan ia relativa de ada sensor ara terizaremos a ada
uno de ellos on una medida que nos indique la antidad de informa ión relativa que
ontiene:
W
S
k
=
R R
S
k
jF
�=1
(�; �)j
2
d�d�
R R
jF
�=1
(�; �)j
2
d�d�
(2.4)
donde jF
�=1
(�; �)j es la poten ia del espe tro de la imagen f(x; y) suavizada a
es ala � = 1 en la posi ión (�; �), la doble integral
R R
S
k
representa la sumatoria sobre
el se tor espe tral orrespondiente al sensor S
k
y la integral
R R
es la sumatoria sobre
el espe tro ompleto.
Otras alternativas a esta pondera ión se pueden ver en (Rao [97℄, D'Astous [18℄,
Jernigan et al. [55℄) donde apare en otras formas de utilizar determinadas propieda-
des estadísti as de ada sensor omo lo aliza ión, tamaño, entropía, et .
Una vez tenemos ara terizados ada uno de los sensores apli aremos un método
de lustering ( lasi� a ión no supervisada) para agrupar los sensores en dos atego-
rías: a tivos y no-a tivos. Por a tivos vamos a denominar a aquellos on mayor nivel
de respuesta y por no-a tivos a aquellos que tienen menor nivel de respuesta aunque
no sea totalmente nulo.
El método de lustering apli ado es el ono ido omo k-medias (Jain et al. [54℄).
Este método onsiste en ir agrupando su esivamente los elementos de que disponemos
18 Capítulo 2. Modelo de representación de imágenes propuesto
en lases de forma que la distan ia entre ada elemento y la lase a la que pertene e
es la menor posible. Para ini ializar el algoritmo se eligen tantos elementos omo
lusters deseemos obtener y asignamos uno a ada luster. Posteriormente, vamos
tomando el resto de elementos y los vamos in luyendo en el luster más er ano. Una
vez que están todos los elementos asignados hemos de ir uno por uno y ver si existe
algún otro luster que esté más er a que el luster al que fué asignado ini ialmente.
Este pro eso se repite hasta que no se produ en ambios.
Este algoritmo tiene varios grados de libertad en uanto a la sele ión de muestras
ini iales (semillas), la de�ni ión del entro de un luster o la de�ni ión de la distan ia
entre un elemento y un luster. Las semillas son los elementos ini iales que se asignan
a ada luster y se puede optar por varias alternativas de sele ión; por ejemplo, se
pueden tomar elementos de forma aleatoria o se pueden ordenar todos los elementos
y sele ionar varios de ellos de forma que estén equiespa iados en la ordena ión que
han tomado. En nuestro aso, el número de lases es 2 y se ha optado por la segunda
forma de elegir las semillas.
El entro de un luster se ha de�nido omo la media de los elementos que per-
tene en a di ho luster y la distan ia entre un elemento y un luster se ha de�nido
omo la distan ia eu lídea entre el elemento y el entro del luster.
Por otra parte el algoritmo también permite variar el método de itera ión. Una
posibilidad onsiste en al ular el entro de un luster uando hayamos a abado
de omprobar que todos los elementos están en el luster más próximo; después de
reasignar todos los elementos y al ular el entro del luster repetiremos el pro eso
hasta que no haya ambios. La segunda op ión onsiste en re al ular el entro de
los lusters ada vez que un elemento es ambiado de un luster a otro. En nuestro
aso se ha optado por la segunda op ión.
El algoritmo se puede esquematizar de la siguiente forma: Dados un onjunto
de N sensores = fW
S
k
; 1 � k � Ng y los pesos de ada uno de ellos W
S
k
, la
ini ializa ión del algoritmo sería la siguiente:
C
1
- fmax ()g
C
2
- fmin ()g
- � C
1
� C
2
C
entro
1
= max (C
1
)
C
entro
2
= min (C
2
)
8W
S
2
- � fW
S
g
Si (jC
entro
1
�W
S
j < jC
entro
2
�W
S
j)
C
1
- C
1
[ fW
S
g
Si-No
2.2. Partición del espectro de frecuencias 19
C
2
- C
2
[ fW
S
g
Fin-Si
Fin-8
C
entro
1
-
P
W2C
1
W
Card[C
1
℄
C
entro
2
-
P
W2C
2
W
Card[C
2
℄
Ahora omenzaría el pro eso iterativo que va reasignando los elementos al luster
más er ano hasta que estén todos bien situados:
Repetir
ambio - falso
8W
S
2 (C
1
[ C
2
)
salto luster - falso
Si [(W
S
2 C
1
) ^ (jC
entro
2
�W
S
j < jC
entro
1
�W
S
j)℄
C
1
- C
1
� fW
S
g
C
2
- C
2
+ fW
S
g
salto luster - verdad
Si-No Si [(W
S
2 C
2
) ^ (jC
entro
1
�W
S
j < jC
entro
2
�W
S
j)℄
C
1
- C
1
+ fW
S
g
C
2
- C
2
� fW
S
g
salto luster - verdad
Fin-Si
Si (salto luster = verdad)
C
entro
1
-
P
W2C
1
W
Card[C
1
℄
C
entro
2
-
P
W2C
2
W
Card[C
2
℄
ambio - verdad
Fin-Si
Fin-8
Mientras ( ambio = verdad)
donde la fun ión Card [C
i
℄ denota el número de elementos del luster C
i
. Al
�nalizar este algoritmo tendremos los sensores a tivos en el luster C
1
y los no a tivos
en el C
2
.
La onvergen ia de este algoritmo está demostrada por Selim e Ismail [104℄.
En la �gura 2.6 se puede ver la sele ión realizada sobre el onjunto de sensores
obtenidos en la �gura 2.5. En la parte superior está la parti ión multisensor ompleta
( ompuesta por 98 sensores) seguida de una grá� a en la que se muestran los sensores
ordenados por sus pesos W
S
k
de mayor a menor. Con una línea verti al se muestra
la separa ión entre los dos lusters obtenida mediante el algoritmo k-medias. En la
parte inferior se muestran los sensores pertene ientes al luster de a tivos (izquierda)
y al de no-a tivos (dere ha).
20 Capítulo 2. Modelo de representación de imágenes propuesto
PSfrag repla ements
Parti ión multisensor
W
S
k
Sensores a tivos (14) Sensores No-a tivos (84)
Figura 2.6: Sele ión de sensores a tivos.
2.3. Modelización de los campos receptivos 21
2.3 Modeliza ión de los ampos re eptivos
Hasta ahora sólo se ha hablado de parti ionar el espe tro de fre uen ias en anales
pero no se ha di ho nada sobre la forma de pro esar la informa ión de esos anales.
Aquí es ne esario apli ar algún modelo que simule (al menos en parte) el omporta-
miento que el SVH tiene al analizar la informa ión de los anales.
En esta se ión se propondrá un modelo que nos permita modelar el omporta-
miento de las élulas simples del órtex frente a estímulos visuales. Por tanto, lo
que en de�nitiva haremos será modelizar los ampos re eptivos de di has élulas.
Esto onsiste en proponer un modelo de fun ión teóri a que ajuste, on un mínimo
error, los ampos re eptivos medidos de forma experimental por distintos autores.
De forma grá� a, el ampo re eptivo lo podemos representar omo una super� ie
bidimensional (x,y,z ), tal que, en ada posi ión (ejes x e y) situamos el nivel de
a tividad de las élulas frente al estímulo (eje z ).
En la literatura rela ionada on modelos de visión per eptual, se pueden en on-
trar multitud de fun iones teóri as que tienen similitudes on los ampos re eptivos
de las élulas simples. Una ara terísti a que tienen todas estas fun iones es la
presen ia de una región entral en la que se produ e una alta respuesta frente al
estímulo, rodeada de varias regiones de in�uen ia negativa. Estas regiones negati-
vas no indi an que la respuesta de las élulas sea negativa, sino que la respuesta de
di has élulas se ve inhibida por la a tiva ión de otras élulas (las entrales). Ini ial-
mente Hubel y Wiesel [50℄ pensaban que sólo había dos o tres regiones inhibitorias
o ex itatorias pero después se ha omprobado que hay más. Gran parte de estas
fun iones están derivadas de la familia de las gaussianas (Koenderink et al. [61℄),
omo por ejemplo diferen ias de gaussianas (Young [126℄, Stork et al. [109℄, Klein et
al. [59℄). Watson [119℄ propuso un esquema en el que usaba unos �ltros similares a
fun iones de Gabor; este esquema sirvió para obtener un modelo, al que denominó
transformada del órtex , que permitía tener una representa ión multies ala de una
imagen asumiendo una separa ión en anales fre uen iales del estímulo visual.
De Valois et al. [23℄, proponen tres alternativas para modelar di hos ampos
(�gura 2.7):
✮ Suma de 2 gaussianas de polaridad invertida on el mismo entro geométri-
o, de forma que tengamos una región ex itatoria en el entro y dos regiones
inhibitorias a los lados.
✮ Suma de 3 gaussianas de forma que la de mayor desvia ión estándar representa
la región ex itatoria entral, y las otras, de polaridad negativa, simulan el
22 Capítulo 2. Modelo de representación de imágenes propuesto
PSfrag repla ements
(A) (B) (C)
Figura 2.7: Modelos de ampo re eptivo propuestos por De Valois et al.. (A) Suma de 2
gaussianas. (B) Suma de 3 gaussianas. (C) Modelo de entro on entrado.
omportamiento de las regiones inhibitorias de los �an os.
✮ El ter er modelo (al que llama de entro on entrado), asume que la respuesta
positiva frente a un estímulo se da sólo en un punto del entro del ampo
re eptivo, formando las regiones inhibitorias la mayor parte del ampo re eptivo
alrededor de di ho punto.
Hay una gran variedad de modelos basados en fun iones de tipo gaussiano (Haw-
ken et al. [46℄, Parker et al. [91℄, Malik et al. [70℄). El punto omún de todas estas
fun iones es que siempre tenemos una región ex itatoria entral (de mayor o menor
amplitud) y regiones inhibitorias laterales.
En esta Tesis se hará uso de fun iones de Gabor omplejas para modelizar los
ampos re petivos. Mar elja [73℄ fué el primero que usó la teoría desarrollada por
Gabor [36℄ para modelizar los ampos re eptivos y a él le siguieron mu hos otros omo
Daugman [19℄, Jones y Palmer [56℄ y Ati k y Redli h [5℄ por ejemplo. Además del
pare ido fun ional de este tipo de fun iones on los ampos re eptivos de las élulas
simples del órtex, hay otra razón importante para usarlas en la modeliza ión y es
que onsiguen minimizar el prin ipio de in entidumbre de Heisenberg. Esto, apli ado
al tema que nos on ierne, signi� a que se puede onseguir una máxima lo aliza ión
de las estru turas presentes en la imagen de forma simultánea en el dominio espa ial
y en el dominio fre uen ial. Esto se tradu e en la minimiza ión el produ to de la
varianza del ampo re eptivo en el dominio espa ial por la varianza de di ho ampo
en el dominio fre uen ial (Daugman [20℄).
Estas fun iones se han usado on éxito en diferentes tareas, omo por ejemplo en
la dis rimina ión de texturas (Fogel et al. [34℄, Sutter et al. [110℄).
Hay otro punto importante a tener en uenta en el omportamiento de las élulas
simples y es que, independientemente del modelo de ampo re eptivo que se propon-
ga, estas élulas tienen un omportamiento no lineal (Mar elja [73℄, Andrews et al.
[4℄, Daugman [19℄) frente a los estímulos que las a tivan. Posteriormente, la salida
2.3. Modelización de los campos receptivos 23
de di has élulas se ombina de forma lineal para obtener lo que sería la salida de un
anal orti al.
Como se ha di ho antes, dado un determinado estímulo, on una determinada
fre uen ia espa ial y orienta ión, son varias las élulas simples que se a tivan. Este
onjunto de élulas forma lo que se denomina anal orti al. Dado un estímulo, se ha
omprobado que se a tivan dos élulas adya entes para analizarlo. Estas dos élulas
tienen la pe uliaridad de que sus ampos re eptivos tienen un desfase de 90
Æ
(Pollen
et al. [95℄) y podrían ser modelados on dos fun iones de Gabor, una on simetría
par y otra on simetría impar (�gura 2.8 (A) y (B)). Por otra parte, la respuesta
de una élula ha de ser siempre positiva, esto impli a que la informa ión que hay
sobre las regiones inhibitorias del ampo re eptivo no sería analizada, es de ir, las
respuestas negativas son trun adas a ero. Este es uno de los efe tos de no linealidad
que se produ en en estas élulas. En on reto, el trun amiento a ero de las regiones
negativas de los ampos re eptivos se ono e omo efe to de re ti� a ión de media
onda. Foster et al. [35℄ omprobaron que élulas adya entes desfasadas en 180
Æ
eran a tivadas por un estímulo de una misma fre uen ia espa ial y orienta ión. Si
observamos el per�l de una fun ión de Gabor on simetría par (o impar) y apli amos
un desfase de 180
Æ
podremos observar que estamos obteniendo la misma fun ión pero
on polaridad opuesta. En la �gura 2.8 se puede observar omo afe ta este desfase
al per�l de una fun ión de Gabor, en (A) tenemos la fun ión on 0
Æ
de desfase
(simetría par), en (B) podemos verla on un desfase de 90
Æ
(simetría impar), en (C)
podemos observar un desfase de 180
Æ
(simetría par) y en (D) se observa el desfase de
270
Æ
(simetría impar). De todo esto se obtiene que, dado un estímulo, intervienen
uatro élulas para analizarlo: un primer par on un desfase de 90
Æ
(en uadratura
de fase) y un segundo par de polaridad inversa al primero que se en arga de analizar
la informa ión que trun a el primer par debido al efe to de re ti� a ión de media
onda.
En de�nitiva, podemos on luir que uatro ampos re eptivos elementales de
diferente simetría y polaridad analizan un subdominio omún en una determinada
orienta ión y fre uen ia espa ial, o lo que es lo mismo, podemos de ir que pares de
élulas simples en uadratura de fase permiten espe i� ar la informa ión de amplitud
y fase para una fre uen ia espa ial y orienta ión, dada una región del espa io visual
(Pollen et al. [94℄).
Por tanto, dado un anal orti al on una orienta ión �, una fre uen ia entral � y
un an ho de banda �, podemos des ribir su respuesta frente a un estímulo f(x; y), en
base a los per�les de las fun iones de Gabor orrespondientes a ada una de las uatro
élulas que son a tivadas. Vamos a llamar
1
y
2
al primer par de élulas adya entes
24 Capítulo 2. Modelo de representación de imágenes propuesto
PSfrag repla ements
(A) (B)
(C) (D)
Figura 2.8: Per�les 3D de fun iones Gabor on diferentes simetrías y desfases. (A) Simetría
par. (B) Simetría impar. (C) Simetría par on desfase de 180
Æ
. (D) Simetría
impar on desfase de 180
Æ
.
2.3. Modelización de los campos receptivos 25
Célula Campo re eptivo Respuesta
1
g
o
(x; y; �; �; �) p
1
(x; y; �; �; �)
2
g
e
(x; y; �; �; �) p
2
(x; y; �; �; �)
3
�g
o
(x; y; �; �; �) p
3
(x; y; �; �; �)
4
�g
e
(x; y; �; �; �) p
4
(x; y; �; �; �)
Tabla 2.1: Campos re eptivos y respuestas de las élulas de un anal orti al.
(en uadratura de fase) y
3
y
4
al otro par de élulas ( on polaridad invertida).
Los ampos re eptivos de di has élulas y sus orrespondientes respuestas pueden
ser des ritos por tanto mediante las fun iones de la tabla 2.1 donde g
o
(x; y; �; �; �)
y g
e
(x; y; �; �; �) son fun iones de Gabor par e impar respe tivamente y donde los
p
i
(x; y; �; �; �) son las mismas fun iones tras apli arles la re ti� a ión de media onda.
La formula ión de una fun ión de Gabor ompleja es la siguiente:
gb (x; y; �; �; �) =
1
2��
2
exp
�
x
2
+ y
2
2�
2
!
exp (i (w
x
0
x+ w
y
0
y)) (2.5)
donde w
x
0
y w
y
0
se obtienen de las siguientes expresiones:
w
x
0
w
y
0
= tan �;
q
w
2
x
0
+ w
2
y
0
= � (2.6)
de esta forma, la parte on simetría par de la Gabor es:
g
e
(x; y; �; �; �) =
1
2��
2
exp
�
x
2
+ y
2
2�
2
!
os (w
x
0
x+ w
y
0
y) (2.7)
y la impar:
g
o
(x; y; �; �; �) =
1
2��
2
exp
�
x
2
+ y
2
2�
2
!
sin (w
x
0
x+ w
y
0
y) (2.8)
Para ver más detalles sobre los parámetros de fun iones de Gabor se puede on-
sultar el apéndi e B.2.
La re ti� a ión de media onda se puede obtener a partir de la formula ión de los
ampos re eptivos mediante las siguientes e ua iones:
26 Capítulo 2. Modelo de representación de imágenes propuesto
PSfrag repla ements
g
o
() g
e
() �g
o
() �g
e
()
g
r
1
() g
r
2
() g
r
3
() g
r
4
()
Primer par Segundo par
RMO RMORMORMO
Figura 2.9: Fila superior: per�l 2D de las respuestas orrespondientes a las 4 élulas simples
que forman un anal orti al. Fila inferior: resultado de apli ar la re ti� a ión
de media onda (RMO).
p
1
(x; y; �; �; �) =
1
2
(jg
e
(x; y; �; �; �) f(x; y)j+ g
e
(x; y; �; �; �) f(x; y))
p
2
(x; y; �; �; �) =
1
2
(jg
o
(x; y; �; �; �) f(x; y)j+ g
o
(x; y; �; �; �) f(x; y))
p
3
(x; y; �; �; �) =
1
2
(j�g
e
(x; y; �; �; �) f(x; y)j � g
e
(x; y; �; �; �) f(x; y))
p
4
(x; y; �; �; �) =
1
2
(j�g
o
(x; y; �; �; �) f(x; y)j � g
o
(x; y; �; �; �) f(x; y))
(2.9)
En la �gura 2.9 se pueden apre iar los per�les de los ampos re eptivos de las
élulas modelizados mediante fun iones de Gabor y los mismos per�les tras apli arles
la re ti� a ión de media onda. También se puede apre iar el desfase de 90
Æ
entre
las élulas orrespondientes a ada par y el desfase de 180
Æ
entre los dos pares de
élulas.
Dada la señal de entrada f (x; y) a un anal dado obtendremos una salida p
i
(x; y)para
ada una de las élulas (i = 1; 2; 3; 4)
Una vez que tenemos las respuestas individuales de ada élula, hemos de usar
un modelo que las ombine y produz a una salida para el anal orti al en onjunto.
Andrews et al. [4℄, Movshon et al. [87℄ y Pollen y Ronner [94℄ demostraron que las
élulas simples realizaban, aproximadamente, una sumatoria lineal de sus respuestas.
De a uerdo a este resultado, podemos ha er uso del siguiente modelo para ombinar
las respuestas no-lineales de ada una de las élulas simples: dado un estímulo f(x; y)
y un anal orti al on parámetros �, � y �, la respuesta de di ho anal, p(x; y), la
vamos a des omponer en dos fun iones, una dada por la suma de los �ltros on
2.3. Modelización de los campos receptivos 27
simetría par y otra dada por la suma de los �ltros de simetría impar:
p
e
(x; y) = p
1
(x; y; �; �; �) + p
3
(x; y; �; �; �) = f(x; y) g
e
(x; y; �; �; �)
p
o
(x; y) = p
2
(x; y; �; �; �) + p
4
(x; y; �; �; �) = f(x; y) g
o
(x; y; �; �; �)
(2.10)
lo que puede ser expresado de la forma:
p(x; y) = f(x; y) gb(x; y; �; �; �) = p
e
(x; y) + ip
o
(x; y) (2.11)
o lo que es lo mismo, la salida de un anal orti al la podemos obtener tras
onvolu ionar la señal de entrada on un �ltro de Gabor omplejo uyos parámetros
vienen dados por los del anal orti al que estamos onsiderando. Hasta aquí, se ha
dado una justi� a ión matemáti a del modelo partiendo de eviden ias biológi as y
que apoya la hipótesis de la modeliza ión de los ampos re eptivos mediante �ltros
de Gabor omplejos.
El modelo presentado en esta memoria parte de estas eviden ias para modelar los
ampos re eptivos mediante fun iones de Gabor. Llegados a este punto, el problema
que se plantea es la determina ión de los parámetros de tales fun iones . Si hi iésemos
uso de un enfoque multi anal �jo, es de ir, �jando a priori los anales en los que se
va a dividir el espe tro fre uen ial, sería tarea simple determinar los parámetros
de estas fun iones, ya que estos estarán rela ionados, de una forma más o menos
dire ta, on la posi ión y an ho de banda de los anales. Nuestro problema radi a
en que la parti ión no se �ja a priori y es, por tanto, dependiente de la imagen en
uestión. Esto signi� a que, puesto que los parámetros de las fun iones Gabor están
rela ionadas on los parámetros que de�nen ada anal, no podremos determinarlos
antes de haber realizado di ha parti ión y, por tanto, estos parámetros habrán de ser
también dependientes de la imagen.
En el apéndi e B se pueden ver on ierto detalle los parámetros que podemos
aso iar a una fun ión Gabor. En esta Tesis sólo se va a ha er uso de tres de ellos: la
fre uen ia radial �, la orienta ión � y la es ala espa ial �. Una fun ión de Gabor, se
onstruye modulando una fun ión gaussiana mediante una fun ión de tipo sinusoidal
(seno o oseno). En este trabajo asumiremos que la fun ión gaussiana es isotrópi a
y, por tanto, oin idirán las sigmas (�) espa iales en el eje de la x y en el eje de la y
de la misma, de forma que uando hablemos de es ala (sigma), asumiremos de forma
implí ita que ambas es alas tienen la misma magnitud (�
x
= �
y
= �). Por otra
parte, al ser la fun ión gaussiana isotrópi a, no tiene mu ho sentido ha er uso del
ángulo que forma esa gaussiana on respe to al eje horizontal y por tanto podemos
28 Capítulo 2. Modelo de representación de imágenes propuesto
suponer que ese ángulo vale siempre ero.
La idea, por tanto, es ha er uso de una fun ión Gabor, gb(x; y; �; �; �), para
analizar la informa ión ontenida en un determinado anal S de parámetros �
S
y
�
S
. Para que la fun ión se entre en el análisis de esa informa ión, es obvio que su
entro, en el dominio fre uen ial, dado por � y � ( oordenadas polares) habrá de
estar situado en la misma posi ión que el entro del sensor �
S
y �
S
. En la �gura
2.2(B) se puede ver que una fun ión de Gabor, en esen ia, no es más que un �ltro
paso banda sensible a orienta ión. El úni o parámetro que queda por determinar es
la es ala espa ial del �ltro, es de ir, la amplitud del �ltro. Para determinarla se hará
uso de té ni as de autoenfoque que se detallan en el apítulo 3.
2.4 Resumen del modelo de representa ión propuesto
Para �nalizar el apítulo, se muestran, de forma resumida, las hipótesis de partida
y el modelo de representa ión desarrollado.
Partimos de algunas de las propiedades del SVH que se han ido en ontrando a
lo largo de los últimos años. Las más importantes son las siguientes:
✮ La sele tividad frente a orienta ión y fre uen ia espa ial de las élulas simples
del área V1 del órtex visual. Esto inspira la etapa de la parti ión multi anal
del espe tro de fre uen ias.
✮ Las eviden ias de que hay élulas que tienen una respuesta más pronun iada
que otras frente a un estímulo visual. De aquí se deriva la sele ión de sensores
a tivos.
✮ La similitud de los ampos re eptivos de di has élulas, medidos de forma
experimental, on las fun iones teóri as de Gabor. Además, a esto se une
la minimiza ión del prin ipio de in ertidumbre en espa io y fre uen ia omo
onse uen ia del uso de �ltros de Gabor omplejos.
El modelo propuesto se puede esquematizar mediante las siguientes etapas:
✮ Parti ión del espe tro de fre uen ias y sele ión de sensores a tivos:
✬ Obten ión de la parti ión multisensor:
✫ Cál ulo de los índi es de antialiasing �
B
i
(�) on i = 0; 1; 2; 3.
✫ Lo aliza ión de los extremos lo ales de las derivadas segundas de los
índi es �
B
i
(�).
2.4. Resumen del modelo de representación propuesto 29
En esta etapa se dete tan zonas del espe tro donde se en uentran estru -
turas poten iales de interés. Al �nalizar este paso tenemos un onjunto
de N sensores fS
i
; 0 � i < Ng que de�nen la parti ión realizada.
✬ Sele ión de sensores a tivos:
✫ Cál ulo del peso relativo,W
S
i
, de los sensores a tivos on i = 0; :::; N�
1 para evaluar la importan ia relativa de ada sensor S
i
.
✫ Clasi� a ion de los sensores en dos grupos, a tivos y no-a tivos, me-
diante el algoritmo K-medias apli ado sobre los pesos W
S
i
.
Al �nalizar esta etapa tendremos el sub onjunto de sensores on mayor
a tividad: el grupo de sensores a tivos.
✮ Modeliza ión de los ampos re eptivos de los sensores a tivos:
✬ Cada ampo re eptivo será modelado mediante una fun ión de Gabor
ompleja de parámetros � (fre uen ia radial media), � (orienta ión media)
y � (es ala espa ial). La fre uen ia y orienta ión medias estarán de�nidas
por el propio sensor.
✬ Para determinar la es ala se hará uso de la té ni a de autoenfoque en el
dominio de Gabor presentada en el apítulo 3.
En los apítulos 4 y 5 se podrá veri� ar su validez tras su apli a ión a dos tareas
on retas: la dete ión de es alas naturales lo ales y el ál ulo de una medida de
distorsión per eptual.
30 Capítulo 2. Modelo de representación de imágenes propuesto
Capítulo 3
Dete ión de es alas globales
Uno de los prin ipales objetivos de las etapas ini iales de la visión espa ial es a-
ra terizar los ambios de luminan ia que se produ en en la retina de forma que en
los pro esos posteriores se pueda determinar informa ión sobre las ara terísti as
de la es ena que se está visualizando. Para ada ambio de luminan ia, se debería
medir, al menos, la lo aliza ión del ambio, su extensión espa ial y la amplitud de
la dispersión de luminosidad.
El SVH es apaz de enfo ar en el rango orre to de es alas y por tanto puede
lo alizar objetos en una imagen aumentando o disminuyendo el nivel de emborrona-
miento para analizar on más o menos detalle la estru tura de los objetos (Hay et al.
[48℄). Por tanto, para desarrollar un sistema de pro esamiento automáti o de imá-
genes que simule este omportamiento será importante analizar la dependen ia de la
estru tura de una imagen respe to de la resolu ión o es ala de di ha imagen. Pare e
un he ho laro que en el pro eso de per ep ión visual se analizan las imágenes a
distintos niveles de resolu ión simultáneamente (Koenderink [60℄). El problema que
se plantea en este apítulo es la extra ión automáti a de las es alas signi� ativas de
las estru turas de niveles de gris presentes en la imagen, todo ello sin ono imiento
a priori sobre que tipo de estru turas hay o sobre su lo aliza ión. Como demuestra
Gar ía et al. [37℄, el ono imiento de la es ala aso iada a las diferentes estru turas
presentes en la imagen fa ilita el pro esamiento posterior.
Para dete tar las diferentes es alas a las que o urren estru turas de interés en la
imagen varios autores propusieron y desarrollaron el análisis multies ala (Rosenfeld
et al. [99℄, Witkin [124℄, Koenderink [60℄, Babaud et al. [6℄, Yuille et al. [127℄,
Lindeberg [67℄). Apli ando operadores de diferente tamaño a la imagen, el análisis
multies ala re oge la informa ión en un rango dado de es alas. En imágenes natura-
les, no todas las es alas intermedias dentro de un rango son realmente signi� ativas;
31
32 Capítulo 3. Detección de escalas globales
tan sólo algunas se orresponden on estru turas de interés (Marr [76℄). Por ejemplo,
a un nivel alto de resolu ión, un árbol está ompuesto de hojas on una ompleja
estru tura de venas que las re orren. En el siguiente nivel, ada hoja es una úni a
región y en el siguiente nivel vemos la opa del árbol omo un úni o objeto. Hay un
rango natural de resolu iones que se orresponden on ada uno de esos niveles de
des rip ión. Esto nos lleva a que una misma estru tura se puede interpretar omo
objetos diferentes, dependiendo del nivel de resolu ión elegido para representarla. En
esta se ión nos referiremos al on epto de es ala omo a aquellos niveles naturales de
des rip ión en los uales, un sub onjunto (generalmente distinto) de partes de la es-
ena visual, son interpretados omo objetos re ono ibles por un observador. El he ho
de que se determine una es ala omo signi� ativa no impli a la existen ia explí ita
de un objeto en la imagen sino que puede impli ar la existen ia de una estru tura
que se rea omo onse uen ia de la unión de otras estru turas más pequeñas.
Las té ni as multies ala habituales tienen el gran problema de que la integra ión
de la informa ión resultante del pro esamiento a diferentes es alas no se ha e en base
a ningún ono imiento on reto sobre los niveles de resolu ión a los que se mani�estan
las estru turas en la imagen (Lu et al. [68℄). Puesto que estos métodos representan
ara terísti as en todas las es alas (dis retas) dentro de un rango, habrá una gran
redundan ia entre las imágenes de es alas onse utivas ya que la varia ión entre ellas
es pequeña. Esto ondu e a un pro esamiento ine� iente en etapas posteriores.
En este apítulo se proponen diversas alternativas para la sele ión de es alas
signi� ativas, aunque, en esen ia, todas ellas están basadas en el análisis de la nitidez
de las estru turas presentes en la imagen �ltrada a distintas es alas.
Teniendo en uenta las ara terísti as del SVH en uanto al análisis en paralelo de
diferentes anales espa io-fre uen iales (ver se ión 2.2) (Jones et al. [56℄, Daugman
[21℄, Watt [121℄) se propone un esquema en el que, tras ha er una des omposi ión
del espe tro en anales separados de fre uen ias, se bus arán las es alas signi� ativas
para ada uno de esos anales. Esas es alas, por tanto, harán apare er las estru turas
que se per iben en la imagen y que tengan presentes los omponentes fre uen iales
que hay en ada uno de los anales sele ionados. Las estru turas que somos apa es
de identi� ar no tienen porqué existir en la imagen, por ejemplo, la opa del árbol
no es algo que exista por si mismo en el ejemplo anterior, sino que es una nueva
estru tura que se rea omo onse uen ia de unir las hojas entre si.
El uso de un enfoque multi anal, nos ha permitido identi� ar objetos signi� ati-
vos y segregarlos sin un ono imiento a priori sobre ellos. En esta etapa se trata de
ha er un aprendizaje sobre uál es la es ala ideal para ada uno de esos objetos. El
he ho de separar en anales independientes ada objeto es muy importante ya que
3.1. Detección de escalas significativas 33
de esta forma podemos al ular la es ala sin que unos objetos inter�eran on otros.
3.1 Dete ión de es alas signi� ativas
Una vez que se ha realizado la parti ión del espe tro, tal omo se expli ó en la
se ión 2.2 vamos a pro eder a sele ionar las es alas signi� ativas para ada uno
de los sensores a tivos de la parti ión. En esta se ión se estudiará la sele ión de
es alas signi� ativas ha iendo uso de un esquema de autoenfoque multi anal. En este
aso las té ni as de autoenfoque están basadas en una representa ión de la imagen
dada en el dominio de Gabor.
Las ventajas que tiene este método son que, por una parte, se aprove ha la
formula ión de las fun iones de Gabor para sele ionar aquellas fre uen ias que están
in luidas en ada uno de los sensores evitando así ha er uso de �ltros paso-banda
ideales on los problemas que estos onllevan (efe to de anillado) y, por otra parte,
se ha e uso de una propiedad de las fun iones de Gabor omplejas, y es que permiten
una óptima lo aliza ión simultánea en el dominio espa ial y en el fre uen ial.
3.1.1 Fun iones de enfoque
Para omprender mejor omo se van a apli ar las fun iones de enfoque para la de-
te ión de es alas puede ser útil omentar brevemente el papel que juegan estas
fun iones en mi ros opía. Se puede ver (Groen et al. [45℄) para más detalles sobre
este tipo de fun iones.
El autoenfoque es esen ial en sistemas de mi ros opía automáti os donde se pre-
sentan un gran número de muestras que ne esitan ser digitalizadas y analizadas.
Cuando tenemos muestras multi- apa (en una misma es ena apare en objetos a dis-
tintas profundidades) no es posible tener una imagen en la que estén bien enfo adas
todas las estru turas simultáneamente. Debido a la limita ión de la profundidad
de ampo, si una de las apas está bien enfo ada, el resto estarán desenfo adas en
mayor o menor grado y por tanto se verán emborronadas.
Los algoritmos de autoenfoque bus an el máximo de una fun ión de enfoque.
Esta fun ión es una medida de la alidad del enfoque omo fun ión de la posi ión
axial (eje z ) y estará muestreada en un rango dis reto de posi iones a lo largo del eje
z. La fun ión devolverá un valor que indique la nitidez de la imagen para un punto
de enfoque dado. La distan ia al objeto que se orresponde on el máximo valor de
esta fun ión será la elegida para asegurar un mejor enfoque de la imagen.
El objetivo de esta se ión es desarrollar un método e� iente para la represen-
34 Capítulo 3. Detección de escalas globales
ta ión de formas de nivel de gris que solu ione algunos de los in onvenientes que
presentan los métodos tradi ionales multies ala.
Si retomamos el ejemplo del árbol, podemos obtener una se uen ia de imágenes
emborronadas mediante un �ltro gaussiano tomando un rango de es alas su� iente-
mente amplio. Para es alas grandes, todas las hojas apare erán omo una úni a masa
emborronada formando lo que sería la opa del árbol. Conforme vamos de re iendo
en la es ala irán apare iendo on más nitidez las hojas separadas entre sí y si segui-
mos disminuyendo de es ala podremos llegar al nivel de detalle de las venosidades
en las hojas. Por tanto debería haber un rango natural de es alas determinado por
los distintos niveles signi� ativos de des rip ión. El punto importante es que para
a es alas naturales, las estru turas orrespondientes estarán bien ontrastadas y así
tendrán un ontorno bien de�nido. Por tanto, para resolver nuestro problema hare-
mos uso de una fun ión de enfoque que medirá la laridad on que son distinguidas
las estru turas de la imagen �ltrada mediante un nú leo gaussiano de es ala �. Pues-
to que estamos asumiendo un modelo de separa ión en anales espa io-fre uen iales
independientes, esta fun ión de enfoque habrá que apli arla sobre ada una de las
imagenes obtenidas tras realizar un �ltrado previo que sele ione los omponentes
fre uen iales que pertenez an a ada anal. Conse uentemente, dado un sensor, ten-
dremos que ha er un �ltrado que restrinja los omponentes fre uen iales afe tados
para posteriormente al ular la fun ión de enfoque propuesta sobre la imagen �ltrada
variando la es ala � en un rango dis reto de valores. Un nivel de emborronamiento �
que produz a un máximo lo al de la fun ión de enfoque será una es ala signi� ativa a
la que apare en estru turas signi� ativas on omponentes fre uen iales en el rango
de�nido por el sensor.
En este estudio se han onsiderado 4 posibles fun iones de enfoque debido a su
simpli idad omputa ional y sus buenas propiedades (Yeo et al. [125℄): Tenengrad,
Brenner, Gradiente uadráti o y Varianza. Con las tres primeras fun iones se estu-
dia el gradiente de la imagen partiendo de la base de que uanto mayor sea di ho
gradiente mejor de�nidos estarán los ontornos.
Puesto que una imagen es, en de�nitiva, algo físi amante observable (la luminan-
ia en fun ión de las oordenadas espa iales), es ne esario que expresemos la es ala
en unidades adimensionales, he ho este que se deriva de la ley de invarianza frente a
es ala (ver Flora k et al. [33℄ para más detalles).
Dada una imagen f(x; y) y un sensor S, vamos a de�nir la respuesta de la imagen
frente al sensor S a es ala � omo:
J
S
(x; y; �) = jf(x; y) gb (x; y; �; �
S
; �
S
)j (3.1)
3.1. Detección de escalas significativas 35
donde �
S
y �
S
son el ángulo medio y la fre uen ia radial media del sensor S
respe tivamente, y la fun ión gb() es un �ltro de Gabor omplejo de�nido en la e ua-
ión 2.5. De esta forma, al onvolu ionar la imagen on el �ltro de Gabor omplejo
entrado en �
S
y �
S
, estamos realizando un �ltrado de aquellas fre uen ias que se
en uentran en el área espe tral o upada por el sensor S. El objetivo es determinar
las es alas naturales óptimas �
1
, �
2
, ..., �
k
para di ho sensor. La opera ión jj obtiene
la envolvente o módulo de la imagen ompleja que se obtiene tras �ltrar on el �ltro
de Gabor y se de�ne omo:
jt(x; y)j =
q
t
2
real
(x; y) + t
2
imag
(x; y) (3.2)
Se parte de la idea de que las estru turas espa iales on omponentes fre uen ia-
les en el sensor S deberían apare er mejor ontrastadas uando �ltramos la imagen
f(x; y) a una es ala signi� ativa que uando lo ha emos a una es ala po o signi� a-
tiva. Para determinar la nitidez de las estru turas presentes en una imagen �ltrada a
es ala � haremos uso de los uatro riterios de enfoque men ionados anteriormente.
✮ Criterio de la Varianza
Es de esperar que las es alas signi� ativas aso iadas a las estru turas presentes en un
anal deberán produ ir un alisamiento de la respuesta on mayor varianza de niveles
de gris que los alisamientos a es alas no signi� ativas. Esto sugiere que una posible
fun ión de enfoque sea la varianza de niveles de gris de la imagen dada por:
C
1
S
(�) =
X
x
X
y
(J
S
(x; y; �) � �
S;�
)
2
(3.3)
donde �
S;�
es la media de niveles de gris de J
S
(x; y; �):
�
S;�
=
1
N �M
X
x
X
y
J
S
(x; y; �) (3.4)
y donde N y M son los tamaños horizontal y verti al en píxeles de la imagen.
✮ Criterio de Brenner
Con esta fun ión se pretende medir la nitidez de las fronteras de la imagen respuesta.
Una imagen más nítida tendrá unas fronteras mejor de�nidas y, por tanto, si al u-
lamos el gradiente de di ha imagen, tendremos que en los bordes de las estru turas
este tendrá un valor relativamente más elevado. El gradiente es al ulado de una
forma muy simple:
36 Capítulo 3. Detección de escalas globales
C
2
S
(�) =
X
x
X
y
(J
S
(x+ 2; y; �) � J
S
(x; y; �))
2
(3.5)
✮ Criterio de Tenengrad
De nuevo, este riterio se basa en el ál ulo del gradiente, aunque se ha e uso de un
operador más so�sti ado que tiene en uenta el gradiente verti al y horizontal:
C
3
S
(�) =
X
x
X
y
�
�
�
S
2
h
(x; y; �) + S
2
v
(x; y; �)
�
�
�
(3.6)
donde S
h
y S
v
son las onvolu iones de J
S
on los operadores de Sobel horizontal
y verti al respe tivamente y que se pueden ver en la tabla siguiente:
-1 0 1 1 2 1
-2 0 2 0 0 0
-1 0 1 -1 -2 -1
M
SH
M
SV
es de ir:
S
h
(x; y; �) = J
S
(x; y; �) M
SH
(3.7)
y
S
v
(x; y; �) = J
S
(x; y; �) M
SV
(3.8)
✮ Criterio del Gradiente uadráti o
Esta fun ión parte de la misma idea que los dos métodos anteriores, pero al ula el
gradiente omo diferen ia entre píxeles adya entes horizontales y verti ales:
C
4
S
(�) =
X
x
X
y
�
(J
S
(x+ 1; y; �) � J
S
(x; y; �))
2
+ (J
S
(x; y + 1; �)� J
S
(x; y; �))
2
�
(3.9)
Una vez formulados los uatro riterios, el objetivo es en ontrar, para ada uno de
ellos las es alas (�) que los maximizan. La ompara ión entre estas uatro fun iones
se ha he ho teniendo en uenta 3 riterios de evalua ión:
1. La fun ión de enfoque debe de ser omputa ionalmente e� iente.
3.1. Detección de escalas significativas 37
2. La fun ión de enfoque deberá al anzar máximos en aquellos puntos que se
orrespondan on es alas signi� ativas de estru turas presentes en la imagen y
on ontenido espe tral en el sensor analizado.
3. La fun ión de enfoque ha de ser robusta frente al ruido.
Respe to a la e� ien ia, las uatro fun iones son relativamente sen illas desde el
punto de vista omputa ional y por tanto esta ondi ión se umple sin problema.
El umplimiento del segundo punto se analiza en la se ión 3.1.2 donde se ha e
una dis usión al respe to en base a resultados experimentales.
Para determinar si la fun ión umple o no el ter er objetivo se han realizado una
serie de experimentos que se muestran en la se ión 3.1.3.
En el estudio de éste o de ualquier otro trabajo que entre su aten ión sobre
la sele ión de es alas signi� ativas sin informa ión a priori, hay que tener presente
que estamos ante un problema bastante omplejo y posiblemente intratable desde
un punto de vista puramente matemáti o. Por tanto, las solu iones aquí aportadas
no pretenden ser exa tas ni óptimas, sino sólo una aproxima ión que nos permita
generar unas hipótesis de partida válidas.
3.1.2 Resultados experimentales
Para determinar la validez de las es alas dete tadas por ada uno de los uatro
riterios de enfoque propuestos los apli aremos sobre una imagen sintéti a (se ión
3.1.2.1), y dos imágenes naturales, una biomédi a (se ión 3.1.2.2) y una que ontiene
una galaxia espiral (se ión 3.1.2.3).
3.1.2.1 Imagen sintéti a
En este experimento se pretende ha er un estudio ontrolado sobre la bondad de
las es alas que son apa es de dete tar ada uno de los métodos propuestos. La
imagen en uestión se puede ver en la �gura 3.1. En la misma imagen se pueden
ver, además, los sensores a tivados de la parti ión multisensor. Esta imagen se ha
generado insertando una serie de ír ulos pequeños formando dos grupos de siete.
Cada ír ulo es una pequeña ampana de gauss.
Si ha emos un estudio visual de la imagen podemos distinguir varias estru turas
sin mayor problema. La primera estru tura que somos apa es de separar del resto
son los pequeños ír ulos individuales. Si vemos la parti ión multisensor observamos
que son a tivados uatro sensores, en las uatro orienta iones, de aproximadamante
el mismo rango de fre uen ias espa iales. Cada uno de ellos ontiene la informa ión
38 Capítulo 3. Detección de escalas globales
PSfrag repla ements
(A) (B)
Figura 3.1: (A) Imagen sintéti a. (B) Sensores a tivos.
Sensor S
rmin
S
rmax
S
amin
S
amax
S
0
8 14 135
Æ
180
Æ
S
1
8 13 0
Æ
45
Æ
S
2
6 13 45
Æ
90
Æ
S
3
7 12 90
Æ
135
Æ
S
4
2 8 0
Æ
45
Æ
Tabla 3.1: Parámetros de los sensores a tivos de la imagen sintéti a.
fre uen ial aso iada a las estru turas del tamaño de las pequeñas bolas. Puesto que
las bolas son isotrópi as son dete tadas en todas las orienta iones. Si seguimos on
nuestro estudio visual, y analizamos la es ena a una es ala superior, podemos ver dos
agrupa iones laras que onstan de siete bolas ada una y si seguimos aumentando
de es ala podemos ver una úni a agrupa ión on una orienta ión de algo más de 90
grados.
Ahora vamos a ver los resultados que propor ionan los métodos bajo estudio. En
la tabla 3.1 se pueden ver los datos numéri os orrespondientes a los sensores a tivos.
En la �gura 3.2 se muestran las fun iones de enfoque para esta imagen y en la
tabla 3.2 se resumen las es alas signi� ativas.
Sensor Varianza Tenengrad Brenner Gradiente C.
S
0
2, 11 2 0.5, 6.5, 14, 24.5 2, 3
S
1
2, 15.5 2 0.5, 6, 20.5, 24.5 2, 3
S
2
2.5 2 0.5, 6, 24.5 2
S
3
2.5, 6 2 0.5, 6, 19.5, 24.5 2
S
4
3.5 2 0.5, 11.5, 24.5 2
Tabla 3.2: Es alas signi� ativas dete tadas por ada uno de los riterios estudiados para los
sensores a tivos de la imagen sintéti a.
3.1. Detección de escalas significativas 39
0
200
400
600
800
1000
1200
1400
1600
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
1e+07
2e+07
3e+07
4e+07
5e+07
6e+07
7e+07
8e+07
9e+07
1e+08
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
2000
4000
6000
8000
10000
12000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
200000
400000
600000
800000
1e+06
1.2e+06
1.4e+06
1.6e+06
1.8e+06
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
0
500
1000
1500
2000
2500
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
1e+07
2e+07
3e+07
4e+07
5e+07
6e+07
7e+07
8e+07
9e+07
1e+08
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
5000
10000
15000
20000
25000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
200000
400000
600000
800000
1e+06
1.2e+06
1.4e+06
1.6e+06
1.8e+06
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
0
100
200
300
400
500
600
700
800
900
1000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
2e+07
4e+07
6e+07
8e+07
1e+08
1.2e+08
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
2000
4000
6000
8000
10000
12000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
200000
400000
600000
800000
1e+06
1.2e+06
1.4e+06
1.6e+06
1.8e+06
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
0
100
200
300
400
500
600
700
800
900
1000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
2e+07
4e+07
6e+07
8e+07
1e+08
1.2e+08
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
2000
4000
6000
8000
10000
12000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
200000
400000
600000
800000
1e+06
1.2e+06
1.4e+06
1.6e+06
1.8e+06
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
0
200
400
600
800
1000
1200
1400
1600
1800
2000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
2e+07
4e+07
6e+07
8e+07
1e+08
1.2e+08
1.4e+08
1.6e+08
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
5000
10000
15000
20000
25000
30000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
500000
1e+06
1.5e+06
2e+06
2.5e+06
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
PSfrag repla ements
S
0
S
1
S
2
S
3
S
4
Figura 3.2: Fun iones de autoenfoque para los sensores de la imagen sintéti a. En la primera
olumna están las fun iones orrespondientes al riterio de la Varianza, en la
segunda las de Tenengrad, en la ter era las de Brenner y en la uarta las del
Gradiente Cuadráti o.
40 Capítulo 3. Detección de escalas globales
Para ha er una orre ta interpreta ión de los datos mostrados hay que tener en
uenta los on eptos de es ala interna y es ala externa de una imagen (Koenderink
[60℄). Ambas es alas ha en referen ia, respe tivamente, al tamaño mínimo y máximo
que pueden tener las estru turas presentes en la imagen. La es ala interna vendrá
dada por la resolu ión de la imagen y la externa por el tamaño de la imagen. En
mu hos asos se puede ver que se obtienen es alas signi� ativas muy altas, estas no
deberían ser tenidas en uenta debido a que están por en ima de la es ala externa de
la imagen. De igual forma, en determinados asos se obtienen es alas muy pequeñas
que están por debajo de la es ala interna. En nuestro aso on reto, puesto que
estamos ha iendo un análisis sobre un espe tro de fre uen ias parti ionado, estas
es alas estarán a otadas también por las fre uen ias radiales que de�nen ada sensor,
es de ir, en sensores de fre uen ias muy bajas, la es ala interna aumentará y en
sensores de fre uen ias altas la es ala externa disminuirá.
La evalua ión de las fun iones de enfoque se ha e en un rango dis reto de es alas
(en este aso on reto hasta � = 24:5) y en el aso de que la fun ión sea re iente
al �nal de este rango impli a que se mar ará el punto � = 24:5 omo máximo lo al
aunque el máximo de la fun ión se en uentre más a la dere ha del mismo.
En la �gura 3.3 se pueden ver las respuestas que produ en los sensores a tivos
onsiderando las es alas signi� ativas dete tadas por el riterio de Brenner para la
imagen sintéti a. Las imágenes de esta �gura se obtienen �ltrando la imagen original
on fun iones de Gabor que tienen omo parámetros los de los sensores a tivos junto
on las es alas dete tadas.
Obviamente, tras ver los resultados, el riterio que más es alas dete ta es el de
Brenner; la uestión es determinar la alidad de di has es alas. Como punto de
partida podemos partir del análisis visual previo que hi imos sobre esta imagen.
Este riterio es apaz de dete tar las bolas de forma individual (primera olumna de
la �gura 3.3) y las dos estru turas de orden superior men ionadas ( on los sensores
S
0
y S
1
). Además de estos objetos, también realiza otras uniones de bolas, en grupos
de dos y de tres y en diversas orienta iones que también tienen sentido. Los otros
riterios también dete tan las estru turas bási as (bolas individuales) pero no son
apa es de unir di has estru turas para formar agrupa iones on sentido. El úni o
que dete ta algunas de estas es alas grandes es el de la Varianza.
En la �gura 3.4 tenemos algunas de las estru turas que se dete tan on los otros
tres riterios y no on el riterio de Brenner. Estas es alas dete tan las bolas de forma
individual. La es ala en este aso es algo superior a la dete tada por Brenner para
las bolas individuales pero es orre to en ambos asos ya que lo que pretendemos es
dar una aproxima ión para el ál ulo de di has es alas y, en ualquier aso, el sentido
3.1. Detección de escalas significativas 41
PSfrag repla ements
S
0
S
1
S
2
S
3
S
4
� = 0:5
� = 0:5
� = 0:5
� = 0:5
� = 0:5 � = 6:5 � = 14
� = 24:5
� = 24:5
� = 24:5
� = 24:5
� = 24:5
� = 6
� = 6
� = 6 � = 20:5
� = 19:5
� = 11:5
Figura 3.3: Es alas dete tadas on el riterio de Brenner.
42 Capítulo 3. Detección de escalas globales
PSfrag repla ements
S
0
S
1
S
2
S
3
� = 2� = 2 � = 2:5� = 2:5
Figura 3.4: Algunas de las es alas dete tadas on el riterio de la varianza.
PSfrag repla ements
(A) (B)
Figura 3.5: (A) Imagen biomédi a. (B) Sele ión de sensores a tivos.
de las es alas es obtener el parámetro ne esario para la fun ión de Gabor de forma
que se per iban estru turas on sentido en la imagen.
Tras estudiar este aso, pare e laro que los riterios de Tenengrad y del Gradien-
te uadráti o no produ en muy buenos resultados ya que se limitan a dete tar las
estru turas bási as que hay en la imagen sin dete tar agrupa iones de las mismas.
Por ontra, Brenner es apaz de realizar distintas agrupa iones de estru turas indi-
viduales para formar estru turas más omplejas que ninguno de los otros riterios es
apaz de onseguir. El riterio de la Varianza dete ta las estru turas individuales y
algunas de las posibles agrupa iones que se pueden extraer de la imagen.
3.1.2.2 Imagen biomédi a
Este experimento es una répli a del anterior pero realizado sobre una imagen natural.
En la �gura 3.5 tenemos una imagen biomédi a de tamaño 128x128 píxeles junto on
la sele ión de sensores a tivos para la misma. Los datos numéri os que re�ejan
di hos sensores a tivos se pueden ver en la tabla 3.3.
En las �guras 3.6 y 3.7 se pueden ver las fun iones de autoenfoque que se obtienen
3.1. Detección de escalas significativas 43
Sensor S
rmin
S
rmax
S
amin
S
amax
S
0
2 10 135
Æ
180
Æ
S
1
1 6 0
Æ
45
Æ
S
2
6 13 90
Æ
135
Æ
S
3
2 6 90
Æ
135
Æ
S
4
2 6 45
Æ
90
Æ
S
5
6 10 0
Æ
45
Æ
Tabla 3.3: Parámetros de los sensores a tivos de la imagen biomédi a de la �gura 3.5. Para
ada sensor S (�las) se muestra la fre uen ia radial mínima S
rmin
, la fre uen ia
radial máxima S
rmax
, el ángulo mínimo S
amin
y el ángulo máximo S
amax
. Las
fre uen ias se dan en i los por pixel ( pp) y los ángulos en grados.
Sensor Varianza Tenengrad Brenner Gradiente C.
S
0
3, 23 2.5 3.5, 14.5 2.5
S
1
13, 24 4.5, 13 6.5, 24.5 4.5, 13.5
S
2
2, 6.5, 24.5 2 2, 7.5 1.5
S
3
4 3.5, 9 3, 10, 17.5 3, 9
S
4
4.5 3.5 2.5, 18 3.5
S
5
2.5, 8.5 2.5 2, 8.5, 23.5 2.5, 5
Tabla 3.4: Es alas de la imagen biomédi a obtenidas para ada sensor y on los uatro ri-
terios de enfoque.
para ada uno de los riterios y sensores a tivos. En la tabla 3.4 se pueden ver las
es alas dete tadas para ada sensor y riterio.
Al igual que o urría en el experimento de la se ión anterior, Brenner es el riterio
on mayor riqueza de es alas sele ionadas y Tenengrad y el Gradiente Cuadráti o
los más pobres. La Varianza dete ta orre tamente las estru turas pequeñas pero de-
te ta menos agrupa iones que Brenner. En la �gura 3.8 se pueden ver algunas de las
imágenes �ltradas para los sensores a tivos y ha iendo uso de las es alas dete tadas
por los uatro métodos. Puesto que las élulas de la imagen son aproximadamente
ir ulares y de un tamaño similar y relativamente grande, es lógi o que tengamos
sensores a tivos en las uatro orienta iones y de fre uen ias bajas. Es en estos senso-
res donde se dete ta la presen ia de las élulas omo estru turas independientes on
una es ala � que varía entre 3 y 4. Además de estas estru turas, también se dete tan
estru turas un po o menores que se orresponderían on los omponentes internos
de las élulas. Finalmente, algunas élulas se unen para rear una nueva estru tura
de mayor tamaño.
44 Capítulo 3. Detección de escalas globales
0
1e+07
2e+07
3e+07
4e+07
5e+07
6e+07
7e+07
8e+07
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
2e+07
4e+07
6e+07
8e+07
1e+08
1.2e+08
1.4e+08
1.6e+08
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
1e+07
2e+07
3e+07
4e+07
5e+07
6e+07
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
0
1e+07
2e+07
3e+07
4e+07
5e+07
6e+07
7e+07
8e+07
9e+07
1e+08
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
1e+07
2e+07
3e+07
4e+07
5e+07
6e+07
7e+07
8e+07
9e+07
1e+08
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
1e+07
2e+07
3e+07
4e+07
5e+07
6e+07
7e+07
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
0
200
400
600
800
1000
1200
1400
1600
1800
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
1000
2000
3000
4000
5000
6000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
100
200
300
400
500
600
700
800
900
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
0
500
1000
1500
2000
2500
3000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
500
1000
1500
2000
2500
3000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
200
400
600
800
1000
1200
1400
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
PSfrag repla ements
S
0
S
0
S
1
S
1
S
2
S
2
S
3
S
3
S
4
S
4
S
5
S
5
Varianza
Tenengrad
Figura 3.6: Fun iones de autoenfoque de la imagen biomédi a para los riterios de la Va-
rianza y Tenengrad.
3.1. Detección de escalas significativas 45
0
200000
400000
600000
800000
1e+06
1.2e+06
1.4e+06
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
500000
1e+06
1.5e+06
2e+06
2.5e+06
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
100000
200000
300000
400000
500000
600000
700000
800000
900000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
0
200000
400000
600000
800000
1e+06
1.2e+06
1.4e+06
1.6e+06
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
200000
400000
600000
800000
1e+06
1.2e+06
1.4e+06
1.6e+06
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
200000
400000
600000
800000
1e+06
1.2e+06
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
0
500000
1e+06
1.5e+06
2e+06
2.5e+06
3e+06
3.5e+06
4e+06
4.5e+06
5e+06
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
1e+06
2e+06
3e+06
4e+06
5e+06
6e+06
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
500000
1e+06
1.5e+06
2e+06
2.5e+06
3e+06
3.5e+06
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
0
500000
1e+06
1.5e+06
2e+06
2.5e+06
3e+06
3.5e+06
4e+06
4.5e+06
5e+06
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
500000
1e+06
1.5e+06
2e+06
2.5e+06
3e+06
3.5e+06
4e+06
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
200000
400000
600000
800000
1e+06
1.2e+06
1.4e+06
1.6e+06
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
PSfrag repla ements
S
0
S
0
S
1
S
1
S
2
S
2
S
3
S
3
S
4
S
4
S
5
S
5
Brenner
Gradiente uadráti o
Figura 3.7: Fun iones de autoenfoque de la imagen biomédi a para los riterios de Brenner
y Gradiente uadráti o.
46 Capítulo 3. Detección de escalas globales
PSfrag repla ements
(A) (B) (C)
(D) (E) (F)
(G) (H) (I)
Figura 3.8: Imagen biomédi a �ltrada de a uerdo a distintos sensores a tivos y algunas de
las es alas signi� ativas dete tadas. (A) Sensor S
0
, � = 3. (B) Sensor S
1
,
� = 4:5. (C) Sensor S
1
, � = 13. (D) Sensor S
2
, � = 2. (E) Sensor S
2
,
� = 7:5. (F) Sensor S
3
, � = 3:5. (G) Sensor S
3
, � = 9. (H) Sensor S
4
,
� = 3:5. (I) Sensor S
5
, � = 8:5.
3.1. Detección de escalas significativas 47
PSfrag repla ements
(A) (B)
Figura 3.9: (A) Imagen astronómi a. (B) Sensores a tivos.
Sensor S
rmin
S
rmax
S
amin
S
amax
S
0
3 9 90
Æ
135
Æ
S
1
1 7 135
Æ
180
Æ
S
2
2 6 0
Æ
45
Æ
S
3
7 13 135
Æ
180
Æ
S
4
6 10 0
Æ
45
Æ
S
5
4 8 45
Æ
90
Æ
S
6
10 15 0
Æ
45
Æ
S
7
15 20 90
Æ
135
Æ
S
8
15 19 45
Æ
90
Æ
S
9
11 15 45
Æ
90
Æ
S
10
8 11 45
Æ
90
Æ
S
11
11 15 90
Æ
135
Æ
Tabla 3.5: Parámetros de los sensores a tivos de la imagen astronómi a.
3.1.2.3 Imagen astronómi a
Este experimento es una répli a del anterior sobre la imagen astronómi a de la �gura
3.9. En di ha �gura se pueden ver también los sensores a tivos dete tados.
En la tabla 3.5 se muestran los datos númeri os que des riben ada sensor a tivo.
Tras apli ar los uatro riterios de enfoque se obtienen las es alas de la tabla 3.6.
En la �gura 3.10 se pueden ver algunas de estas fun iones de enfoque. Aunque no se
muestran todas, las demás son similares en uanto al omportamiento global.
Con esta imagen, los riterios de Tenengrad y el Gradiente uadráti o tienen
problemas para dete tar es alas que no sean la es ala interna de la imagen debido,
posiblemente, a la omplejidad que tienen las estru turas pequeñas que existen en
la imagen. Este problema se ha dado en otras imágenes usadas durante el pro eso
de experimenta ión siendo más agudo on el riterio del Gradiente uadráti o. De
48 Capítulo 3. Detección de escalas globales
0
500
1000
1500
2000
2500
3000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
1e+07
2e+07
3e+07
4e+07
5e+07
6e+07
7e+07
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
500000
1e+06
1.5e+06
2e+06
2.5e+06
3e+06
3.5e+06
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
500000
1e+06
1.5e+06
2e+06
2.5e+06
3e+06
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
0
500
1000
1500
2000
2500
3000
3500
4000
4500
5000
5500
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
1e+07
2e+07
3e+07
4e+07
5e+07
6e+07
7e+07
8e+07
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
500000
1e+06
1.5e+06
2e+06
2.5e+06
3e+06
3.5e+06
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
500000
1e+06
1.5e+06
2e+06
2.5e+06
3e+06
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
0
200
400
600
800
1000
1200
1400
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
1e+07
2e+07
3e+07
4e+07
5e+07
6e+07
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
500000
1e+06
1.5e+06
2e+06
2.5e+06
3e+06
3.5e+06
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
500000
1e+06
1.5e+06
2e+06
2.5e+06
3e+06
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
0
50
100
150
200
250
300
350
400
450
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
5e+06
1e+07
1.5e+07
2e+07
2.5e+07
3e+07
3.5e+07
4e+07
4.5e+07
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
200000
400000
600000
800000
1e+06
1.2e+06
1.4e+06
1.6e+06
1.8e+06
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
500000
1e+06
1.5e+06
2e+06
2.5e+06
3e+06
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
0
50
100
150
200
250
300
350
400
450
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
5e+06
1e+07
1.5e+07
2e+07
2.5e+07
3e+07
3.5e+07
4e+07
4.5e+07
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
500000
1e+06
1.5e+06
2e+06
2.5e+06
3e+06
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240
500000
1e+06
1.5e+06
2e+06
2.5e+06
3e+06
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
PSfrag repla ements
S
0
S
1
S
3
S
7
S
8
Figura 3.10: Fun iones de autoenfoque para los sensores S
0
, S
1
, S
3
, S
7
y S
8
de la imagen
astronómi a. En la primera olumna están las fun iones orrespondientes al
riterio de la Varianza, en la segunda las de Tenengrad, en la ter era las de
Brenner y en la uarta las del Gradiente Cuadráti o.
3.1. Detección de escalas significativas 49
Sensor Varianza Tenengrad Brenner Gradiente C.
S
0
3.5 2 1, 15 0.5
S
1
4.5 3 1, 5.5, 12.5, 19.5 0.5
S
2
4.5 3.5 1, 11 0.5, 3
S
3
2 1 1, 6, 7.5 0.5
S
4
2.5 1.5 1 0.5
S
5
3.5 2 1 0.5
S
6
1.5 1 1.5, 9, 24.5 0.5
S
7
1, 7.5 1 1, 3, 11, 18 0.5
S
8
1, 21 1 1, 7, 11.5 0.5
S
9
1.5, 17 1 1, 21 0.5
S
10
2 1.5 1, 5.5, 12 0.5
S
11
1.5 1 1, 9.5 0.5
Tabla 3.6: Es alas signi� ativas dete tadas por ada uno de los riterios estudiados para los
sensores a tivos de la imagen astronómi a.
nuevo es Brenner el riterio que más es alas dete ta.
En la �gura 3.11 se pueden ver algunas de las imágenes �ltradas on las es alas
dete tadas.
Como on lusión de los tres experimentos mostrados (que sólo son una muestra
representativa de los que se han realizado), podemos on luir lo siguiente:
✮ Las fun iones de Tenengrad y Gradiente uadráti o no pare en muy estables en
uanto a la antidad y alidad de es alas dete tadas. Generalmente dete tan
menos es alas que los otros dos métodos y en o asiones se limitan a extraer
úni amente la es ala externa.
✮ La fun ión Varianza mantiene onstan ia en uanto a la dete ión de estru tu-
ras bási as en la imagen aunque tiene algunas di� ultades para dete tar objetos
de es alas grandes que impli an la agrupa ión de objetos más pequeños en uno
sólo.
✮ La fun ión de Brenner, además de dete tar las es alas de las estru turas bási as,
tiene la ventaja de dete tar es alas que se orresponden on agrupa iones de
estru turas individuales.
En de�nitiva, las dos fun iones que mejor pare en omportarse en uanto a la alidad
de las es alas obtenidas son Brenner y la Varianza.
50 Capítulo 3. Detección de escalas globales
PSfrag repla ements
(A) (B) (C)
(D) (E) (F)
(G) (H) (I)
Figura 3.11: Imagen astronómi a �ltrada de a uerdo a distintos sensores a tivos y algunas
de las es alas signi� ativas dete tadas. (A) Sensor S
0
, � = 3:5. (B) Sensor
S
1
, � = 5:5. (C) Sensor S
1
, � = 12:5. (D) Sensor S
3
, � = 2. (E) Sensor S
3
,
� = 6. (F) Sensor S
6
, � = 9. (G) Sensor S
7
, � = 7:5. (H) Sensor S
7
, � = 3.
(I) Sensor S
7
, � = 11.
3.1. Detección de escalas significativas 51
3.1.3 Robustez frente al ruido
Con los experimentos que se muestran en esta se ión se pretende omprobar la
robustez que tienen los uatro métodos bajo estudio frente a la presen ia de ruido
normal. Para ello se ha añadido ruido blan o normal de media 0 y diferentes desvia-
iones típi as (10, 20, 30, 40 y 50) a dos de las imágenes usadas en el experimento
anterior (biomédi a y sintéti a). Posteriormente se ha al ulado la parti ión multi-
sensor sobre ada una de ellas y se han apli ado los uatro métodos de enfoque sobre
los nuevos sensores a tivos dete tados.
Puesto que estamos realizando de nuevo el ál ulo de las parti iones multisensor
sobre las imágenes ruidosas, es posible que estas parti iones di�eran de las parti iones
que se obtenían sobre las imágenes originales (sin ruido), de he ho, es previsible que
o urra esto. El objeto de este experimento es analizar el omportamiento de los
métodos sobre imágenes ruidosas y, por tanto, nos vamos a entrar sólo en aquellos
sensores a tivos de las nuevas parti iones que oin idan on sensores a tivos que se
dete taron para las imágenes originales.
En la �gura 3.12 podemos ver la imagen biomédi a de la �gura 3.5 tras haberle
añadido diferentes niveles de ruido.
En la �gura 3.13 se puede ver la evolu ión de las es alas sobre los sensores de-
�nidos en la tabla 3.3. El sensor S
0
no es dete tado omo a tivo en las imágenes
ruidosas de desvia ión típi a � = 40 y � = 50; en su lugar, apare en dos nuevos
sensores que tienen, ada uno de ellos, parte de las fre uen ias re ogidas por S
0
.
Algo similar o urre on el sensor S
5
y la imagen ruidosa on � = 20.
En esta tabla tenemos una �la por ada uno de los sensores analizados y una
olumna por ada riterio de enfoque. Para ada riterio de enfoque tenemos seis
sub olumnas, una para ada imagen usada (la primera ha e referen ia a la imagen
original y las in o restantes a ada una de las imágenes ruidosas). Dada una �la
(sensor) y una sub olumna (método de enfoque e imagen usada), podemos ver las
es alas signi� ativas dete tadas.
En la imagen 3.14 se puede ver la imagen sintéti a de la �gura 3.1 distorsionada
on la presen ia de ruido normal.
En la �gura 3.15 apare e la evolu ión de las es alas ante la presen ia de ruido. De
nuevo, sólo se han onsiderado aquellos sensores que fueron dete tados omo a tivos
en la imagen sin ruido.
Ante la presen ia de ruido, es normal que haya varia iones en las es alas signi-
� ativas de la imagen, ya que, si este es su� ientemente alto, los puntos ruidosos
se unirán a las estru turas que hay en la imagen y harán que estas aumenten o
52 Capítulo 3. Detección de escalas globales
PSfrag repla ements
� = 10 � = 20 � = 30
� = 40 � = 50
Figura 3.12: Imagen biomédi a on diferentes niveles de ruido.
3.1.D
etecciónde
escalassignificativas
53
Orig OrigOrig
3323 23 22.5 24
33
Orig
2.5 2.5 2.5 2 0.53.514
0.5
144
0.52.5
0.52.5
0.5
1324
14.53.5
153
2412.5 13
2414.523.5 24
1524
14.5 1 0.53.5
15.514.53.51513.5
412.5
4.5 4.513
40.55.5
24.56.5
245.5
0.59.524
110.524
9.5
2.5
13.54.5
0.5
12.54
13.5 14.5
0.50.54
0.54
0.53.515 15.5
26.5
24.5
2.57.5
2
24.5
2 2 2 2 1.5 2 1 0.5 0.5 0.5
4.57.5
0.52.52
7.5
2
8.55.52
75
7.5
1
7.55.52 1.5 1.5
0.5 0.5 0.5 0.5 0.5
4 4 4 4.5 4 410 10
1
10.5
0.5
10.5103
9.53
8.593.5 3.5
0.53
9.517.517.5
103
18.510.52.5
0.53
1117 18.5
11.5
1
1711.52.5
93
0.50.52.5
0.5
13.5
0.53
8.54
10.5 10.5
0.5
11
4.5 4.5 4.5 4.5 4 43.5 3.5 3 3
1 0.52.518
0.53
17.5 192.5
0.53
18
1
16.5 192.5
0.53.5
0.53.5 3
0.5 0.52.5
0.5
2.58.5
2.58.5
2.58.5
2.514
2.58.5
2.5 2.5 1.55.5
15.5
0.5 0.528
23
28.5
23.5
0.52.58.521
1
822
0.52.5
22.59
0.5
6
0.5
6
0.5
5.552.5
Varianza Tenengrad Brenner Gradiente C.
24.5
0.52
PSfragrepla ements
S
0
S
1
S
2
S
3
S
4
S
5
�
10
�
10
�
10
�
10
�
20
�
20
�
20
�
20
�
30
�
30
�
30
�
30
�
40
�
40
�
40
�
40
�
50
�
50
�
50
�
50
Figura3.13:Evolu ióndelases alasdelaimagenbiomédi aenpresen iaderuido.
54 Capítulo 3. Detección de escalas globales
PSfrag repla ements
� = 10 � = 20 � = 30
� = 40 � = 50
Figura 3.14: Imagen sintéti a on diferentes niveles de ruido.
3.1.D
etecciónde
escalassignificativas
55
Orig OrigOrig OrigVarianza Tenengrad Brenner Gradiente C.
2211 11 11
2 211
2 21111.5
2 23
1.5 1.53.5
13.5
14
0.5 0.5 1
7.5
0.52
1324.5
5.5
24.524.524.514 14
548 8
5.5
0.5 0.5
24.511.5
5
0.51.53.53
223 3.5
0.5 0.5
4 4
0.5
215.5
215.5 16
2 216
215
216.5
1.5 1.5 1.5 1443.53.5
0.5 0.5258
13
0.5 0.53
24.514
2324.520.5
0.5
24.5 24.5
0.5
5.5
0.5 0.5
31.5
0.51.53.5 3.5 4 4
0.5
2.5 2.5 2 2 2 2.5 2 2 1.5 1.5 1.5 1 0.5 0.51.54.5
0.5
24.5 24.58
67
0.52.56.58
18
0.5
24.56.54.5
0.5
14.59.58
20.50.5 0.5 0.5
1.52
2.5 2.56
26
26
26.5
26.5
2 2 2 1.53.5
1.54
14
0.5 0.52
5.5
0.5 0.5 0.547
12
0.5
24.52424.524.519.5
6 6.511
23
7 7.5 7.56
22
6.5
24.5
58
2 2 0.51.5
0.53.5
0.54
0.54
3.5
6
3.5 3.5 3.5 3.53.5 2 2 1.52 2 1.5 0.5
18
0.5 0.51.5
10.524.524.5
11.524.510
0.5 0.52 7.5
0.54.514
24.524.5
0.51.5
0.5 0.50.5222
PSfragrepla ements
S
0
S
1
S
2
S
3
S
4
�
10
�
10
�
10
�
10
�
20
�
20
�
20
�
20
�
30
�
30
�
30
�
30
�
40
�
40
�
40
�
40
�
50
�
50
�
50
�
50
Figura3.15:Evolu ióndelases alasdelaimagensintéti aenpresen iaderuido.
56 Capítulo 3. Detección de escalas globales
disminuyan su tamaño.
A la vista de estos experimentos, el riterio de Tenengrad y el del Gradiente
uadráti o son los que antes se dejan in�uir por la presen ia de ruido y modi� an
las es alas que se dete taban en las imágenes originales o rean o eliminan alguna
de las mismas. El riterio que pare e mantener una mayor robustez en uanto a la
magnitud de las es alas y repe to al número de es alas que se dete tan es el de la
Varianza. Este riterio mantiene asi siempre la es ala de las estru turas bási as
presentes en la imagen original. El riterio de Brenner sigue siendo bastante ri o
en uanto a la antidad de estru turas que dete ta. Es más sensible al ruido que la
Varianza pero esto tiene sentido ya que al añadir niveles de ruido altos se forman
nuevas estru turas y se modi� an las que ya existían en la imagen.
3.1.4 Comentarios �nales
Las fun iones de Tenengrad y Gradiente uadráti o no se onsideran buenas para la
dete ión de es alas debido a la pobreza de las que dete tan y a la po a estabilidad
ante la presen ia de ruido. La fun ión Varianza es su� ientemente robusta para la
dete ión de es alas bási as en la imagen aun en presen ia de ruido. La fun ión de
Brenner es, sin lugar a dudas, la que dete ta mayor antidad de es alas, espe ialmente
aquellas que surgen omo resultado de agrupar estru turas pequeñas. Por tanto, si
nuestro objetivo es dete tar las es alas bási as de la imagen nos será indiferente usar
la Varianza o Brenner, mientras que si lo que pretendemos es realizar un análisis más
exhaustivo de la es ena, sería de más utilidad el uso del riterio de Brenner.
Las ara terísti as prin ipales del método de extra ión de es alas presentado
son las siguientes:
✮ El método no ne esita �jar ningún parámetro a priori. No se presupone nada
sobre la informa ión ontenida en la imagen que se va a pro esar.
✮ Computa ionalmente, es más e� iente que los métodos multies ala al redu ir
el número de es alas signi� ativas. Mientras que los métodos tradi ionales
pro esan la imagen original �ltrada en un rango dis reto de es alas, on este
método sería posible pro esar la imagen teniendo en uenta sólo aquellas es alas
que sean signi� ativas.
✮ La des omposi ión multi anal de la imagen permite ha er una sele ión indi-
vidualizada de las es alas de los objetos que aislan ada uno de los sensores
a tivos.
3.2. Comparación con otros métodos de autoenfoque 57
✮ El método es objetivo, lo ual asegura la repli a ión de experimentos. La
tarea de determina ión de es alas útiles no es fá il para un operador humano;
posiblemente, ante una misma imagen y en diferentes instantes de tiempo,
una persona determinaría es alas diferentes omo es alas signi� ativas de la
imagen.
✮ La des omposi ión multi anal de la imagen permite un pro esamiento paralelo
de todos los anales.
3.2 Compara ión on otros métodos de autoenfoque
Podemos pensar en otras alternativas para la extra ión de es alas globales de una
imagen. La que se muestra en la se ión anterior estaba basada en una represen-
ta ión de la imagen en el dominio de Gabor. Este dominio nos permitía tener una
representa ión que está a aballo entre el dominio espa ial y el dominio fre uen ial
debido a la máxima lo aliza ión simultánea, en ambos dominios, que propor iona
el uso de fun iones de Gabor omplejas. Es posible extraer es alas signi� ativas
ha iendo uso de otras representa iones de la imagen original. En la se ión 3.2.1
se muestra una aproxima ión a este problema basándose en una representa ión en
un dominio puramente espa ial. En la se ión 3.2.2 se muestra otra basada en una
representa ión puramente fre uen ial de la imagen.
3.2.1 Autoenfoque en el dominio espa ial
La diferen ia esen ial de este método respe to al método presentado en la se ión
anterior es que no se usan fun iones de Gabor para �ltrar la informa ión ontenida
en los sensores a tivos de la imagen. En su lugar haremos uso de �ltros paso-banda
ideales. Para realizar el autoenfoque usaremos una fun ión gausiana que emborrone
a distintas es alas las imágenes �ltradas paso-banda.
Vamos a llamar B
S
(u; v) a la más ara que de�ne el �ltro paso-banda ideal res-
pe to a un sensor S:
B
S
(u; v) =
(
1 si (u; v) 2 S
0 si (u; v) =2 S
(3.10)
donde
58 Capítulo 3. Detección de escalas globales
(u; v) 2 S , S
amin
< ar tan
�
v
u
�
� S
amax
y S
rmin
<
p
u
2
+ v
2
� S
rmax
(3.11)
Dada la imagen f(x; y) y su transformada de Fourier F (u; v) de�nimos h
S
(x; y)
omo el resultado de �ltrar paso-banda la imagen original on el �ltro B
S
(u; v), es
de ir:
H
S
(u; v) = F (u; v) � B
S
(u; v) (3.12)
donde * es la multipli a ión punto a punto de ambas señales. h
S
(x; y) se obtendrá
al ulando la transformada inversa de H
S
(u; v):
h
S
(x; y) = FFT
�1
(H
S
(u; v)) (3.13)
denotaremos por J
S
(x; y; �) a la imagen paso-banda obtenida a partir del sensor
S y onvolu ionada on una gaussiana de es ala � (ver e ua ión 2.2):
J
S
(x; y; �) = gs(x; y; �) h
S
(x; y) (3.14)
Dada la imagen original f(x; y) y un sensor S, se trata de obtener una familia
de imágenes J
S
(x; y; �) que se obtienen suavizando la imagen �ltrada paso banda
on una gaussiana variando la es ala � en un rango de valores. Como onse uen ia
de esto, para valores altos de � tendremos que la imagen J
S
(x; y; �) ontendrá es-
tru turas de baja resolu ión (gran longitud espa ial) y para valores de � pequeños
tendremos representadas estru turas on gran nivel de detalle. En otras palabras,
tendremos las estru turas on representa ión en el sensor S visualizadas en un rango
de resolu iones y nuestro objetivo será determinar a que resolu iones se ven mejor
di has estru turas.
De nuevo se ha experimentado on las uatro fun iones de enfoque analizadas
en la se ión 3.1.1. En este aso, los resultados obtenidos mostraban una similitud
aún mayor entre las uatro fun iones tanto en lo referente a la alidad de las es alas
obtenidas omo a la robustez frente al ruido. Este método es mu ho menos sensible a
las pequeñas diferen ias que puedan existir entre diferentes estru turas de la imagen
ya que al ha er el �ltrado paso-banda ideal se anulan por ompleto las fre uen ias
que están fuera del sensor. Además, tenemos omo in onveniente añadido el efe to
de anillado que produ en estos �ltros ideales.
3.2. Comparación con otros métodos de autoenfoque 59
3.2.2 Autoenfoque en el dominio fre uen ial
Como segunda alternativa a la sele ión de es alas en el dominio de Gabor podemos
pensar en algún método que dete te di has es alas en el dominio fre uen ial. Este
método de sele ión propone un prin ipio heurísti o basado en un he ho físi amente
observable: la distorsión entre la informa ión espe tral de una imagen suavizada a
es alas su esivas.
Dado un sensor S y una imagen f(x; y) se de�ne un índi e de �ltrado (S; �)
que mide la antidad de distorsión que hay entre la magnitud del espe tro la imagen
de entrada suavizada a dos niveles onse utivos de es ala � y � +��:
(S; �) =
Z Z
S
(jF
�
(�; �)j � jF
�+��
(�; �)j)
2
d�d� (3.15)
donde F
�
(�; �) es el espe tro de la imagen f(x; y) suavizada a es ala � (y formu-
lado en oordenadas polares) y la doble integral sobre el sensor S está referida a la
región de fre uen ias que se en uentran dentro del sensor.
Este índi e es útil para medir la diferen ia que existe entre los espe tros de
la imagen original suavizada a es alas onse utivas. Cuando se produ e una gran
diferen ia entre di hos espe tros, para dos es alas onse utivas, podemos on luir
que ha habido un in remento signi� ativo de informa ión. Las es alas signi� ativas
serán aquellas que produz an un máximo lo al en la fun ión (S; �). Para más
detalles ver el trabajo de Gar ía-Silvente et al. [38℄.
3.2.3 Compara ión de resultados
Para omparar los tres métodos expuestos vamos a ha er uso de dos imágenes: una
sintéti a y otra natural. La imagen sintéti a, junto on sus sensores a tivos, se puede
ver en la �gura 3.1. Esta es una imagen de 128x128 píxeles on 256 niveles de gris.
En la tabla 3.1 apare en los datos numéri os que des riben los sensores a tivos de la
�gura 3.1.
Se han extraido las es alas de esta imagen usando los tres métodos. Los resultados
se muestran en la tabla 3.7. Para ha er la ompara ión se ha optado por riterio de
la Varianza omo fun ión de autoenfoque, aunque se podía haber optado por el de
Brenner.
En las �guras 3.16, 3.17, 3.18, 3.19 y 3.20 se puede ver la imagen sintéti a suavi-
zada a las distintas es alas obtenidas por los métodos basados en la representa ión
espa ial y fre uen ial. Para el método basado en la representa ión en el dominio
de Gabor se puede ver la se ión 3.1.2.1. Cada �gura está referida a las es alas
60 Capítulo 3. Detección de escalas globales
Dominio
Sensor Espa ial Fre uen ial Gabor
S
0
4.5 1, 3 2, 11
S
1
4.5 1, 3 2, 15.5
S
2
5 1, 3 2.5
S
3
4.5 1, 3.5 2.5, 6
S
4
18 1, 14.5 3.5
Tabla 3.7: Es alas signi� ativas de la imagen sintéti a obtenidas por los tres métodos.
obtenidas por los métodos para un mismo sensor.
Para obtener las imágenes suavizadas ha iendo uso de las es alas obtenidas por
los métodos en el dominio espa ial y en el fre uen ial se ha suavizado la imagen
�ltrada paso-banda on una fun ión gaussiana. El �ltro paso-banda es un �ltro ideal
que omprende la región delimitada por el sensor a tivo orrespondiente.
Con este experimento se muestra la posibilidad de extraer es alas espa iales par-
tiendo de la representa ión de la imagen en tres dominios diferentes: espa ial, fre-
uen ial y Gabor.
Si analizamos on más detalle las imágenes que resultan del suavizado a diferentes
es alas on el método espa ial (�guras 3.16, 3.17, 3.18, 3.19 y 3.20) podemos observar
que las bolas que están próximas entre sí se unen para formar estru turas mayores on
orienta ión espe í� a. Por ejemplo, si �jamos nuestra vista sobre la imagen original
y desenfo amos el ojo lo su� iente, apre iaremos omo podemos per ibir que las
bolas que están próximas entre sí apare en omo una úni a estru tura. Este efe to
se ve laramente en la �gura 3.20 (B.1) donde se ven todas las bolas fundidas en una
úni a estru tura on orienta ión de aproximadamente 135
Æ
. Si vemos el experimento
realizado on el método fre uen ial, los resultados son similares aunque pare e que
las imágenes �ltradas son un po o más nítidas.
Pero no abe duda de que el método que mejor dete ta las estru turas presentes
es el que se basa en la representa ión en el dominio de Gabor. Claramente, se pueden
apre iar algunas ventajas de este método:
✮ Las estru turas están mejor lo alizadas en el espa io.
✮ Las estru turas se distinguen más nítidamente, es de ir, las imágenes �ltradas
tienen un mayor pare ido on la imagen original.
✮ Se dete tan estru turas que han pasado desaper ibidas por los otros métodos.
En la �gura 3.21 se pueden ver las re onstru iones de la imagen original partiendo
de ada una de las representa iones. Para las representa iones en el dominio espa ial
3.2. Comparación con otros métodos de autoenfoque 61
PSfrag repla ements
D
o
m
i
n
i
o
E
s
p
a
i
a
l
D
o
m
i
n
i
o
F
r
e
u
e
n
i
a
l
Dominio Gabor
(A)
(B.1)
(C.1) (C.2)
Figura 3.16: Imagen sintéti a suavizada a las distintas es alas obtenidas on ada uno de los
métodos sobre el sensor S
0
. (A) Área que ubre el sensor S
0
. (B.1) � = 4:5.
(C.1) � = 1. (C.2) � = 3.
62 Capítulo 3. Detección de escalas globales
PSfrag repla ements
D
o
m
i
n
i
o
E
s
p
a
i
a
l
D
o
m
i
n
i
o
F
r
e
u
e
n
i
a
l
Dominio Gabor
(A)
(B.1)
(C.1) (C.2)
Figura 3.17: Imagen sintéti a suavizada a las distintas es alas obtenidas on ada uno de los
métodos sobre el sensor S
1
. (A) Área que ubre el sensor S
1
. (B.1) � = 4:5.
(C.1) � = 1. (C.2) � = 3.
3.2. Comparación con otros métodos de autoenfoque 63
PSfrag repla ements
D
o
m
i
n
i
o
E
s
p
a
i
a
l
D
o
m
i
n
i
o
F
r
e
u
e
n
i
a
l
Dominio Gabor
(A)
(B.1)
(C.1) (C.2)
Figura 3.18: Imagen sintéti a suavizada a las distintas es alas obtenidas on ada uno de
los métodos sobre el sensor S
2
. (A) Área que ubre el sensor S
2
. (B.1) � = 5.
(C.1) � = 1. (C.2) � = 3.
64 Capítulo 3. Detección de escalas globales
PSfrag repla ements
D
o
m
i
n
i
o
E
s
p
a
i
a
l
D
o
m
i
n
i
o
F
r
e
u
e
n
i
a
l
Dominio Gabor
(A)
(B.1)
(C.1) (C.2)
Figura 3.19: Imagen sintéti a suavizada a las distintas es alas obtenidas on ada uno de los
métodos sobre el sensor S
3
. (A) Área que ubre el sensor S
3
. (B.1) � = 4:5.
(C.1) � = 1. (C.2) � = 3:5.
3.2. Comparación con otros métodos de autoenfoque 65
PSfrag repla ements
D
o
m
i
n
i
o
E
s
p
a
i
a
l
D
o
m
i
n
i
o
F
r
e
u
e
n
i
a
l
Dominio Gabor
(A)
(B.1)
(C.1) (C.2)
Figura 3.20: Imagen sintéti a suavizada a las distintas es alas obtenidas on ada uno de
los métodos sobre el sensor S
4
. (A) Área que ubre el sensor S
4
. (B.1) � = 18.
(C.1) � = 1. (C.2) � = 14:5.
66 Capítulo 3. Detección de escalas globales
PSfrag repla ements
(A) (B)
(C)
Figura 3.21: Re onstru ión de la imagen sintéti a usando la informa ión aso iada a los
sensores a tivos para la representa ión (A) en el dominio espa ial, (B) en el
dominio fre uen ial, (C) en el dominio de Gabor.
y fre uen ial, el método de re onstru ión ha onsistido en realizar la sumatoria de
todas las imágenes �ltradas paso-banda orrespondientes a ada uno de los sensores
a tivos suavizadas a su es ala signi� ativa. Es de ir, para obtener la re onstru ión
basándose en la representa ión espa ial (�gura 3.21 (A)), se han sumado las imágenes
de las sub�guras (B.1) de las �guras 3.16, 3.17, 3.18, 3.19 y 3.20. De igual forma
se ha obtenido la re onstru ión en base a la representa ión fre uen ial (�gura 3.21
(B)).
Para la re onstru ión basada en la representa ión en el dominio de Gabor se ha
usado un método más elaborado que se detalla en la se ión 5.2; en on reto se ha
usado la e ua ión 5.12.
El mismo experimento ha sido repetido para una imagen natural. En la �gura
3.22 se puede ver una es ena natural digitalizada on un tamaño de 256x256 pixeles
y 256 niveles de gris. En la misma �gura se muestran también los sensores a tivos
dete tados y la re onstru ión de la imagen basándose en la representa ión en el
dominio de Gabor.
3.2. Comparación con otros métodos de autoenfoque 67
PSfrag repla ements
(A) (B)
(C)
Figura 3.22: (A) Es ena natural. (B) Sensores a tivos dete tados para la es ena natural.
(C) Re onstru ión de la imágen original usando el método basado en la repre-
senta ión en el dominio de Gabor.
68 Capítulo 3. Detección de escalas globales
Es alas
Sensor S
rmin
S
rmax
S
amin
S
amax
Espa ial Fre uen ial Gabor
S
1
6 18 45
Æ
90
Æ
12.5 7 4
S
2
1 8 0
Æ
45
Æ
- 26.5 11
S
3
1 6 45
Æ
90
Æ
39.5 15, 44 14, 37
S
4
1 5 135
Æ
180
Æ
36.5 27 24
S
5
18 25 45
Æ
90
Æ
4 3 2, 26
S
6
42 52 135
Æ
180
Æ
1.8 1.5 1, 32
S
7
8 13 0
Æ
45
Æ
9 6.5 4.5
S
8
34 42 135
Æ
180
Æ
2 1.5 1.2, 17
S
9
15 21 90
Æ
135
Æ
5 4 2.5
S
10
12 17 135
Æ
180
Æ
6 5 2.5
S
11
8 12 135
Æ
180
Æ
9.5 7 5, 33
S
12
43 51 45
Æ
90
Æ
1.8 1.5 1
S
13
21 26 90
Æ
135
Æ
3.5 3 2
S
14
28 33 45
Æ
90
Æ
2.5 2 1.6
S
15
4 8 90
Æ
135
Æ
18.5 13.5 8.5
S
16
17 21 135
Æ
180
Æ
4.5 3.5 2.5
S
17
13 17 0
Æ
45
Æ
6 4.5 3
S
18
26 31 90
Æ
135
Æ
3 2.5 1.6
S
19
5 8 135
Æ
180
Æ
15.5 11.5 7.5
S
20
21 26 0
Æ
45
Æ
3.5 3 2
S
21
33 38 45
Æ
90
Æ
2.5 2 1.4
S
22
17 21 0
Æ
45
Æ
4.5 3.5 2.5
Tabla 3.8: Parámetros de los sensores a tivos de la imagen natural. Las tres últimas olum-
nas muestran las es alas obtenidas por ada uno de los métodos.
En la tabla 3.8 se muestran los datos de ada uno de los sensores junto a las
es alas obtenidas para ada uno de los métodos presentados.
En la �gura 3.23 se pueden ver las imágenes �ltradas orrespondientes a los
sensores 2, 3, 4, 15 y 19. Las imágenes (A), (B), (D) y (E) muestran la sele ión
de las �ores de forma aislada. Puesto que las �ores son aproximadamente redondas
y del mismo tamaño, ne esitamos uatro sensores para dete tarlas (uno por ada
orienta ión pre�jada). La imagen (C) muestra las dos �ores formando una úni a
estru tura on una orienta ión de algo más de 45
Æ
.
Las imágenes paso banda obtenidas on las otras dos representa iones son bas-
tante más omplejas de analizar para es enas naturales. Como muestra, en la �gura
3.24 (A) y (B), se pueden ver dos de estas imágenes paso banda.
3.2. Comparación con otros métodos de autoenfoque 69
PSfrag repla ements
(A) (B)
(C) (D)
(E)
Figura 3.23: Es ena natural �ltrada para los sensores (A) S
2
, (B) S
3
, (C) S
4
, (D) S
15
y
(E) S
19
.
70 Capítulo 3. Detección de escalas globales
PSfrag repla ements
(A) (B)
Figura 3.24: (A) Imagen �ltrada on el sensor S
15
usando la es ala dete tada por el método
basado en la representa ión fre uen ial. (B) Imagen �ltrada on el sensor S
15
usando la es ala dete tada por el método basado en la representa ión espa ial.
3.3 Con lusiones
En esta se ión se han visto diversas alternativas para la determina ión de las es alas
signi� ativas globales existentes en una imagen. Tras la evalua ión de los resultados,
el método más satisfa torio ha sido el que se basa en una representa ión espa io-
fre uen ial de la imagen, o lo que es lo mismo, el método basado en la representa ión
de la imagen mediante fun iones de Gabor. Los motivos fundamentales son los
siguientes:
✮ El he ho de ha er uso de estas fun iones omplejas permite tener una máxima
lo aliza ión simultánea de las estru turas en el dominio espa ial y fre uen ial.
✮ Se dete tan es alas que pasan desaper ibidas por los otros métodos.
✮ Hay eviden ias biológi as que di en que estas fun iones tienen un per�l de a ti-
vidad similar al que poseen las élulas simples del órtex visual y por tanto son
buenas andidatas para formar una base que permita representar una imagen.
✮ El resultado de �ltrar una imagen on una fun ión de Gabor se puede inter-
pretar mejor que si se ha e uso de �ltros ideales paso-banda.
Respe to al riterio para evaluar la bondad del ontraste de las estru turas presentes
en la imagen, tenemos dos alternativas válidas: la fun ión de Brenner y la Varianza.
Si úni amente ne esitamos dete tar las es alas de las estru turas bási as presentes
3.3. Conclusiones 71
en la imagen haremos uso de la fun ión Varianza y si ne esitamos dete tar, además,
estru turas que surgen omo unión de otras menores, enton es haremos uso de la
fun ión de Brenner.
72 Capítulo 3. Detección de escalas globales
Capítulo 4
Dete ión de es alas naturales
lo ales
Es lara la importan ia que tiene el on epto de es ala global en el pro esamiento
de imágenes digitales, espe ialmente si pretendemos realizar, por ejemplo, tareas que
impliquen el re ono imiento de formas de manera e� iente. El he ho de ono er ual
es la es ala de una imagen nos da una idea de la extensión espa ial media de las
estru turas que hay presentes en ella. Esto nos puede simpli� ar las fases de pro-
esamiento posteriores y puede evitar que lo ali emos formas que no nos interesan
para nuestros objetivos, es de ir, evitan el pro esamiento del ruido que tiene la señal,
entendiendo este ruido omo ualquier estru tura que no sea de nuestro interés. En
o asiones, es posible que esta es ala global no sea su� iente, ya que, omo de ía-
mos anteriormente, esta es ala sólo nos da una idea de la extensión espa ial media
de las estru turas presentes en la imagen, pero esto no quiere de ir que todas las
estru turas sean del mismo tamaño. Puede haber diferen ias de distinta magnitud
entre unas estru turas y otras. Aquí apare e el on epto de es ala lo al, que sería la
es ala aso iada a ada estru tura presente en la imagen. Normalmente, las imágenes
que se orresponden on es enas naturales, ontienen una gran variedad de formas
y tamaños, de forma que si bus ásemos las es alas globales de esas imágenes, obten-
dríamos las es alas de las estru turas uyo tamaño fuese predominante, y por tanto,
es posible que no fuesen su� ientemente representativas, debido a esa gran variedad
de estru turas.
Si volvemos al ejemplo que se usó en la se ión 3 del árbol visto a diferentes
niveles de resolu ión, podríamos de ir que, aunque podemos aso iar distintas es alas
globales a la imagen, dependiendo del nivel de informa ión que deseemos interpretar,
también podríamos dar la es ala lo al de ada uno de los objetos individuales que
73
74 Capítulo 4. Detección de escalas naturales locales
apare en en di ha imagen. Cada una de las hojas, el tron o, las venas de las hojas,
et . tendrían una es ala lo al aso iada. Se podrían apre iar diferen ias entre la
es ala lo al de ada hoja y la es ala global que diferen iaba las hojas omo formas
independientes.
En este apítulo se propone un método para la dete ión de las es alas lo ales aso-
iadas a posi iones espa iales de la imagen partiendo del modelo visual desarrollado
en el apítulo 2.
4.1 Método de dete ión de es alas lo ales
Con el modelo de representa ión desarrollado en el apítulo 2, tenemos una repre-
senta ión de las estru turas más importantes presentes en una imagen, en base al
ontenido fre uen ial que tienen y a la es ala espa ial a la que son mejor des ri-
tas. En esta se ión se desarrolla un método que nos permitirá ono er las es alas
naturales lo ales aso iadas a posi iones espa iales de la imagen.
La idea de partida es, por tanto, el ono imiento de las es alas naturales a las
que son mejor des ritas las estru turas presentes en un anal fre uen ial. Dada esa
informa ión, se trata de bus ar, para esas estru turas globales, uál sería la es ala
lo al que tiene ada uno de los puntos que pertene en a esas estru turas.
Una alternativa para realizar esta tarea podría onsistir en apli ar un método de
extra ión de es alas globales a regiones de la imagen por separado. Gar ía et al.
[37℄ proponen un modelo en el que se segmenta la imagen en una serie de regiones
homogéneas y después, en ada región, se apli a un método de enfoque basado en el
gradiente para determinar la es ala. El problema que tiene este método es que, si las
regiones son pequeñas, no es posible ha er una buena estima ión de los estadísti os
relativos a es alas grandes. Con el método que aquí se propone, se resuelve ese
problema.
Puesto que partimos de una representa ión multi anal y multies ala, es posible
que una misma lo aliza ión espa ial tenga varias es alas lo ales aso iadas. Cada
uno de los sensores a tivos de la des omposi ión multi anal, aisla estru turas de
unas ara terísti as espe í� as, o visto desde otro punto de vista, ada sensor aisla
determinadas ara terísti as de las estru turas que hay en la imagen. Por tanto,
tiene sentido ha er una búsqueda de las es alas lo ales de ada uno de los puntos
que pertene en a las ara terísti as sele ionadas de una determinada estru tura. O
sea, una misma estru tura puede ser vista desde distintos niveles ognitivos y por
tanto, para ada uno de esos niveles se puede ha er un estudio lo al de la informa ión
espa ial.
4.1. Método de detección de escalas locales 75
4.1.1 Dete ión de puntos de interés
Con el método propuesto, no se pretenden al ular es alas lo ales sobre todos y ada
uno de los puntos de la imagen. Puesto que ha iendo uso del modelo de representa-
ión hemos llegado a determinar las estru turas relevantes que hay en una imagen,
pare e oherente entrar nuestra aten ión sólo en las lo aliza iones espa iales que
tienen interés desde el punto de vista de las estru turas que estamos analizando.
Así, dada la respuesta que produ e una imagen frente a un sensor on reto, no pare-
e muy útil determinar la es ala aso iada a un punto que no pertene e a las formas
aisladas por ese sensor.
Para determinar uales son los puntos de interés, haremos uso del on epto de
mapa de energía aso iado a ada uno de los sensores a tivos (Morrone et al. [85℄,
Fdez-Vidal et al. [31℄).
Dado un sensor a tivo S y la imagen original f(x; y), el resultado de �ltrar f(x; y)
on el �ltro de Gabor aso iado al sensor S lo de�nimos omo la respuesta de f(x; y)
frente al sensor S:
R
g
(f; S; x; y) = f (x; y) gb (x; y; �
S
; �
S
; �
S
) (4.1)
donde �
S
es la es ala global aso iada al sensor, �
S
es la fre uen ia radial media
y �
S
es la orienta ión media. La fun ión gb() se de�ne en la e ua ión 2.5. En el aso
de que haya más de una es ala global aso iada al sensor S, se al ulará la respuesta
para ada una de las es alas obtenidas.
De�nimos el mapa de energía lo al, desde el punto de vista del sensor S, omo:
Lem (f; S; x; y) = jR
g
(f; S; x; y)j
2
(4.2)
es de ir, se de�ne el mapa de energía lo al de la imagen f(x; y) desde el punto de
vista del sensor S, omo el uadrado de la envolvente que resulta de �ltrar la imagen
original on el �ltro de Gabor omplejo aso iado al sensor en uestión.
Este mapa de energía se puede al ular apli ando por separado los dos �ltros
en uadratura que de�nen una fun ión de Gabor ompleja: la parte par y la parte
impar. Podemos de�nir
R
par
g
(f; S; x; y) = f (x; y) gb
e
(x; y; �
S
; �
S
; �
S
) (4.3)
y
R
impar
g
(f; S; x; y) = f (x; y) gb
o
(x; y; �
S
; �
S
; �
S
) (4.4)
76 Capítulo 4. Detección de escalas naturales locales
donde gb
e
() y gb
o()
están de�nidas en las e ua iones 2.7 y 2.8 respe tivamente.
De esta forma podemos rede�nir el ál ulo del mapa de energía omo:
Lem (f; S; x; y) =
�
R
par
g
(f; S; x; y)
�
2
+
�
R
impar
g
(f; S; x; y)
�
2
(4.5)
Los puntos de interés en los que �ja su aten ión el SVH son aquellos que al anzan
un máximo lo al en el mapa de energía.
4.1.2 Determina ión de las es alas lo ales sobre los puntos de inte-
rés
Una vez que hemos determinado los puntos de interés, dado un mapa de energía
lo al, vamos a pro eder a la determina ión de la es ala lo al en ada uno de ellos.
El riterio de determina ión de la es ala en un punto (x
�
; y
�
), que es un máximo
lo al del mapa de energía para un sensor S, se formula de esta manera: la es ala
natural �
�
de la estru tura espa ial on omponentes fre uen iales en el sensor S,
en la lo aliza ión (x
�
; y
�
), debe produ ir una imagen �ltrada a es ala �
�
, tal que
tenga una máxima varia ión de intensidad lo al en un entorno W (x
�
; y
�
) del punto
(x
�
; y
�
) on respe to a las imágenes �ltradas que hagan uso de ualquier otra es ala.
Como riterio para determinar la varia ión de la intensidad lo al se tomará de nuevo
la fun ión Varianza, que se apli ará sobre los mapas de energía de forma lo al de la
siguiente forma:
V (f; S; �; x
�
; y
�
) =
X
(x;y)2W (x
�
;y
�
)
(jP
�
(f; S; x; y)j � �)
2
(4.6)
donde P
�
(f; S;x; y) es el resultado de �ltrar la imagen f(x; y) on el �ltro de
Gabor aso iado al sensor S pero usando la es ala � en lugar de la es ala aso iada al
sensor �
S
:
P
�
(f; S; x; y) = f (x; y) gb (x; y; �; �
S
; �
S
) (4.7)
y � es la media de los valores de la envolvente de la imagen �ltrada a es ala � en
el entorno del punto (x
�
; y
�
)
� =
P
(x;y)2W (x
�
;y
�
)
jP
�
(f; S; x; y)j
Card [W (x
�
; y
�
)℄
(4.8)
La fun ión Card [W (x
�
; y
�
)℄ devuelve el número de puntos que hay en el entorno
del punto (x
�
; y
�
).
4.2. Resultados experimentales 77
En este punto se podría haber optado por ha er uso del riterio de Brenner para
la obten ión de es alas. Si vemos las on lusiones del apítulo 3, la ventaja que
supone el uso del riterio de Brenner viene dada por su apa idad para dete tar
es alas orrespondientes a estru turas que surgen omo onse uen ia de la unión
de estru turas menores. En el problema de la dete ión de es alas lo ales, estas
es alas que propor iona Brenner no suponen ninguna ventaja lara ya que, al ha er
el análisis sobre un entorno redu ido del punto que estamos onsiderando, no tiene
sentido unir varias estru turas pequeñas en una úni a estru tura grande. Lo que se
pretende es dete tar las es alas lo ales de los puntos que pertene en a esas estru turas
individuales.
Sólo queda por determinar ual es el entorno W (x
�
; y
�
) sobre el que tiene interés
al ular la varianza. Lo de�niremos omo aquellos píxeles ontenidos en un ír ulo
de radio r entrado en el punto (x
�
; y
�
) on r = Dist ((x
m
; y
m
) ; (x
�
; y
�
)). El punto
(x
m
; y
m
) es el mínimo lo al más er ano al punto (x
�
; y
�
) en el mapa de energía
lo al Lem (f; S; x; y). La fun ión Dist (a; b) devuelve la distan ia eu lídea entre dos
puntos a y b.
Puesto que un mínimo lo al en el mapa de energía lo al determina el omienzo
poten ial de otra estru tura, su uso omo límite de los entornos de in�uen ia de los
máximos lo ales (puntos de interés) evita la interferen ia de diferentes estru turas
durante el ál ulo de la es ala lo al.
4.2 Resultados experimentales
Para determinar la validez del método se ha experimentado sobre distintos tipos de
imágenes.
4.2.1 Imagen biomédi a
La primera imagen que se ha usado, es una imagen biomédi a de romosomas de
tamaño 256x256 píxeles y 256 niveles de gris. Esta se puede ver en la �gura 4.1(A).
En (B) se muestra la parti ión multi anal de di ha imagen y en (C) se ven los sensores
a tivos dete tados. En (D) apare e una re onstru ión de la imagen original he ha
en base a la representa ión de la misma mediante el modelo expli ado en el apítulo
2. Para ha er esta re onstru ión se ha usado el método desarrollado en la se ión
5.2 (e ua ión 5.12).
En la tabla 4.1 se muestran los datos numéri os orrespondientes a los sensores
a tivos de esta imagen junto on las es alas globales sele ionadas. Aunque para un
78 Capítulo 4. Detección de escalas naturales locales
PSfrag repla ements
(A) (B)
(C) (D)
Figura 4.1: (A) Imagen biomédi a, (B) Parti ión multi anal, (C) Sensores a tivos, (D) Re-
onstru ión usando el método presentado en la se ión 5.
4.2. Resultados experimentales 79
Sensor S
rmin
S
rmax
S
amin
S
amax
Es ala Global
S
1
2 14 135
Æ
180
Æ
6.8
S
2
23 36 0
Æ
45
Æ
1.7
S
3
4 9 0
Æ
45
Æ
8.3
S
4
3 9 45
Æ
90
Æ
8.3
S
5
14 25 45
Æ
90
Æ
2.8
S
6
14 23 135
Æ
180
Æ
2.8
S
7
10 14 0
Æ
45
Æ
4.8
S
8
14 23 0
Æ
45
Æ
2.8
S
9
3 11 90
Æ
135
Æ
6.8
S
10
11 19 90
Æ
135
Æ
3.3
S
11
23 29 135
Æ
180
Æ
2
S
12
10 14 45
Æ
90
Æ
4.3
Tabla 4.1: Parámetros de los sensores a tivos dete tados para la imagen biomédi a junto on
la es ala global de ada uno de ellos.
mismo sensor es posible que se dete ten varias es alas globales, en este experimento
sólo se ha onsiderado, por simpli idad, una es ala por sensor, esta es ala es la más
pequeña que se dete te.
Dados ada uno de los sensores, se ha pro edido al ál ulo de es alas lo ales
basado en la búsqueda de los máximos de los mapas de energía lo al. En la �gura
4.2 se pueden ver los ál ulos realizados sobre tres de los sensores de la imagen (en la
�gura apare en uno en ada olumna por este orden: S
1
, S
10
y S
2
). La primera �la
muestra el área del espe tro de fre uen ias que sele iona ada sensor. La segunda
�la muestra los mapas de energía lo al de ada uno de los sensores. En la siguiente �la
apare en superpuestos los máximos y mínimos de los mapas de energía; los máximos
apare en on olor negro mientras que los mínimos apare en on una tonalidad gris.
La siguiente �la muestra las zonas de in�uen ia W (x; y) al uladas para ada uno de
los máximos lo ales de la �la anterior. Por último, se muestran, de forma resumida,
las es alas lo ales que se han dete tado para ada uno de los máximos lo ales de la
ter era �la. Se puede ver el histograma on las fre uen ias de apari ión de ada una
de las es alas dete tadas.
Viendo el histograma se puede apre iar que las es alas lo ales dete tadas, para
un sensor dado, son de magnitud similar a la es ala global de di ho sensor, aunque
existen varia iones, en un rango no muy amplio de valores, debido a la variedad de
estru turas presentes en los mapas de energía.
Hay que tener en uenta que durante el ál ulo de las es alas lo ales no se ubre
un rango ontínuo de valores sino que nos movemos en un rango dis reto on un
80 Capítulo 4. Detección de escalas naturales locales
PSfrag repla ements
(A.1)
(A.2)
(A.3)
(A.4)
(A.5)
(B.1)
(B.2)
(B.3)
(B.4)
(B.5)
(C.1)
(C.2)
(C.3)
(C.4)
(C.5)
Figura 4.2: Muestra de los ál ulos para los sensores (A) S
1
, (B) S
11
y (C) S
3
. La primera
�la muestra la región del espe tro re ogida por el sensor. La segunda �la muestra
el mapa de energía lo al. En la ter era están superpuestos los máximos (más
os uros) y mínimos (más laros) de los mapas de energía lo al. La uarta �la
muestra las regiones de in�uen ia W (x; y) de los máximos. En la última �la se
puede ver un histograma que muestra en el eje verti al la fre uen ia de apari ión
de ada una de las es alas lo ales dete tadas (eje horizontal).
4.2. Resultados experimentales 81
PSfrag repla ements
(A) (B)
Figura 4.3: (A) Es ena natural. (B) Sele ión de sensores a tivos.
Sensor S
rmin
S
rmax
S
amin
S
amax
Es ala Global
S
1
11 26 135
Æ
180
Æ
1.4
S
2
3 10 90
Æ
135
Æ
4.3
S
3
2 11 0
Æ
45
Æ
3.3
Tabla 4.2: Parámetros de los sensores a tivos de la es ena natural junto on las es alas
dete tadas.
in remento entre valores onse utivos de �� = 0:5. Por tanto, el histograma es sólo
una aproxima ión de las magnitudes de las es alas lo ales presentes.
4.2.2 Es ena natural
El mismo experimento se ha llevado a abo sobre una imagen natural de tamaño
128x128 píxeles. En la �gura 4.3 se puede ver la imagen junto on la sele ión de
sensores a tivos dete tados.
En la tabla 4.2 están los datos numéri os de la parti ión junto on las es alas
globales dete tadas para ada sensor.
En las �guras 4.4, 4.5 y 4.6 se muestran los datos rela ionados on la extra ión
de es alas lo ales. En (A) se muestra el sensor sobre el que está trabajando. En
(B) se ve el mapa de energía lo al para el sensor de (A). En (C) se muestran los
máximos del mapa de energías superpuestos on di ho mapa. En (D) se pueden ver
las zonas de in�uen ia de los máximos de (C). En (E) se expone una representa ión
tridimensional de la magnitud de las es alas lo ales. En esta grá� a se han dibujado,
en los bordes y on relleno negro, unos pi os on la altura de la es ala global dete tada
para el sensor para, de esta forma, apre iar mejor la magnitud de las es alas lo ales.
Por último, en (F) se puede ver un histograma que muestra la fre uen ia de apari ión
(eje verti al) de las es alas lo ales (eje horizontal).
82 Capítulo 4. Detección de escalas naturales locales
PSfrag repla ements
(A)
(B)
(C)
(D)
(E)
(F)
Magnitud de la
es ala global
Magnitud de las
es alas lo ales
Figura 4.4: (A) Sensor S
1
. (B) Mapa de energía lo al. (C) Máximos del mapa de energía
lo al. (D) Zonas de in�uen ia de los máximos lo ales. (E) Representa ión 3D
de las es alas lo ales. (F) Histograma de es alas lo ales.
4.2. Resultados experimentales 83
PSfrag repla ements
(A)
(B)
(C)
(D)
(E)
(F)
Magnitud de la
es ala global
Magnitud de las
es alas lo ales
Figura 4.5: (A) Sensor S
2
. (B) Mapa de energía lo al. (C) Máximos del mapa de energía
lo al. (D) Zonas de in�uen ia de los máximos lo ales. (E) Representa ión 3D
de las es alas lo ales. (F) Histograma de es alas lo ales.
84 Capítulo 4. Detección de escalas naturales locales
PSfrag repla ements
(A)
(B)
(C)
(D)
(E)
(F)
Magnitud de la
es ala global
Magnitud de las
es alas lo ales
Figura 4.6: (A) Sensor S
3
. (B) Mapa de energía lo al. (C) Máximos del mapa de energía
lo al. (D) Zonas de in�uen ia de los máximos lo ales. (E) Representa ión 3D
de las es alas lo ales. (F) Histograma de es alas lo ales.
Capítulo 5
Desarrollo de una Medida de
Distorsión Per eptual
Una de las apli a iones inmediatas del modelo visual desarrollado es el ál ulo de
medidas de distorsión per eptuales entre imágenes, es de ir, dadas dos imágenes di-
gitales, uanti� ar de una forma objetiva la diferen ia visual existente entre ellas. El
término per eptual impli a que esta medida habrá de in orporar alguna ara terísti-
a del SVH, lo ual debería desembo ar en una buena orrela ión on observa iones
realizadas por observadores humanos on un nivel visual normal (es de ir, sin pro-
blemas de visión). Son varias las ventajas de tener un modelo omputa ional frente
al uso de observadores humanos:
✮ Es objetivo ya que usa unos riterios ono idos y los apli a sin ningún tipo de
subjetividad.
✮ Se redu e el tiempo de pro esamiento.
✮ Los observadores a túan asi siempre de forma subjetiva lo ual impli a que
unos tenderán a desta ar más unos rasgos que otros, on lo que dadas las
mismas imágenes a diferentes sujetos, estos darán distintos niveles de diferen-
ia ión entre ellas.
✮ Por otra parte, si a un mismo sujeto le presentamos una serie de imágenes dos
ve es, habrá una probabilidad alta de que nos propor ione diferentes resultados
en ambas o asiones. Esto impli a, entre otras osas, la no repetibilidad de
experimentos.
El problema que pare e dejarse ver de entre las ventajas del modelo omputa ional es
omo de idir si una medida omputa ional es buena o mala. La bondad de la misma
85
86 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual
viene dada por la similaridad que tenga on resultados obtenidos de observadores,
que omo hemos visto son bastante impre isos y subjetivos. La solu ión no es difí il
de ver tampo o, el resultado del modelo no se va a omparar on las observa iones
he has por un observador sino on algún estadísti o que resuma de alguna forma las
observa iones he has por un grupo, su� ientemente grande, de ellos.
Las medidas de distorsión son una apli a ión del modelo desarrollado pero no
son un �n en si mismas. A su vez, estas medidas son herramientas que ayudan a
resolver una gran variedad de problemas omo pueden ser la evalua ión de la alidad
de ompresión de imágenes, la evalua ión de la alidad de métodos de restaura ión,
la ayuda a la dete ión de estru turas en imágenes, et .
En este sentido, se evaluará la bondad de la medida de distorsión desarrollada en
esta Tesis mediante diversos experimentos:
✮ Evalua ión de la alidad de la medida en imágenes distorsionadas mediante un
efe to de enmas aramiento (se ión 5.3).
✮ Evalua ión del omportamiento de la medida apli ada sobre imágenes mues-
treadas a diferentes resolu iones (se ión 5.4).
✮ Dete ión de objetos en es enas naturales (se ión 5.5).
✮ Evalua ión de la alidad de imágenes digitales omprimidas mediante métodos
on pérdida (se ión 5.6).
5.1 Medidas existentes
Desde el punto de vista del uso o no de alguna propiedad que ara teriza al SVH,
las medidas de distorsión se dividen en per eptuales y no per eptuales.
Normalmente las per eptuales impli arán una mayor omplejidad aunque a am-
bio pare e razonable pensar que van a propor ionar una mayor pre isión y �abilidad
en los resultados. Lo deseable en una medida de distorsión es que tenga un ompor-
tamiento lineal respe to de la alidad per ibida por un observador humano y esto es
algo que sólo pare e al al anze de las medidas per eptuales.
Las propiedades genéri as que debería tener una buena medida de distorsión son
(Kominek [62℄):
✮ La medida ha de ser ero uando omparamos una imagen onsigo misma.
✮ La medida no debe ser negativa.
5.1. Medidas existentes 87
✮ La medida ha de ser monótona re iente onforme aumenta la disimilaridad
existente entre ambas imágenes. La disimilaridad habrá de estar medida en
términos de una buena orrela ión respe to a medidas realizadas por observa-
dores humanos.
Estas onsidera iones tienen sentido uando hablamos de la magnitud de la medida
de distorsión. La segunda propiedad de las men ionadas requiere una a lara ión, y
es que uando de imos que una medida no debe ser negativa, en realidad lo que se
pretende es poner un límite inferior que nos sirva de referen ia para poder omparar
distintas medi iones entre sí. Si, en general, una medida pudiese tomar valores
negativos y positivos (sin espe i� ar nada más) sería algo más omplejo omparar
medi iones de di ha medida entre ellas. La solu ión podría pasar por omparar la
magnitud de di has medi iones sin tener en uenta el signo. En este sentido, la
medida desarrollada en esta Tesis propor iona valores sobre el dominio [0;+1) de
forma que un valor de 0 indi a la máxima similaridad posible entre dos imágenes
(esta se dará uando omparemos una imagen onsigo misma) y un valor que tienda
a +1 indi ará la máxima disimilaridad.
5.1.1 Medidas lási as no per eptuales
Este tipo de medidas se limitan a realizar algún tipo de opera ión pixel a pixel entre
las dos imágenes que estamos omparando. La medida más simple que podemos
en ontrar en la literatura es el error medio absoluto de�nido omo:
MAE =
1
N �M
X
x
X
y
�
�
�
f(x; y)�
b
f(x; y)
�
�
�
(5.1)
donde f (x; y) es la imagen de referen ia,
b
f (x; y) es la imagen on la que se quiere
omparar y N �M es la dimensión de ambas imágenes en pixeles. Otra medida muy
ono ida es el error uadráti o medio de�nido omo:
MSE =
1
N �M
X
x
X
y
�
f (x; y)�
b
f (x; y)
�
2
(5.2)
Esta es la medida más utilizada por su simpli idad omputa ional. Marmolin [75℄
realizó experimentos para observar que o urría si se introdu ía alguna ara terísti a
del SVH en modelos simples omo MSE. Su on lusión fué que se mejoraba la
orrela ión on observa iones he has por humanos. Para ha er omparables elMSE
y el MAE se re al ula el MSE extrayéndole su raíz uadrada dando lugar a una
nueva medida:
88 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual
RMSE =
v
u
u
t
1
N �M
X
x
X
y
�
f (x; y)�
b
f (x; y)
�
2
(5.3)
Otra medida de error bastante omún es la razón señal/ruido. Esta rela ión se
suele expresar de diversas formas, aunque siempre muestra la propor ión entre la
desvia ión de la señal frente a la desvia ión del ruido. Una primera de�ni ión sería
la siguiente:
SNR = 10 log
10
�
2
f
�
2
r
!
(5.4)
donde �
2
f
es la varianza de f (x; y) y �
2
r
es la varianza del ruido (de�nido omo
f (x; y)�
b
f (x; y)).
La rela ión señal/ruido es una medida ampliamante utilizada en la literatura
rela ionada on ompresión de imágenes. Hay mu has variantes de esta medida.
Otra muy utilizada es el pi o de la rela ión señal/ruido:
SNR
peak
= 10 log
10
0
B
�
max
�
f(x; y)
2
�
1
N �M
P
x
P
y
�
f(x; y)�
b
f(x; y)
�
2
1
C
A
(5.5)
Una generaliza ión de mu has de estas medidas viene dada por:
E
p
=
"
1
N �M
X
x
X
y
je (x; y)j
p
#
1
p
(5.6)
donde, por ejemplo, si ha emos p = 2 y e (x; y) = f (x; y) �
b
f (x; y) enton es
tenemos que E
2
= RMSE.
El prin ipal problema que plantean todas estas medidas lási as, es que miden la
diferen ia entre dos imágenes pixel a pixel y después resumen todas esas diferen ias
en base a alguna medida. Los humanos es obvio que no omparan así una pareja
de imágenes sino que ha en algún tipo de pro esamiento lo al y asignan mayor o
menor peso a determinadas diferen ias. Limb [66℄ ha he ho diversos experimentos
en este sentido introdu iendo en RMSE pesos y algún tipo de pro esamiento lo al
y on luye que el he ho de introdu ir ese pro esamiento lo al puede mejorar los
resultados aunque RMSE sea mejor que algunas de las medidas que propone en sus
experimentos. De ualquier forma, las modi� a iones que introdu e Limb son muy
limitadas en uanto a su similaridad on el SVH.
Shirvaikar et al. [108℄ dejan laro que las medidas basadas en estadísti os de
5.1. Medidas existentes 89
primer orden están muy limitadas en uanto a la ara teriza ión de diferen ias per-
eptuales entre imágenes.
En general, estas medidas umplen los dos primeros riterios que debería umplir
ualquier medida de distorsión pero están lejos de umplir el ter ero. A pesar de los
in onvenientes de este tipo de medidas (Budrikis [11℄, Carl [15℄, Karunasekera et al.
[58℄), está muy extendido su uso debido a dos fa tores fundamentalmente: su bajo
oste omputa ional y la no disponibilidad de medidas que umplan orre tamente
el ter er requisito. Las medidas que propor ionan una solu ión, aunque sea par ial,
a este ter er riterio, tienen el in onveniente de que suelen ser bastante ostosas en
uanto a tiempo de ál ulo.
5.1.2 Medidas per eptuales
Los primeros pasos en el desarrollo de medidas que in orporan atributos del SVH
onsistieron en modi� ar las medidas existentes (RMSE, SNR, et ) y añadirles alguna
de esas propiedades (Budrikis [11℄, Hunt et al. [52℄, Limb [66℄, Marmolin [75℄). Por
ejemplo, para modelizar la no linealidad de los fotore ptores del SVH se propone
esta modi� a ión (Akansu et al. [3℄):
MSE
no�lineal
=
1
N �M
X
x
X
y
�
f (x; y)
1
3
�
b
f (x; y)
1
3
�
2
(5.7)
Otros modelos asumen un �ltrado lineal de la imagen por parte del SVH y ha en
uso de la fun ión de sensibilidad al ontraste (CSF) para ponderar los anales fre-
uen iales (Barten [9℄, Nill et al. [89℄). Una ombina ión de estas dos ara terísti as
es la propuesta por Saghri et al. [102℄ en la que ha e uso de la raíz úbi a junto on
la CSF.
A tualmente está bastante a eptado que, al menos, una propiedad fundamental
a in orporar en los modelos visuales es la separa ión en anales de fre uen ias de
la señal de entrada. En este sentido fué Sakrison [103℄ el primero en proponer un
modelo de estas ara terísti as.
Pearlman [92℄ propone un modelo visual basado en múltiples anales espa io-
fre uen iales sin onsiderar la sele tividad frente a orienta ión. En ese modelo, el
SVH se omporta omo un ban o de �ltros paralelos, de forma que ada uno de
ellos analiza un grupo de fre uen ias diferentes ubriendo todo el espe tro. La salida
de ada �ltro es analizada por el erebro para determinar si existen o no estímulos
presentes en ese rango de fre uen ias. Para ada uno de esos anales determina la
probabilidad de dete ión de un objeto. Posteriormente, para determinar la distor-
90 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual
sión existente entre dos imágenes, primero al ula por separado la distorsión que hay
para ada anal entre las dos imágenes en base a la probabilidad de dete ión para
ese anal y después determina la distorsión global omo la media de las distorsiones
de ada anal. La distorsión por anal, en de�nitiva, no es más que una diferen ia
uadráti a absoluta entre los oe� ientes de fourier de ambas imágenes ponderados
por una fun ión.
Karunasekera et al. [58℄ desarrollan una medida de distorsión que, en lugar de
modelar el omportamiento del SVH, explota determinadas ara terísti as de las
imágenes. Su medida se basa en la sensibilidad del SVH a determinado tipo de
estru turas (textura, fronteras, ...), de forma que, primero se dete ta la presen ia
de di has estru turas y después se pondera de a uerdo a la sensibilidad del SVH
respe to de ada tipo de estru tura. Esta sensibilidad se determinará previamente
en base a experimentos psi ovisuales.
Ahumada et al. [2℄ [1℄ propone una medida basada en la transformada del or-
tex de Watson [119℄. Esta medida apli a una normaliza ión frente a luminan ia a
las imágenes que va a omparar y después las �ltra ha iendo uso de una CSF. Pos-
teriormente las on ierte al dominio de la transofrmada del ortex y allí evalúa las
diferen ias existentes entre ambas para ada uno de los anales. Finalmente ombina
esas diferen ias y obtiene la medida que bus a.
Algo que pare e laro es que el SVH, uando pro esa una imagen, no lo ha e
punto a punto sino que lo ha e de una forma sele tiva fo alizando su aten ión sobre
determinados datos de la imagen y ponderando estos datos on un fa tor mayor que
el resto de la imagen (Wandell [118℄).
5.2 Medida de distorsión per eptual
El esquema general de la medida de distorsión propuesta en esta Tesis se puede ver
en la �gura 5.1. En la apli a ión de di ho esquema ne esitaremos dos parámetros de
entrada, que serán las dos imágenes que queremos omparar, y obtendremos un valor
de salida que no es otro que la uanti� a ión de la diferen ia per eptual existente
entre ambas imágenes. En este modelo no es indiferente el orden en el que usemos
los parámetros de entrada y por tanto, para diferen iarlos, llamaremos imagen de
referen ia al primer parámetro e imagen test al segundo. En el esquema podemos
distinguir tres etapas:
1. Obten ión de la parti ión multisensor (Se ión 2.2) y sele ión de los sensores
a tivos (Se ión 2.2.1) de la imagen de referen ia f(x; y).
5.2. Medida de distorsión perceptual 91
2. Modeliza ión de los ampos re eptivos de ada uno de los sensores a tivos
(Se ión 2.3).
3. Compara ión de las respuestas de ada sensor a tivo para la imagen de refe-
ren ia f(x; y) y la imagen test
b
f(x; y).
El objetivo de las dos primeras etapas es la obten ión de una representa ión
de la imagen f(x; y) en la que se pongan de mani�esto las prin ipales estru turas
presentes, o equivalentemente, estamos determinando uales son los sensores on
mayor nivel de a tividad frente al estímulo representado por f(x; y). La ter era
etapa nos permitirá, en base a la des omposi ión realizada sobre f(x; y), omparar
la imagen de referen ia on una imagen test
b
f(x; y). En esen ia lo que se persigue on
este esquema es no omparar las dos imágenes en un dominio espa ial o fre uen ial
( omo lo ha en RMSE y otras medidas), sino ompararlas en un dominio per eptual.
Las dos primeras etapas transforman la imagen a ese nuevo dominio y es en él donde
apli amos la métri a de error.
La formula ión de la medida de distorsión (que llamaremos d1) es la siguiente:
d1
�
f;
b
f
�
=
X
S
k
2S
A t
N�1
X
x=0
M�1
X
y=0
m
S
k
� d1
S
k
�
f (x; y) ;
b
f (x; y)
�
(5.8)
donde S
A t
es el onjunto de sensores a tivos, m
S
k
es el fa tor que pondera la
importan ia relativa de ada sensor y donde
d1
S
k
�
f (x; y) ;
b
f (x; y)
�
=
�
�
�
�
�
1
�
f
Resp (f; S
k
;x; y)�
1
�
b
f
Resp
�
b
f; S
k
;x; y
�
�
�
�
�
�
2
(5.9)
donde �
f
es el nivel medio de gris de la imagen original f(x; y), �
b
f
es el nivel
medio de gris de la imagen test
b
f(x; y) y Resp (h; S
k
; x; y) es la respuesta del sensor
S
k
frente a una imagen h(x; y) de�nida omo
Resp (h; S
k
;x; y) = h (x; y) gb (x; y; �
S
k
; �
S
k
; �
S
k
) (5.10)
donde �
S
k
es la es ala aso iada a la fun ión de Gabor que modela el ampo
re eptivo del sensor S
k
, y �
S
k
y �
S
k
son la fre uen ia radial media y la orienta ión
media respe tivamente del sensor S
k
. El an ho de banda del sensor viene determinado
por la es ala. La fun ión gb() se de�ne en la e ua ión 2.5.
d1
S
k
�
f;
b
f
�
mide la diferen ia per eptual existente entre la respuesta que tiene
el anal modelado por el sensor S
k
frente a la imagen de referen ia f(x; y) y la
92 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual
PSfrag repla ements
f(x; y)
f(x; y)
F (u; v) Parti ión multisensor Sensores a tivos
b
f(x; y)
Medida de distorsión
P
r
i
m
e
r
a
e
t
a
p
a
S
e
g
u
n
d
a
e
t
a
p
a
T
e
r
e
r
a
e
t
a
p
a
Modeliza ión
de los
ampos re eptivos
+ +
---
Figura 5.1: Esquema general de la medida de distorsión.
5.2. Medida de distorsión perceptual 93
respuesta de ese mismo sensor respe to a la imagen test
b
f(x; y). O lo que es lo mismo,
estamos viendo la diferen ia que existe en uanto a la a tiva ión de los sensores que
omponen ese anal uando se propor iona omo estímulo la señal f(x; y) y uando
se propor iona omo estímulo la señal
b
f(x; y).
Es un he ho ono ido que la fun ión de sensibilidad al ontraste del SVH varía
de a uerdo al nivel medio de ilumina ión del fondo. La normaliza ión introdu ida
on �
f
y �
b
f
pretende evitar las varia iones debidas al ambio de ese nivel medio de
ilumina ión en ambas imágenes.
En la e ua ión 5.8 los pesosm
S
k
son introdu idos para ha er la respuesta de ada
sensor a tivo propor ional a su importan ia respe to a su ontribu ión informa io-
nal en la imagen original f(x; y). Este fa tor se puede entender omo la importan ia
relativa que tienen unas estru turas de la imagen frente a otras, de he ho el SVH es
apaz de a entuar algunas estru turas de la imagen en detrimento de otras menos
signi� ativas visualmente. El riterio de sele ión de esos pesos va a ser la minimiza-
ión de la diferen ia existente entre la imagen original f(x; y) y una re onstru ión
de esta en base a la informa ión ontenida en los sensores a tivos
e
f(x; y), es de ir,
sele ionaremos aquellos pesos que minimizen la siguiente expresión:
X
x
X
y
�
�
�
f (x; y)�
e
f (x; y)
�
�
�
2
(5.11)
donde
e
f(x; y) se de�ne omo:
e
f (x; y) =
X
S
k
2S
A t
jm
S
k
� Resp (f; S
k
;x; y)j (5.12)
es de ir, la re onstru ión de la imagen original será una suma ponderada de las
respuestas de ada sensor a tivo.
Tal y omo está formulado, el éxito de este modelo dependerá de dos fa tores
importantes: el modelo de visión adoptado y la métri a de error que se use para
uanti� ar las diferen ias en el nuevo dominio. Algunos resultados experimentales
muestran que pare e más importante el modelo que la métri a (Faugeras [29℄).
En las siguientes se iones se va a omparar la medida propuesta on las medidas
lási as a través de diferentes experimentos. Se ha sele ionado para ello RMSE,
aunque los resultados son similares para otras medidas no per eptuales.
94 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual
PSfrag repla ements
(A) (B)
Figura 5.2: (A) Imagen sintéti a usada en el experimento de enmas aramiento. (B) Parti-
ión multisensor y sensores a tivos dete tados.
5.3 Experimento de enmas aramiento
Con este experimento se pretende ha er una primera ompara ión entre d
1
y RMSE.
Para su realiza ión se ha generado una imagen sintéti a que onsiste en una bola
obtenida a partir de una ampana de Gauss de 256 niveles de gris. Esta imagen
se puede ver en la �gura 5.2(A). En la misma �gura (5.2(B)) apare e también la
parti ión multisensor junto on los sensores a tivos dete tados. Puesto que una
gaussiana es una estru tura sin orienta ión predominante, se puede apre iar que se
dete ta un sensor signi� ativo en ada orienta ión, ubriendo de esta forma una
banda ompleta de fre uen ias.
A la imagen sintéti a se le ha apli ado un efe to de enmas aramiento mediante
dos pro edimientos distintos. El primero de ellos onsiste en añadir ruido normal
sobre la imagen de manera uniforme, es de ir, la probabilidad de que en un punto
ualquiera aparez a ruido es siempre
1
N �M
, donde N yM son los tamaños horizontal
y verti al, en píxeles, de la imagen. El segundo método onsistirá en añadir de nuevo
ruido normal, pero esta vez de manera no uniforme, es de ir, la probabilidad de que
en un punto aparez a ruido no es la misma para todos los puntos de la imagen. En
on reto, se ha usado una imagen binaria que sirve de más ara, de forma que sólo
apare erá ruido en aquellas posi iones (x; y) de la imagen, tal que la misma posi ión
en la imagen de más ara tenga omo valor uno.
En la �gura 5.3 se pueden ver las seis imágenes generadas on ruido uniforme y en
5.3. Experimento de enmascaramiento 95
Figura 5.3 RMSE d
1
(A) 10 1.369
(B) 20 6.351
(C) 30 12.599
(D) 40 18.849
(E) 50 31.294
(F) 60 52.319
Tabla 5.1: Valores de RMSE y d
1
entre la imagen original y ada una de las imágenes on
ruido uniforme de la �gura 5.3.
Figura 5.4 RMSE d
1
(A) 10 1.463
(B) 20 7.563
(C) 30 14.047
(D) 40 37.886
(E) 50 129.160
(F) 60 328.363
Tabla 5.2: Valores de RMSE y d
1
entre la imagen original y ada una de las imágenes on
ruido no uniforme de la �gura 5.4.
la �gura 5.4 se pueden ver las seis imágenes generadas on ruido no uniforme. Para
el segundo aso se puede apre iar laramente ual es la más ara que se ha usado. En
las �guras se muestra también la desvia ión típi a que se ha usado para produ ir el
ruido gaussiano en ada imagen.
La parti ularidad que tienen estas imágenes ruidosas es que se han generado
imponiéndoles una restri ión. Esta restri ión es que han de tener un valor de
RMSE ono ido a priori respe to de la imagen original. De esta forma, para ada
uno de los tipos de ruido añadidos (uniforme y no uniforme) se han obtenido imágenes
on seis valores de RMSE que son 10, 20, 30, 40, 50 y 60. En las tablas 5.1 y 5.2 se
pueden ver estos datos junto on los valores que produ e la medida de distorsión d
1
.
Si omparamos las imágenes on ruido uniforme y las que tienen ruido no unifor-
me, podemos ver que la disimilaridad entre ellas y la imagen original se ha e mu ho
más evidente en las que tienen ruido no uniforme, ya que en las últimas, tiende a
desapare er la bola gaussiana y a apare er una nueva forma (la misma que tiene la
más ara que se usó para generar el ruido). Este he ho no lo re�eja la medida RMSE.
Tal y omo ha sido diseñado el experimento, en ambas se uen ias, el re imiento de
esta medida es idénti o. En ambio, si miramos los valores de d
1
podemos ver omo
en el aso del ruido no uniforme, re e mu ho más rápido.
En la �gura 5.5 se puede ver de forma grá� a esta diferen ia de re imiento.
96 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual
PSfrag repla ements
(A) (B)
(C) (D)
(E) (F)
Figura 5.3: Imágenes obtenidas añadiendo ruido normal uniforme a la imagen de la �gura
5.2(A). Las desvia iones estandar de ada una de las imágenes son (A) � = 10.
(B) � = 20. (C) � = 30. (D) � = 45. (E) � = 55. (F) � = 70.
5.3. Experimento de enmascaramiento 97
PSfrag repla ements
(A) (B)
(C) (D)
(E) (F)
Figura 5.4: Imágenes obtenidas añadiendo ruido normal no uniforme a la imagen de la
�gura 5.2(A). El ruido se ha apli ado sólo sobre algunas zonas de la imagen
(idénti as para todas las imágenes). Las desvia iones estandar de ada una de
las imágenes son (A) � = 15. (B) � = 30. (C) � = 50. (D) � = 65. (E)
� = 95. (F) � = 120.
98 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual
0
50
100
150
200
250
300
350
10 20 30 40 50 60
PSfrag repla ements
No uniforme
Uniforme
Figura 5.5: Grá� a omparativa de la medida d
1
(eje verti al) frente a RMSE (eje horizon-
tal). La línea dis ontínua muestra la omparativa para las imágenes on ruido
uniforme y la ontínua para las de ruido no-uniforme.
Se han representado en el eje verti al la medida d
1
y en el horizontal la medida
RMSE. Es laramente visible que la medida per eptual mar a las imágenes on
ruido no uniforme omo mu ho más diferentes de la original que las que tienen ruido
uniforme.
5.4 Efe to de pixelado
En este segundo experimento se pretende ha er otra ompara ión entre la medida
d
1
y RMSE. Para ello se ha tomado una imagen y se le ha apli ado un efe to
de pixelado on diferentes tamaños de entorno. Este efe to onsiste en disminuir la
resolu ión de la imagen original en un fa tor S, de forma que, si la imagen original
tenía un tamaño de N �M píxeles, la nueva imagen tendrá
N
S
�
M
S
píxeles. Cada píxel
de la nueva imagen se obtiene omo la media de los niveles de gris de un entorno de
un tamaño de S � S píxeles de la imagen original.
El experimento ha sido llevado a abo sobre dos imágenes: la imagen de Einstein
y una es ena on bar os.
✮ Imagen de Einstein:
En la �gura 5.6 se puede ver la imagen original usada en este experimento de 256x256
píxeles y otras tres imágenes obtenidas mediante el pro eso de pixela ión on tamaños
de entorno de 8x8, 12x12 y 16x16 píxeles. En la �gura 5.7 se puede ver la organiza ión
multisensor de la imagen de einstein original junto on los sensores a tivos dete tados.
5.4. Efecto de pixelado 99
PSfrag repla ements
(A) (B)
(C) (D)
Figura 5.6: (A) Imagen original. (B) Imagen pixelada 8x8. (C) Imagen pixelada 12x12.
(D) Imagen pixelada 16x16.
100 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual
(A) (B)
Figura 5.7: (A) Parti ión multisensor de la imagen original de la �gura 5.6 (Einstein). (B)
Sensores a tivos.
Tamaño de entorno RMSE d
1
8x8 21.496 571
12x12 23.636 902
16x16 24.983 1094
Tabla 5.3: Valores de las medidas de distorsión entre la imagen original (Einstein) y las
imágenes pixeladas.
En la tabla 5.3 se pueden ver los valores de las medidas de distorsión al uladas
entre la imagen original y ada una de las imágenes píxeladas.
✮ Imagen de los bar os:
Este experimento es igual al que se ha realizado sobre la imagen de Einstein pero
usando una es ena natural de un puerto on bar os (�guras 5.8 y 5.9).
La tabla donde se muestran los valores de las medidas de distorsión al uladas
entre la imagen original de los bar os y ada una de las imágenes pixeladas es la 5.4.
En ambos experimentos, si se muestra la imagen pixelada de tamaño 8x8 a un
sujeto que no haya visto a priori las imágenes originales, este sería apaz de distinguir
orre tamente el estímulo presentado (Einstein o es ena de bar os), es de ir, su
sistema visual es apaz de eliminar las altas fre uen ias introdu idas por los bordes
de los uadros que produ e el efe to de pixelado. En ambio, si nos �jamos en las
Tamaño de entorno RMSE d
1
8x8 22.164 355.6
12x12 25.542 840.1
16x16 27.376 1162.6
Tabla 5.4: Valores de las medidas de distorsión entre la imagen original (es ena de los bar-
os) y las imágenes pixeladas.
5.4. Efecto de pixelado 101
(A) (B)
(C) (D)
Figura 5.8: (A) Imagen original. (B) Imagen pixelada 8x8. (C) Imagen pixelada 12x12.
(D) Imagen pixelada 16x16.
102 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual
(A) (B)
Figura 5.9: (A) Parti ión multisensor de la imagen original de la �gura 5.8 (es ena de los
bar os). (B) Sensores a tivos.
imágenes más pixeladas (16x16), es asi imposible de ir que representa la imagen (si
no se ono e a priori).
Este efe to es mu ho más pronun iado en la es ena portuaria. Si observamos la
es ena de Einstein pixelada a 16x16 y onseguimos desenfo ar la imagen forzando el
mús ulo del ojo, podríamos llegar a ver la ara de Einstein ( on bastante di� ultad),
en ambio, si ha emos este experimento on la es ena de los bar os no es posible ver
la es ena original.
Si vemos los valores de ambas medidas en las tablas de datos, podemos ver que
RMSE mantiene valores similares para los tres niveles de pixela ión mientras que los
valores de d
1
re en mu ho más rápido onforme aumentamos el nivel de pixelado.
En on reto, en la tabla 5.4, la medida d
1
para el nivel 16x16 asi tripli a al valor
que se obtiene para el nivel 8x8 mientras que RMSE re e en una propor ión de,
aproximadamente, 1.24.
En de�nitiva, la medida d
1
pare e estable er una distin ión más lara entre lo que
es re ono ible y lo que no es re ono ible de a uerdo a omo lo haría un observador
humano.
5.5 Distinguibilidad de objetos
En esta se ión se muestran varios experimentos rela ionados on la dete tabilidad
de objetos en es enas naturales. En este ámbito, se han desarrollado diversas me-
didas para determinar la disimilaridad existente entre objetos presentes en es enas
naturales y su entorno (Copeland et al. [17℄ [16℄). Algunas de esas métri as se basan
en estadísti os de primer orden y otras ha en uso de estadísti os de orden superior,
que aptan rela iones espa iales existentes entre píxeles distantes en la imagen. Aún
así, la mayoría de ellas are en de una base sólida sobre la que operar ya que toman
5.5. Distinguibilidad de objetos 103
omo datos de partida los valores de luminan ia de las imágenes en lugar de ha er
uso de algún tipo de modelo visual que tenga en uenta ara terísti as del SVH.
Una métri a que ha servido de base para el desarrollo de otras es la métri a de
Doyle:
Doyle =
q
(�
t
� �
b
)
2
+ (�
t
� �
b
)
2
(5.13)
donde �
t
y �
t
son la media y desvia ión estándar del área que omprende el objeto
y �
b
y �
b
son la media y desvia ión del fondo de la es ena. Esta métri a fun iona
bien en entornos ontrolados pero no o urre lo mismo uando usamos es enas del
mundo real. Copeland et al. [17℄ on luyen que esta es una de las medidas basadas
en estadísti os de primer orden que mejor orrela on medidas subjetivas he has por
observadores humanos.
5.5.1 Ordena ión de imágenes en base a la visibilidad de objetos
presentes en ellas
Las imágenes usadas en este experimento (Figuras 5.10 y 5.11) son 6 parejas, ada
una de las uales onsta de una es ena natural va ía y la misma es ena on un objeto
en el entro (en este aso se trata de un vehí ulo militar). Estas imágenes son de un
tamaño de 128x128 píxeles y han sido propor ionadas por el TNO Human Fa tors
Resear h Institute de Holanda. Han sido sele ionadas de entre un onjunto de 65
imágenes de similares ara terísti as. La sele ión se ha he ho de forma que se tenga
una muestra representativa de objetos on diferentes niveles de visibilidad, desde
muy visibles hasta po o o asi nada visibles. Para ver más ara terísti as té ni as
referentes al pro eso de apta ión de di has imágenes se puede ver el trabajo de
Toet [112℄. El experimento que se plantea en esta se ión onsiste en determinar
la visibilidad relativa de ada objeto respe to de su entorno inmediato usando la
medida de distorsión d
1
.
Para el ál ulo de la medida de distorsión d
1
se ha tomado, en ada par, omo
imagen de referen ia la que ontiene el objeto y omo imagen test la que ontiene sólo
la es ena va ía. De esta forma la parti ión multisensor realizada sobre la imagen on
el objeto podrá aptar, en on reto, las estru turas presentes en di ho objeto. En la
�gura 5.12 se puede ver la organiza ión multisensor de la imagen de referen ia de la
pareja A. También se muestran los sensores a tivos dete tados y una re onstru ión
de la imagen de referen ia usando el método expuesto en la se ión 5.2 (e ua ión
5.12).
Los resultados de la medida d
1
se van a omparar on los obtenidos por RMSE
104 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual
PSfrag repla ements
(A)
(B)
(C)
Figura 5.10: 6 parejas de imágenes usadas en el experimento de dete ión de objetos. Cada
pareja onsta de una es ena natural va ía (dere ha) y la misma es ena on un
objeto en el entro (izquierda). (Continúa en la figura 5.11).
5.5. Distinguibilidad de objetos 105
PSfrag repla ements
(D)
(E)
(F)
Figura 5.11: (Continua ión de la figura 5.10).
106 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual
PSfrag repla ements
Parti ión multisensor
Sensores a tivos
Re onstru ión
Figura 5.12: Parti ión del espe tro de la imagen on objeto de la pareja A de la �gura 5.10
y re onstru ión de la imagen usando la e ua ión 5.12.
y, además, on los obtenidos tras mostrar las imágenes a un grupo de observadores
humanos (Toet [112℄). En la tabla 5.5 se muestran di hos resultados. La primera
olumna indi a el par de imágenes sobre el que se trabaja. La olumna �Subjetivo�
muestra por una parte (sub- olumna �Orden�) la ordena ión que asignan el grupo
de sujetos del experimento a las imágenes de mayor a menor visibilidad del objeto
presente en ellas y por otra se muestra también una separa ión en lusters de di has
imágenes (ver Toet [112℄ para más detalles). La pertenen ia de dos o más imágenes
a un mismo luster indi a que no hay una ordena ión lara entre ellas por parte de
los observadores humanos, es de ir, dentro de un mismo luster es válida ualquier
ordena ión que hagamos de las imágenes. La olumna �RMSE� indi a el valor de
la medida RMSE entre la pareja de imágenes (sub- olumna �Valor�) y la posi ión
orrespondiente en la ordena ión de visibilidad (sub- olumna �Orden�). Por último
la última olumna (�d
1
�) muestra lo mismo que la anterior pero para la medida de
distorsión d
1
.
Para determinar uales son los lusters existentes, se ha he ho un estudio de las
fun iones de distribu ión a umuladas que se orresponden on las probabilidades de
dete ión de los objetos de las imágenes. Estas probabilidades de dete ión se han
obtenido en fun ión del tiempo medio ne esario por un observador humano para de-
te tar los objetos presentes en las imágenes. Para analizar la distinguibilidad relativa
entre los objetos, se ompara el área que hay bajo las urvas de probabilidad a umu-
lada. En base a estos valores se obtiene una ordena ión subjetiva. La determina ión
de la separa ión entre lusters se obtiene analizando los ru es que se produ en entre
las urvas de probabilidad a umulada. Para más detalles sobre este pro eso se puede
onsultar Toet [112℄.
5.5. Distinguibilidad de objetos 107
Par Medidas de distorsión
Subjetivo RMSE d
1
Cluster Orden Valor Orden Valor Orden
A 1 1 6.626 4 75.796 1
B 2 4 6.680 3 31.493 4
C 1 2 7.096 1 55.732 3
D 1 3 6.748 2 61.413 2
E 3 5 5.611 5 18.954 5
F 3 6 5.350 6 15.665 6
Tabla 5.5: Valores de las medidas de distorsión y ordena iones para las parejas de imágenes
de la �gura 5.10.
En la �gura 5.13 se pueden ver las distintas ordena iones realizadas por los tres
métodos. En la primera olumna está la ordena ión subjetiva he ha por observadores
humanos. Se indi an los lusters mediante un re uadro que engloba a las imágenes
que pertene en a un mismo luster. La segunda olumna muestra la ordena ión
obtenida por RMSE. Aquí se ve que han ambiado las posi iones de los pares A y B
de forma que se rompe la ordena ión por lusters. Esto impli a una mala orrela ion
on el ranking subjetivo. Claramente el objeto del par A es más visible que el de
la pareja B. En la última olumna está la ordena ión he ha por d
1
. Aunque se han
inter ambiado las posi iones de los pares C y D, estos siguen estando dentro del
mismo luster y por tanto la ordena ión sería a eptable desde el punto de vista de
un observador humano.
5.5.2 Predi ión de la distinguibilidad visual de objetos
Rohaly et al. [98℄ han obtenido re ientemente que los modelos que uanti� an la
visibilidad de las diferen ias entre dos imágenes pueden prede ir la distinguibilidad
visual de objetos en es enas natuales. El experimento de esta se ión usa la mé-
tri a omputa ional d
1
para prede ir la distinguibilidad de objetos per ibida por
observadores humanos.
Para realizar este experimento se ha usado una base de datos de 44 imágenes on
ara terísti as similares a las del experimento de la se ión 5.5.1, es de ir, son es enas
naturales on vehí ulos militares en el entro, de forma que el nivel de visibilidad de
di hos vehí ulos es muy variado entre unas imágenes y otras debido a la distan ia
de la ámara, tamaño del vehí ulo, amu�aje utilizado, et . Esta base de datos ha
sido diseñada espe í� amente para este tipo de experimentos y ha sido reada por el
TNO HFRI de Holanda. Los detalles té ni os sobre la apta ión de estas imágens se
108 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual
PSfrag repla ements
A
A
A
B
B
B
C
C
C DD
D
E
EE
F
FF
Subjetivo RMSE d
1
Figura 5.13: Ordena iones de mejor a peor visibilidad de las imágenes de la �gura 5.10.
5.5. Distinguibilidad de objetos 109
PSfrag repla ements
(A) (B) (C)
(D) (E) (F)
Figura 5.14: Muestra de las imágenes de la base de datos del TNO HFRI. (A) n
o
34, (B)
n
o
20, (C) n
o
36, (D) n
o
29, (E) n
o
15, (F) n
o
32.
pueden onsultar en Toet [113℄. En la �gura 5.14 se puede ver una muestra de esta
base de datos.
La determina ión de la distinguibilidad de los objetos presentes en las imágenes
se realiza mediante el siguiente método: Se va a de�nir la distinguibilidad visual de
un objeto omo la máxima separa ión angular entre el objeto y el punto de �ja ión
del ojo de forma que el objeto pueda ser distinguible omo algo que no pertene e
a su entorno (Wertheim [123℄). Esta es una medida simple y que se puede usar
en este tipo de experimentos, además requiere po os sujetos para realizarla (dos o
tres) (Toet et al. [114℄). La medida resultante ara teriza la extensión del área
de distinguibilidad entre el punto de �ja ión y el entro del objeto (Engel [25℄ [26℄
[27℄, Geisler et al. [39℄). La medida se al ula de la siguiente forma (Toet et al.
[114℄): Ini ialmente el observador inspe iona la imagen y �ja el objeto en su fóvea;
a ontinua ión, se olo a a una ierta distan ia y �ja un punto en la es ena a gran
distan ia angular del objeto. Cuando el observador �ja ese punto, el objeto debe
estar posi ionado en su ampo de visión periféri a de forma que sea indistinguible de
su entorno; el observador va �jando nuevos puntos de aten ión sobre la es ena que
110 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual
0.1 1 10 100 1000 10000
d1 (-)
0.01
0.1
1
10
dv (deg)
Figura 5.15: Rela ión entre la medida omputa ional d1 y la medida psi ofísi a de distin-
guibilidad visual.
estén ada vez más er a del objeto (en línea re ta) hasta que onsiga distinguirlo.
La distan ia angular entre el objeto y el punto más lejano donde es distinguible el
objeto se anota. Esta medida se ha e al menos tres ve es y la media de esas medidas
ara teriza la distinguibilidad del objeto en la dire ión de la re ta que se ha ido
trazando. La medida �nal se obtiene omo la media de todas las observa iones y de
todos los sujetos que parti ipan en el experimento.
Para poder apli ar la métri a d
1
se han ne esitado, además de las imágenes on
el objeto a dete tar, otras imágenes iguales que ellas pero sin di ho vehí ulo, es de ir,
la mismas es enas naturales pero sin el vehí ulo. De esta forma se puede apli ar el
método de representa ión desarrollado sobre la es ena on objeto y después apli ar
la medida d
1
tomando esa imagen omo imagen de referen ia y la imagen on la
es ena va ía omo imagen test.
La medida psi ofísi a de distinguibilidad se ha omparado on la medida ompu-
ta ional d
1
. En la �gura 5.15 se puede ver la rela ión existente entre ambas.
La representa ión se ha he ho en una es ala logarítmi a y se ha ajustado una
re ta mediante mínimos uadrados a la nube de puntos:
log dv = �0:85 + 0:43 log d
1
La orrela ión entre el logaritmo de los valores de d
1
y el logaritmo de la medida
5.5. Distinguibilidad de objetos 111
de distinguibilidad visual es de 0.81, un valor su� ientemente alto omo para poder
aseverar que la métri a omputa ional produ e una buena predi ión de la visibilidad
de los objetos presentes en las imágenes tal y omo lo haría un observador humano.
5.5.3 Ordena ión de imágenes de la base de datos del TNO HFRI
Para llevar a abo este experimento, se ha usado de nuevo la base de datos del TNO
HFRI. En este aso se ha he ho un estudio ontrolado de la bondad de la medida
de distorsión d
1
sobre un sub onjunto de imágenes. En on reto se han usado 17
imágenes. El objetivo es evaluar el omportamiento global de las medidas RMSE
y d
1
en sub onjuntos extraidos de entre las 17 imágenes. La determina ión de la
bondad de ambas medidas se hará de forma similar a omo se hizo en la se ión
5.5.1, es de ir, se evaluará la distorsión existente entre ada pareja de imágenes ( on
objeto y sin objeto) y se ordenarán di has imágenes en fun ión del valor que produ e
ada una de las medidas.
Para ha er este experimento es ne esario ono er la ordena ión subjetiva de las
imágenes de la base de datos y los lusters que apare en. Tras realizar un estudio
sobre los datos realizados por una serie de observadores humanos, se han obtenido
los datos que se muestran en la tabla 5.6 (estos datos son parte de los que se usan
para el experimento de la se ión 5.5.2). En esta tabla apare en los valores de las dos
medidas de distorsión empleadas (RMSE y d
1
) y el valor del área que hay por debajo
de la urva que se obtiene tras al ular la probabilidad de dete ión a umulada. Este
último valor nos servirá para estimar la ordena ión subjetiva. Junto on esos valores
se indi a el orden relativo que o upa ada imagen en el ranking de ordena ión global
para ada medida. También se indi an, en la primera olumna los uatro lusters
que se han dete tado.
Para ada una de las imágenes de la base de datos, se ha medido el tiempo
que tarda ada uno de los individuos parti ipantes en el experimento, en dete tar los
objetos que hay presentes en ellas. Este tiempo estará en fun ión de diversos fa tores
omo por ejemplo, el tamaño del objeto, la visibilidad del mismo, su posi ión en la
imagen, el punto ini ial a partir del que se omienza la búsqueda, la estrategia de
búsqueda, et . Con estos tiempos, se puede onstruir una fun ión de distribu ión
empíri a, para ada imagen, que determine la probabilidad de dete tar el objeto
presente en ella en un tiempo dado. Esta fun ión empíri a tienen un omportamiento
que se puede modelar mediante la siguiente fun ión teóri a (Krendel et al. [63℄,
Rotman et al. [100℄, Waldman et al. [116℄):
112 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual
Área RMSE d
1
Cluster Imagen Valor Orden Valor Orden Valor Orden
C
1
16 96.39 2 2.55 21 8.95 20
C
1
34 96.37 3 30.48 1 2444.88 1
C
1
18 96.02 7 4.51 11 201.56 7
C
1
20 95.77 8 6.99 8 114.93 8
C
1
10 95.63 11 3.20 17 19.16 14
C
2
28 93.48 12 3.86 12 6.19 25
C
2
43 93.34 13 5.49 9 60.11 11
C
2
36 92.81 15 4.56 10 69.01 10
C
2
6 90.95 19 1.94 27 7.57 22
C
2
29 89.47 22 1.60 29 2.73 28
C
3
8 84.47 24 1.57 30 4.49 26
C
3
23 82.91 26 1.42 32 2.25 29
C
3
38 82.52 27 2.54 22 1.15 32
C
3
15 80.46 28 1.17 33 1.51 31
C
3
32 79.52 30 1.12 34 1.56 30
C
3
21 73.84 33 1.35 31 0.98 35
C
4
4 53.89 36 0.98 36 0.48 36
Tabla 5.6: Datos de las 17 imágenes de la base de datos del TNO HFRI. Para ada imagen se
muestra el luster al que pertene e y las tres ordena iones onsideradas: subjetiva,
RMSE y d
1
. También se muestran los valores del área que hay por debajo de la
urva de probabilidad de dete ión a umulada y de las otras dos medidas usadas.
5.5. Distinguibilidad de objetos 113
0
0.2
0.4
0.6
0.8
1
0 5 10 15 20 25
16,3418,2010
28,43,366,29
8,23,38,15,32,21
4
Figura 5.16: Fun iones de distribu ión teóri as del tiempo de dete ión para las 17 imágenes
de la base de datos. Con un ír ulo se indi an los lusters dete tados.
P
d
(t) =
(
0 si t < t
0
1� exp
�
�
t�t
0
�
�
si t � t
0
(5.14)
donde t
0
es el mínimo tiempo de respuesta obtenido y � es una onstante. P
d
(t)
representa, por tanto, la fra ión de dete iones orre tas hasta un tiempo t. Estos
autores han omprobado la validez de esta distribu ión teóri a para prede ir el tiempo
de dete ión de objetos en entornos naturales.
Se ha he ho un ajuste de las fun iones de distribu ión empíri as mediante fun-
iones teóri as omo la que se presenta en la e ua ión 5.14. Para ha er este ajuste
se han dejado omo parámetros libres t
0
y � . En la �gura 5.16 se pueden ver las
grá� as de las fun iones teóri as obtenidas.
Una vez que tenemos las urvas teóri as pro edemos a determinar los lusters
que existen. Entenderemos que dos imágenes pertene en a un mismo luster si
sus urvas de probabilidad de dete ión son su� ientemente pare idas. El he ho
de que dos urvas sean similares impli a que los objetos que hay en las imágenes
son, aproximadamente, igual de omplejos en uanto al tiempo que se requiere para
114 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual
N
o
errores d
1
RMSE
0 208 104
1 0 0
2 545 379
3 0 0
4 229 432
5 0 0
6 18 85
7 0 0
8 0 0
9 0 0
10 0 0
Tabla 5.7: Tasas de error de d
1
y RMSE en los sub onjuntos sele ionados.
dete tarlos y por tanto, en uanto a la visibilidad de los mismos. De esta forma, si
dos imágenes pertene en al mismo luster podremos de ir que la visibilidad de los
objetos presentes en ellas es similar y, por tanto, el lugar que o upen en la ordena ión
relativa que puedan ha er personas distintas estará más en fun ión de ir unstan ias
parti ulares de los individuos que parti ipan en el experimento, omo por ejemplo el
punto de �ja ión donde omienzan a ha er la explora ión de la imagen, que en las
ondi iones de visibilidad de los propios objetos. De esta forma daremos por buena
una ordena ión que altere ordena iones dentro de un mismo luster.
Para determinar la similaridad de dos fun iones usaremos el test de Kolmogorov-
Smirnov (Law et al. [64℄, Press et al. [96℄). Tras ha er este estudio on todas las
fun iones ( on una bondad del 99%) se obtienen los lusters de la tabla 5.6 que se
pueden ver de forma grá� a en la �gura 5.16.
El planteamiento del experimento es el siguiente: dadas las 17 imágenes de la
base de datos, se han sele ionado de forma aleatoria 1.000 sub onjuntos de ellas
y se ha estudiado el omportamiento de las medidas RMSE y d
1
sobre estos sub-
onjuntos. El número de apari iones de ada imagen en todos los sub onjuntos es
aproximadamente uniforme. En la tabla 5.7 se puede omparar la tasa de fallos
que tienen las dos medidas. En esta tabla se muestra el número de sub onjuntos
en los que d
1
(segunda olumna) y RMSE (ter era olumna) ometen un número
determinado de fallos (primera olumna).
Se puede apre iar que, en global, d
1
omete menos errores que RMSE en las
lasi� a iones que realiza. Mientras que el número de errores que omete RMSE
está en torno a los 4, la tasa de error de d
1
se sitúa alrededor de 2. Además, para un
número alto de errores, RMSE omete bastantes más errores que d
1
.
5.6. Evaluación de la calidad de imágenes comprimidas 115
Este experimento no ha e un estudio exhaustivo sobre el omportamiento de
RMSE frente a la medida d
1
, aunque es una muestra signi� ativa. La inten ión
del mismo es mostrar la mejora que puede suponer el uso de una medida per eptual
en asos en los que el omportamiento de las medidas lási as del tipo de RMSE
obtienen malos resultados.
5.5.4 Búsqueda visual
Una ara terísti a de interés en la tarea de dete ión de objetos por parte el SVH,
es el tiempo que se tarda en dete tarlos; esto es de vital importan ia, por ejemplo,
en apli a iones militares. Sin embargo, las ara terísti as que posee un buen sistema
(en este aso un sistema humano) de búsqueda visual son mu has más. Entre ellas,
el ono imiento a priori que tenga el sistema sobre los objetos que está intentando
lo alizar en la imagen.
Un objeto no es distinguible por si mismo sino por la diferen ia que existe entre
él y su entorno y por tanto uanto más distinto sea de su entorno más fá il (y más
rápido) será de dete tar. El experimento de esta se ión estudia la apa idad de la
medida d
1
para prede ir la bondad de la búsqueda visual que realiza el sistema visual
humano.
El experimento es el siguiente: Un grupo de observadores van a visualizar una
serie de imágenes que ontienen un objeto (un vehí ulo militar). Se va a medir el
tiempo medio que tardan en dete tar di ho vehí ulo y esta será la medida que nos
determine la distinguibilidad del objeto.
En la �gura 5.17 se muestra la rela ión entre la métri a d
1
y los tiempos medios
de búsqueda para ada imagen. Un ajuste por mínimos uadrados del logaritmo de
los datos obtiene la siguiente rela ión entre ambas medidas:
logST = 1:15 � 0:27 log d
1
donde ST representa el tiempo medio de búsqueda (en segundos). La orrela ión
entre ambas medidas es de 0.82. Este valor indi a una buena aproxima ión entre los
resultados que predi e d
1
y los obtenidos por observadores humanos.
5.6 Evalua ión de la alidad de imágenes omprimidas
En este experimento se pretende evaluar la alidad visual que tienen las imágenes que
son pro esadas por algoritmos de ompresión on pérdidas. En on reto, la té ni a
de ompresión on pérdidas usada en este trabajo es el estándar Joint Photographi
116 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual
0.1 1 10 100 1000 10000
d1 (-)
1
10
100
ST (s)
Figura 5.17: Rela ión entre la medida d
1
y el tiempo medio de búsqueda. La línea ontínua
representa el ajuste por mínimos uadrados.
Expert Group (JPEG) (Walla e [117℄, Leger et al. [65℄). La importan ia que tienen
este tipo de algoritmos en la a tualidad es muy elevada, ya que ada vez hay mayor
demanda de transmisión de informa ión (TV digital, video onferen ia, satélites, ...)
por unos anales que tienen una apa idad limitada. Puesto que aumentar la apa-
idad del anal no siempre es posible debido a fa tores e onómi os o imposibilidad
material, se impone omprimir al máximo las imágenes que se transmiten on la
mínima pérdida de alidad en su re ep ión. Hay dos tipos de algoritmos de ompre-
sión: sin pérdida y on pérdida. En las té ni as de ompresión sin pérdida la imagen
que llega al re eptor, tras ser de odi� ada, es exa tamente igual a la imagen que fué
enviada por el emisor; en ambio, en las té ni as on pérdida, la imagen re ibida no
es exa tamente igual a la enviada. La diferen ia entre unas té ni as y otras es la
razón de ompresión, mientras que en las primeras esa razón suele ser baja (5:1), en
las segundas se pueden al anzar razones muy elevadas (100:1) a ambio de alguna
pérdida en la alidad de la imagen re ibida ( uanto mayor sea el grado de ompresión
menor será la alidad de la imagen re ibida).
En el algoritmo JPEG, el grado de ompresión se ontrola mediante un pará-
metro denominado fa tor de alidad (qf ) que lo que ha e es ambiar la matriz de
uantiza ión usada en di ho algoritmo (Leger et al. [65℄). Un fa tor de alidad bajo
da lugar a un alto grado de ompresión y peor alidad de la imagen y un fa tor de
5.6. Evaluación de la calidad de imágenes comprimidas 117
alidad alto impli a po a ompresión y mejora en la alidad de la imagen.
5.6.1 Rela ión entre la medida de distorsión d
1
y el fa tor de alidad
de ompresión
En este experimento vamos a medir la distorsión existente entre la imagen original
de la �gura 5.18, a la que llamaremos f(x; y), y esa misma imagen omprimida on
fa tores de alidad que variarán entre 1 y 99; denominaremos a ada una de esas
imágenes
d
f
qf
(x; y) donde qf es el fa tor de alidad on el que ha sido omprimida
la imagen original. Se pueden ver algunas de estas imágenes omprimidas en las
�guras 5.18 y 5.19. La imagen de partida es la imagen de los bar os que se usó en
un experimento anterior.
También se ha al ulado la medida RMSE para poder ha er una omparativa.
Se ha elegido esta medida por ser una de las más utilizadas a pesar de ser ono idos
los defe tos que tiene. Los valores de ambas medidas d
1
se pueden ver en la tabla
5.8 y grá� amente en la �gura 5.20.
Se puede ver que para valores del fa tor de alidad altos, la métri a d
1
re e
aproximadamente en la misma propor ión que lo ha e RMSE. Si bien, se puede
apre iar una primera diferen ia: los valores de d
1
son similares entre si (próximos a
0 ó 1) mientras que los valores de RMSE tienen un rango de valores más amplio.
Es de ir, el re imiento de ambas fun iones es más o menos lineal salvo que en el
aso de RMSE la pendiente es más pronun iada que en el de d
1
. Si vemos las
imágenes omprimidas on niveles de alidad mayores que 40 (aproximadamente),
no apre iaremos gran diferen ia entre ellas e in luso entre ualquiera de ellas y la
original a simple vista, lo ual es un dato a favor de la medida d
1
que nos está
indi ando on esos valores, que la diferen ia entre esas imágenes y la original es muy
leve y además que las diferen ias entre ellas tampo o son laramente distinguibles
a simple vista. Por el ontrario, RMSE asigna valores de distorsión laramente
diferen iados entre las imágenes on fa tor de alidad próximo a 100 y las que tienen
fa tores de alidad próximo a 40 (mayor que 40).
La segunda diferen ia importante la podemos ver para fa tores de alidad ba-
jos. La diferen ia visual entre la imagen original y las imágenes omprimidas se va
ha iendo más evidente al disminuir el fa tor. Además, basta on un pequeño de re-
mento de di ho fa tor para per ibir diferen ias visuales laras. Esto se debe a que el
efe to de bloques afe ta a zonas diferentes de la imagen uando variamos el fa tor de
alidad. Este he ho se ve re�ejado de nuevo en la medida d
1
que tiene un re imiento
mu ho más a elerado que RMSE.
118 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual
PSfrag repla ements
Original qf = 80
qf = 40 qf = 30
qf = 25 qf = 20
Figura 5.18: Muestra de las imágenes usadas en el experimento (1). En la esquina superior
izquierda está la imagen original y el resto son imágenes omprimidas on el
algoritmo JPEG a distintos niveles de alidad (80,40,30,25,20).
5.6. Evaluación de la calidad de imágenes comprimidas 119
PSfrag repla ements
qf = 17 qf = 14
qf = 11 qf = 8
qf = 5 qf = 2
Figura 5.19: Muestra de las imágenes usadas en el experimento (2). Imágenes omprimidas
on el algoritmo JPEG a distintos niveles de alidad (17,14,11,8,5,2).
120 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual
0
50
100
150
200
10 20 30 40 50 60 70 80 900
2
4
6
8
10
12
14
16
18
20
10 20 30 40 50 60 70 80 90
PSfrag repla ements
d
1
�
f;
d
f
qf
�
RMSE
�
f;
d
f
qf
�
Fa tor de alidadFa tor de alidad
Figura 5.20: Comparativa entre los valores de las medidas de distorsión d1 y RMSE frente
al fa tor de alidad del algoritmo de ompresión JPEG.
Si ahora omparamos visualmente las imágenes on fa tor de alidad 30 y 80
(�gura 5.18) respe to de la original omprobaremos que la diferen ia es mínima. d
1
tiene un in remento de 2.5816 unidades mientras que RMSE tiene un in remen-
to de 3.4786 unidades, que normalizadas frente al máximo obtenido por ada una
de las medidas resultan en 0.01197 y 0.1828 respe tivamente. Si ahora ha emos lo
mismo on las imágenes de fa tores de alidad 8 y 17 (�gura 5.19) tendremos que el
in remento para d
1
es de 23.3166 y el in remento para RMSE es de 3.0237 (normali-
zados frente al máximo de ada medida resultan en 0.1081 y 0.1589 respe tivamente).
RMSE mantiene que el in remento en la diferen ia de esas imágenes es similar al
que había entre la pareja anterior mientras que d
1
indi a que el in remento en esa
diferen ia es mu ho mayor. Si vemos las imágenes on luiremos de nuevo la mejoría
que supone el uso de la métri a d
1
. Mientras que las imágenes on fa tores 30 y 80
son prá ti amente indistinguibles una de otra, las que tienen fa tores 8 y 17 ya no
son tan similares entre si, ya que en la de peor fa tor se apre ian laramente bloques
que no apare en en la de fa tor 17.
En la �gura 5.21 se muestran las derivadas orrespondientes a las fun iones mos-
tradas en la �gura 5.20. Con estas fun iones se apre ia mejor el salto que se produ e
en la alidad visual de dos imágenes omprimidas on fa tores de alidad onse uti-
vos. Las derivadas están obtenidas onvolu ionando la fun ión original on un nú leo
DoG (derivada de gaussiana) de es ala � = 1. La onvolu ión ir ular on este nú-
leo (de tamaño 9 unidades) produ e el efe to de de re imiento brus o al omienzo
y al �nal de ambas fun iones afe tando a los 3 ó 4 valores de los extremos (estos no
serán tenidos en uenta en las valora iones). De ualquier forma, en los dos extremos
ambas fun iones tendrían un valor muy próximo a ero (sin llegar a ser negativo).
5.6. Evaluación de la calidad de imágenes comprimidas 121
qf d1 rmse - qf d1 rmse - qf d1 rmse
1 215.6002 19.0254 34 2.0378 6.8738 67 0.4853 4.8453
2 215.5545 19.0177 35 1.8483 6.7759 68 0.4037 4.7679
3 189.6434 18.0452 36 1.8232 6.6951 69 0.3755 4.7018
4 123.1069 15.9439 37 1.8212 6.6466 70 0.3738 4.6112
5 83.9636 14.4698 38 1.6739 6.5587 71 0.3317 4.5330
6 55.6957 13.3684 39 1.4582 6.4954 72 0.3361 4.4539
7 39.5904 12.5436 40 1.4537 6.4513 73 0.3185 4.3815
8 31.2808 11.9314 41 1.3404 6.3588 74 0.2580 4.2826
9 23.7312 11.3961 42 1.2927 6.3214 75 0.2581 4.2226
10 22.0397 10.9637 43 1.2680 6.2575 76 0.2516 4.1164
11 18.5348 10.5605 44 1.1558 6.1821 77 0.2152 4.0132
12 15.1491 10.1888 45 1.1616 6.1405 78 0.1981 3.9295
13 12.7487 9.8428 46 1.1149 6.0690 79 0.1994 3.8417
14 11.2821 9.5852 47 1.1144 6.0184 80 0.1646 3.7368
15 9.5917 9.3150 48 1.0444 5.9771 81 0.1588 3.6193
16 8.5635 9.1032 49 0.9260 5.9128 82 0.1403 3.5193
17 7.9642 8.9077 50 0.9264 5.8780 83 0.1215 3.3983
18 7.0958 8.7147 51 0.9276 5.8385 84 0.1192 3.2808
19 6.5061 8.5576 52 0.9216 5.7681 85 0.1094 3.1558
20 5.4611 8.3963 53 0.9061 5.7222 86 0.0804 3.0159
21 5.1760 8.2387 54 0.9059 5.6630 87 0.0795 2.9003
22 4.8098 8.1054 55 0.7930 5.6072 88 0.0767 2.7473
23 4.3930 7.9682 56 0.7989 5.5475 89 0.0706 2.6116
24 4.1733 7.8444 57 0.7416 5.4867 90 0.0475 2.4479
25 3.8069 7.7348 58 0.6706 5.4215 91 0.0469 2.2995
26 3.4562 7.6249 59 0.6721 5.3716 92 0.0460 2.1283
27 3.0829 7.5081 60 0.6643 5.3120 93 0.0344 1.9441
28 2.9839 7.3963 61 0.6023 5.2441 94 0.0276 1.7321
29 2.9513 7.3154 62 0.5914 5.1838 95 0.0266 1.5216
30 2.7462 7.2154 63 0.5878 5.1128 96 0.0199 1.2818
31 2.4769 7.1248 64 0.5880 5.0587 97 0.0199 1.0390
32 2.3432 7.0334 65 0.4977 4.9864 98 0.0195 0.7709
33 2.1030 6.9408 66 0.4824 4.9098 99 0.0177 0.4806
Tabla 5.8: Valores de las medidas de distorsión d1 y RMSE entre la imagen original de
la �gura 5.18 y ls misma imagen omprimida mediante el algoritmo JPEG on
fa tores de alidad (qf) entre 1 y 99.
122 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual
PSfrag repla ements
�d
1
�
f;
f
qf
�
�qf
�RMSE
�
f;
f
qf
�
�qf
Figura 5.21: Derivadas de las fun iones de la �gura 5.20.
Se puede observar omo, para valores de qf pequeños, la diferen ia medida por d
1
re e mu ho más que la medida por RMSE. De he ho, si observamos las imágenes
omprimidas, el efe to de bloques típi o que se produ e al omprimir on JPEG se
empieza a apre iar más laramente sobre las nubes del fondo a partir de fa tores de
alidad menores que 25 ó 30. Este he ho se puede ver re�ejado en la amplia ión de
la �gura 5.21 donde la grá� a de d
1
empieza a mostrar un aumento en la velo idad
de re imiento mientras que la grá� a de RMSE no varía esen ialmente su ompor-
tamiento en esa región. Es de ir, a partir de ese fa tor, la alidad de la imagen se va
degradando a pasos ada vez mayores.
5.6.2 Experimento 2
Este experimento es igual que el anterior pero ha e uso de otra imagen. En este aso
se trata de una mamografía digitalizada a una resolu ión de 256x256 píxeles (�gura
5.22(A)). La parti ión multisensor se muestra en la �gura 5.23.
Los niveles de ompresión JPEG que se han usado son de 80, 20 y 10 (�gura
5.22(B), (C) y (D))
En la tabla 5.9 se pueden ver los valores de las medidas entre la imagen original
y ada una de las imágenes omprimidas. En la imagen más omprimida se puede
5.6. Evaluación de la calidad de imágenes comprimidas 123
PSfrag repla ements
(A) (B)
(C) (D)
Figura 5.22: (A) Imagen de una mamografía. (B) Mamografía omprimida on un fa tor
de alidad de 80. (C) Mamografía omprimida on un fa tor de alidad de 20.
(D) Mamografía omprimida on un fa tor de alidad de 10.
PSfrag repla ements
(A) (B)
Figura 5.23: (A) Parti ión multisensor de la mamografía. (B) Sensores a tivos dete tados.
124 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual
Fa tor de alidad RMSE d
1
80 1.305 0.223
20 2.604 7.345
10 3.846 21.98
Tabla 5.9: Valores de las medidas de distorsión entre la imagen original y las imágenes
omprimidas.
apre iar laramente el efe to de bloques que produ e la ompresión JPEG mientras
que en las otras, este efe to es bastante menos pronun iado. Este he ho se re�eja
perfe tamente en los valores de d
1
que tienen un re imiento mu ho mayor que los
valores de RMSE.
5.6.3 Rela ión entre la alidad visual de imágenes omprimidas y
la onspi uidad visual
Este experimento investiga la rela ión entre la métri a d
1
y la distinguibilidad de ob-
jetos per ibida por observadores humanos, usando imágenes omprimidas mediante
el método JPEG on diferentes fa tores de alidad.
Para llevarlo a abo se han usado dos parejas de imágenes similares a las del
experimento des rito en la se ión 5.5.1, es de ir, parejas de imágenes tal que una es
una es ena natural y la otra es la misma es ena on un objeto en el entro.
La primera pareja de imágenes se muestra en la �gura 5.24. (A) muestra la imagen
original on objeto y (E) la imagen original sin objeto. (B), (C) y (D) muestran la
imagen original (A) omprimida on fa tores de alidad 10, 9 y 5 respe tivamente;
(F), (G) y (H) muestran la imagen original (E) omprimida a los niveles de alidad
10, 9 y 5 respe tivamente. El mismo experimento ha sido llevado a abo sobre un
segundo par de imágenes (�gura 5.25); en este segundo aso los niveles de ompresión
han sido de 10, 9 y 8.
Los fa tores de alidad del algoritmo de ompresión se han elegido de forma que
la diferen ia per eptual medida por d
1
sea aproximadamente igual entre niveles de
ompresión onse utivos, es de ir, d
1
(A;B) � d
1
(B;C) � d
1
(C;D). Las �e has
entre imágenes indi an la diferen ia per eptual existente entre ellas.
La distinguibilidad visual de los objetos de las imágenes presentadas (A)...(D)
han sido medidas por dos observadores usando el pro edimiento des rito en la se ión
5.5.2.
Los experimentos de esta se ión se han realizado en una habita ión on po a
ilumina ión. Las imágenes son de tamaño 1024x1024 pixeles y el área de la pantalla
es de 27x27 m. Los dos sujetos parti ipantes se han situado a una distan ia de 40
5.6. Evaluación de la calidad de imágenes comprimidas 125
(A)
(B)
(C)
(D)
(E)
(F)
(G)
(H)
68.86
62.19
46.40
60.26
36.6
837
.24
30.4
2
30.4
2
36
105
Figura 5.24: Primera pareja de imágenes. (A) Imagen original on objeto. (E) Imagen ori-
ginal sin objeto. (B), (C), (D) Imagen (A) omprimida a niveles de alidad de
10, 9 y 5 respe tivamente. (F), (G), (H) Imagen (E) omprimida on fa tores
de alidad 10, 9 y 5 respe tivamente.
126 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual
(A)
(B)
(C)
(D)
(E)
(F)
(G)
(H)
60.06
60.67
63.20
57.40
39.7
233
.88
35.4
5
43
35.4
5
51
Figura 5.25: Segunda pareja de imágenes. (A) Imagen original on objeto. (E) Imagen ori-
ginal sin objeto. (B), (C), (D) Imagen (A) omprimida a niveles de alidad de
10, 9 y 8 respe tivamente. (F), (G), (H) Imagen (E) omprimida on fa tores
de alidad 10, 9 y 8 respe tivamente.
5.6. Evaluación de la calidad de imágenes comprimidas 127
0
20
40
60
80
100
0 0.05 0.1 0.15 0.2
0
20
40
60
80
100
0 0.05 0.1 0.15 0.2
PSfrag repla ements
d
1
d
1
1
qf
1
qf
(A) (B)
Figura 5.26: Rela ión entre la métri a d1 y el fa tor de alidad (A) para la primera pareja
y (B) para la segunda pareja (B).
entímetros de la imagen. Cada observador estima la distinguibilidad del objeto en
uatro dire iones diferentes (arriba, abajo, izquierda, dere ha).
En la �gura 5.26 se puede observar la medida d
1
en fun ión de la inversa del
fa tor de alidad. La grá� a (A) se orresponde on la �gura 5.24 y la (B) on la
�gura 5.25. La línea ontínua representa la diferen ia per eptual medida por d
1
entre
la imagen on objeto (A) y esa misma imagen omprimida a diferentes niveles de
alidad (B), (C) y (D). Estos resultados muestran que d
1
se in rementa onforme
de re e la alidad de las imágenes.
Las líneas de puntos representan la diferen ia per eptual existente entre las pa-
rejas de imágenes on y sin objeto, es de ir d
1
(A;E), d
1
(B;F ), d
1
(C;G) y d
1
(D;H).
Esta grá� a es asi onstante lo que demuestra, que la diferen ia per eptual entre
una imagen y la misma imagen on un objeto en el entro es independiente del nivel
de ompresión elegido.
La �gura 5.27 muestra la rela ión entre la medida omputa ional d
1
y la inversa de
la medida de distinguibilidad visual obtenida por el método psi ofísi o de la se ión
5.5.1. La línea ontínua es para la primera pareja y la dis ontínua para la segunda. Se
puede observar en ambos asos que la medida d
1
se in rementa onforme de rementa
la distinguibilidad visual. O di ho de otro modo, onforme disminuimos el fa tor de
alidad del algoritmo de ompresión JPEG hemos de a er ar más el punto de �ja ión
usado en la determina ión psi ofísi a de la distinguibilidad para poder asegurar la
distinguibilidad del objeto presente en la imagen.
En el aso de la segunda pareja de imágenes este he ho pare e menos evidente.
Esto es debido fundamentalmente al efe to de bloques produ ido por el algoritmo
JPEG. En la segunda pareja los bloques han oin idido de forma que han deformado
128 Capítulo 5. Desarrollo de una Medida de Distorsión Perceptual
0
20
40
60
80
100
0 0.5 1 1.5 2
d1
1/dv (1/deg)
Figura 5.27: Rela ión entre la métri a d1 y la medida psi ofísi a de dintinguibilidad para la
primera pareja (línea ontínua) y para la segunda pareja (línea dis ontínua).
el objeto y por tanto se ha e muy difí il su identi� a ión. En la primera pareja,
esta deforma ión no ha afe tado tanto a las ara terísti as que ha en identi� able el
objeto omo un vehí ulo militar.
Con lusiones y Líneas futuras
Con lusiones
Las on lusiones fundamentales que se derivan de la investiga ión realizada en esta
Tesis son las siguientes:
✮ Se ha desarrollado un modelo de representa ión de imágenes digitales de niveles
de gris inspirado en algunas de las propiedades del SVH.
✮ Se ha demostrado que ha iendo uso de una por ión relativamente baja del es-
pe tro fre uen ial, es posible mejorar métodos lási os de parti ión multi anal
en donde se pro esa el espe tro ompleto.
✮ A través de los resultados experimentales, se ha demostrado la validez del uso
de fun iones de Gabor omplejas para la modeliza ión de los ampos re eptivos
de las élulas simples del órtex visual.
✮ Se han desarrollado distintos métodos de extra ión de es alas naturales glo-
bales on éxito. En on reto, se ha desarrollado un método basado en una
representa ión de la imagen en un dominio intermedio entre el espa ial y el
fre uen ial: el dominio de Gabor.
✮ Se ha desarrollado un método de extra ión de es alas naturales lo ales que
ha e uso del modelo de representa ión propuesto.
✮ Se ha desarrollado una medida de distorsión per eptual, a partir del modelo
de representa ión propuesto, que orrela bien on observa iones he has por
humanos. En on reto, esta medida mejora los resultados que obtiene una de
las medidas lási as más utilizadas hasta el momento (RMSE).
129
130 Conclusiones y líneas futuras
Líneas futuras de investiga ión
Como onse uen ia de la investiga ión realizada quedan abiertas diversas líneas de
investiga ión; las más relevantes se itan a ontinua ión:
✮ Uso de una parti ión multi anal ompletamente dependiente de los datos.
✮ In orporar el método de dete ión de es alas lo ales a una nueva medida de
distorsión.
✮ Extensión del modelo para la representa ión de imágenes en olor.
✮ Extensión de la medida de distorsión a imágenes en olor.
✮ Extender el uso de modelos de representa ión omo el aquí desarrollado a la
resolu ión de otras problemáti as en el ámbito del pro esamiento de imágenes
digitales, tales omo:
✬ Dete ión de aristas.
✬ Puesta en orresponden ia de imágenes estéreo.
✬ Dete ión de objetos en imágenes en movimiento.
✬ Cara teriza ión de formas.
✬ Dis rimina ión de texturas.
✬ Real e de imágenes y elimina ión de ruido.
✬ Fusión de imágenes infrarrojas para mejorar la visibilidad de objetos.
✮ Desarrollo de me anismos de ompresión de imágenes basados en los modelos
de representa ión per eptuales omo el aquí desarrollado.
Apéndi e A
Nota ión
La nota ión usada a lo largo de la Tesis es la siguiente:
✮ Las letras x e y se usan para ha er referen ia a posi iones en el dominio espa ial
de una imagen.
✮ Las letras u y v se usan para ha er referen ia a posi iones en el dominio fre-
uen ial de una imagen.
✮ Las variables N y M se usan para ha er referen ia al tamaño de la imagen, en
píxeles, horizontal y verti al respe tivamente.
✮ El símbolo denota el operador de onvolu ión de dos imágenes.
✮ La fun ión FFT (f(x; y)) es la Transformada de Fourier Dire ta dis reta de
f(x; y) de�nida omo
F (u; v) = FFT (f(x; y)) =
1
M �N
N�1
X
x=0
M�1
X
y=0
f (x; y) exp
�
�2�i
�
ux
N
+
vy
M
��
✮ La fun ión FFT
�1
(F (u; v)) es la Transformada de Fourier Inversa dis reta de
F (u; v).
✮ Cuando hablamos de medir la distorsión entre una imagen de referen ia y una
imagen test, notaremos a la imagen test on el símbolob. Por ejemplo, si f(x; y)
es la imagen de referen ia, enton es
b
f(x; y) será la imagen test.
✮ La re onstru ión de una imagen se notará one. Por ejemplo, si f(x; y) es la
imagen original, notaremos omo
e
f(x; y) a la re onstru ión de di ha imagen
(las re onstru iones se ha en on el método detallado en el apítulo 5).
131
132 Apéndice A. Notación
Apéndi e B
Fun iones gaussianas y Gabor
B.1 Fun iones gaussianas
Los parámetros que de�nen una fun ión gaussiana son los siguientes (ver Graham
[43℄ para más detalles):
Parámetro Signi� ado
x, y Coordenadas espa iales
�
x
Es ala horizontal
�
y
Es ala verti al
� Ángulo (en radianes)
x
0
, y
0
Desplazamiento de la gaussiana respe to al origen de oordenadas
Las es alas horizontal y verti al �jan la amplitud de la fun ión gaussiana de
forma que si denominamos W al diámetro de la gaussiana a media altura, enton es
obtenemos la es ala � de la igualdad W = 2
p
2 ln 2�.
La fun ión gaussiana tridimensional se onstruye a partir de dos fun iones gaus-
sianas bidimensionales tal omo se ve en el ejemplo de la �gura B.1. La expresión
fun ional de la fun ión es la siguiente:
gauss (x; y; �
x
; �
y
; �; x
0
; y
0
) =
1
2��
x
�
y
g
1
(x; y; �
x
; �; x
0
; y
0
) g
2
(x; y; �
y
; �; x
0
; y
0
)
(B.1)
133
134 Apéndice B. Funciones gaussianas y Gabor
-10-5
05
10 -10
-5
0
5
10
0
1
-10-5
05
10 -10
-5
0
5
10
0
*
-10-5
05
10 -10
-5
0
5
10
0
1
PSfrag repla ements
g
1
(x; y; 1; 0:3; 0; 0) g
2
(x; y; 2:5; 0:3; 0; 0)
gauss (x; y; 2:5; 1; 0:3; 0; 0)
Figura B.1: Obten ión de una gaussiana 3D on orienta ión a partir de dos gaussianas 2D
orientadas.
g
1
(x; y; �; �; x
0
; y
0
) = exp
0
B
�
�2:77
((x� x
0
) os � + (y � y
0
) sin �)
2
�
2�
p
2 lg (2)
�
2
1
C
A
(B.2)
g
2
(x; y; �; �; x
0
; y
0
) = exp
0
B
�
�2:77
(� (x� x
0
) sin � + (y � y
0
) os �)
2
�
2�
p
2 lg (2)
�
2
1
C
A
(B.3)
En la �gura B.2 se pueden ver algunos ejemplos de gaussianas variando los valores
que pueden tomar sus parámetros.
B.2 Fun iones de Gabor
Una fun ión de Gabor se onstruye modulando una fun ión gaussiana (e ua ión B.1)
on otra fun ión de tipo sinusoidal (seno o oseno). Los parámetros que permiten
B.2. Funciones de Gabor 135
(A) (B) (C) (D) (E)
PSfrag repla ements
�
�
x
0
y
0
�
x
�
x
�
x
�
y
�
y
�
y
� = 0
�
x
= �
y
= 10
x
0
= y
0
= 0
� = 0
�
x
= 6, �
y
= 12
x
0
= y
0
= 0
� = 0
�
x
= 12, �
y
= 6
x
0
= y
0
= 0
� = 0:6
�
x
= 6, �
y
= 12
x
0
= y
0
= 0
� = 0:6
�
x
= 6, �
y
= 12
x
0
= 16, y
0
= 10
Figura B.2: Muestra de fun iones gaussianas on diferentes parámetros.
de�nir una fun ión de Gabor son los siguientes (ver Graham [43℄ para más detalles):
Parámetro Signi� ado
x, y Coordenadas espa iales
�
x
Es ala horizontal
�
y
Es ala verti al
�
g
Ángulo de la gaussiana (en radianes)
�
m
Ángulo de la fun ión moduladora (en radianes)
� Fre uen ia radial
x
0
, y
0
Desplazamiento del entro de la fun ión respe to al origen
�
x
, �
y
Centro del �ltro paso banda en el dominio fre uen ial
N , M Tamaño de la imagen en píxeles horizontales y verti ales
donde �
x
= � os �
m
y �
y
= � sin �
m
es el entro del �ltro paso banda en el
dominio fre uen ial.
La e ua ión que de�ne el �ltro de Gabor omplejo es la siguiente:
gabor (x; y; �
x
; �
y
; �
g
; �
m
; �; x
0
; y
0
) = gauss (x; y; �
x
; �
y
; �
g
; x
0
; y
0
) gb
mod
(x; y; �
x
; �
y
; x
0
; y
0
)
(B.4)
donde gb
mod
(x; y; �
x
; �
y
; x
0
; y
0
) es la fun ión ompleja que modula la gaussiana
on la fre uen ia y orienta ión deseadas:
136 Apéndice B. Funciones gaussianas y Gabor
gb
mod
(x; y; �
x
; �
y
; x
0
; y
0
) = os (gb
a
(x; y; �
x
; �
y
; x
0
; y
0
) + i sin (gb
a
(x; y; �
x
; �
y
; x
0
; y
0
)))
(B.5)
o en su expresión exponen ial:
gb
mod
(x; y; �
x
; �
y
; x
0
; y
0
) = exp (i gb
a
(x; y; �
x
; �
y
; x
0
; y
0
)) (B.6)
y donde:
gb
a
(x; y; �
x
; �
y
; x
0
; y
0
) =
�
x
� (x� x
0
)
N
2
+
�
y
�(y � y
0
)
M
2
(B.7)
Bibliografía
[1℄ A. J. Ahumada Jr and B. L. Beard. Obje t dete tion in a noisy s ene. In
B. Rogowitz and J. Alleba h, editors, Human Vision and Digital Display VII,
volume 2657. SPIE, 1996.
[2℄ A. J. Ahumada Jr, A. M. Rohaly, and A. B. Watson. Image dis rimination
models predi t obje t dete tion in natural ba kgrounds. Investigative Ophtal-
mology and Visual S ien e, 36(4), 1995.
[3℄ A. N. Akansu and R. A. Haddad. Multiresolution signal de omposition: Trans-
forms, Subbands and Wavelets. A ademi Press, San Diego, 1992.
[4℄ B. W. Andrews and D. A. Pollen. Relationship between spatial frequen y
sele tivity and re eptive �eld pro�le of simple ell. J. Physiol., 287:163�176,
1979.
[5℄ A. J. Ati k and A. N. Redli h. Mathemati al model of the simple ells in the
visual ortex. Biologi al Cyberneti s, 63:99�109, 1990.
[6℄ J. Babaud, A. P. Witkin, M. Baudin, and R. O. Duda. Uniqueness of the
gaussian kernel for s ale-spa e �ltering. IEEE Trans. on Pattern Analysis and
Ma hine Intelligen e, 8:26�32, 1986.
[7℄ H. B. Barlow. Single units and sensation: a neuron do trine for per eptual
psy hology. Per eption, 1:371�394, 1972.
[8℄ H. B. Barlow. The past, present and future of feature dete tors. In D. In Al-
bre ht, editor, Re ognition of Pattern and Form. Le tures Notes in Biomathe-
mati s, volume 44, pages 4�32. Springer, Berlin, 1979.
[9℄ P. G. J. Barten. Evaluation of subje tive image quality with the square-root
integral method. J. Opt. So . Am. A, 7(10):2024�2030, 1990.
137
138 Bibliografía
[10℄ C. Blakemore and F. W. Campbell. On the existen e of neurones in the human
visual system sele tively sensitive to the orientation and size of retinal image.
Journal of Physiology, 203:237�260, 1969.
[11℄ Z. L. Budrikis. Visual �delity riterion and modeling. IEEE Pro ., 60(7):771�
779, 1972.
[12℄ F. W. Campbell, G. F. Cooper, and C. Enroth-Cugell. The spatial sele tivity
of the visual ells of the at. Journal of Physiology, 203:223�235, 1969.
[13℄ F. W. Campbell, G. F. Cooper, J. G. Robson, and M. B. Sa hs. The spatial
sele tivity of visual ells of at and the squirrel monkey. Journal of Physiology,
204:120, 1969.
[14℄ F. W. Campbell and J. G. Robson. Appli ation of fourier analysis to the
visibility of gratings. Journal of Physiology, 197:551�566, 1967.
[15℄ J. W. Carl. Quantitative �delity riterion for image pro essing appli ations.
SPIE Pro ., 858:2�8, 1987.
[16℄ A. C. Copeland and M. M. Trivedi. Signature strength metri s for amou-
�aged targets orresponding to human per eptual ues. Opti al Engineering,
37(2):582�591, 1998.
[17℄ A. C. Copeland, M. M. Trivedi, and James R. M Manamey. Evaluation of ima-
ge metri s for target dis rimination using psy hophysi al experiments. Opti al
Engineering, 35(6):1714�1722, 1996.
[18℄ F. D'Astous. Textural Feature Extra tion in the Spatial Frequen y Domain.
PhD thesis, Dept. of Systems Design Engineering, University of Waterloo, On-
tario, Canada, 1984.
[19℄ J. G. Daugman. Two-dimensional spe tral analysis of orti al re eptive �eld
pro�les. Vision Resear h, 20:847�856, 1980.
[20℄ J. G. Daugman. Un ertainty relation for resolution in spa e, spatial, frequen y,
and orientation optimized by two-dimensional visual orti al �lters. J. Opt.
So . Am. A, 2(7):1160�1169, 1985.
[21℄ J. G. Daugman. Complete dis rete 2-d gabor transforms by neural networks
for image analysis and ompression. IEEE Trans. A oust. Spee h Signal Pro .,
36:1169�1179, 1988.
Bibliografía 139
[22℄ R. L. De Valois, D. G. Albre ht, and L. G. Thorell. Spatial frequen y sele tivity
of ells in ma aque visual ortex. Vision Resear h, 22:545�559, 1982a.
[23℄ R. L. De Valois, E. W. Yund, and N. Hepler. The orientation and dire tion
sele tivity of ells in ma aque visual ortex. Vision Resear h, 22:531�544,
1982b.
[24℄ T. Ebrahimi and M. Kunt. Image ompression by gabor expansion. Opti al
Engineering, 30(7):873�880, 1991.
[25℄ F. L. Engel. Visual onspi uity. dire ted attention and retinal lo us. Vision
Resear h, 11:563�575, 1971.
[26℄ F. L. Engel. Visual onspi uity and sele tive ba kground interferen e in e en-
tri vision. Vision Resear h, 14:459�471, 1974.
[27℄ F. L. Engel. Visual onspi uity, visual sear h and �xation tenden ies of the
eye. Vision Resear h, 17:95�100, 1977.
[28℄ C. Enroth-Cugell and J. G. Robson. The ontrast sensitivity of retinal ganglion
ells of the at. Journal of Physiology, 187:517, 1966.
[29℄ O. D. Faugeras. Digital olor image pro essing within the frame work of a
human visual model. IEEE Trans. A oust., Spee h, Signal Pro essing, 27:380�
393, 1979.
[30℄ J. Fdez-Valdivia, J. A. Gar ía, J. Martínez-Baena, and Xose R. Fdez-Vidal. The
sele tion of natural s ales in 2d images using adaptive gabor �ltering. IEEE
Trans. on Pattern Analysis and Ma hine Intelligen e, 20(5):458�469, 1998.
[31℄ Xose R. Fdez-Vidal, J. A. Gar ía, and J. Fdez-Valdivia. Using models of
feature per eption in distortion measure guidan e. Pattern Re ognition Letters,
19(1):77�88, 1998.
[32℄ D. J. Field. S ale-invarian e and self-similar wavelet transforms: An analysis
of natural s enes and mammalian visual systems. In M. In Farge, J. Hunt,
and T. Vassili os, editors, Wavelets, Fra tals and Fourier Transforms: New
developments and new appli ations, pages 151�193. Oxford University Press,
1993.
[33℄ L. M. J. Flora k, B. M. ter Haar Romeny, J. J. Koenderink, and M. A. Vier-
gever. S ale and the di�erential stru ture of images. Image and Vision Com-
puting, 10(6):376�388, 1992.
140 Bibliografía
[34℄ I. Fogel and D. Sagi. Gabor �lters as texture dis riminator. Biologi al Cyber-
neti s, 61:103�113, 1989.
[35℄ K. H. Foster, J. P. Gaska, S. Mar elja, and D. A. Pollen. Phase relationships
between adja ent simple ells in the visual ortex. ii. 180 deg. phase shifts.
Journal of Physiology, 1983.
[36℄ D. Gabor. Theory of ommuni ation. J. Inst. Ele tr. Eng., 93:429�457, 1946.
[37℄ J. A. Gar ía, J. Fdez-Valdivia, and A. Garrido. A s ale-ve tor approa h for
edge dete tion. Pattern Re ognition Letters, 16:637�646, 1995.
[38℄ M. Gar ía-Silvente, J. A. Gar ía, and Fdez-Valdivia J. The novel s ale-
spe trum spa e for representing gray-level shape. Pattern Re ognition,
30(3):367�382, 1997.
[39℄ W. S. Geisler and K. L. Chou. Separation of low-level and high-level fa tors
in omplex tasks: visual sear h. Psy hol. Rev., 102:356�378, 1995.
[40℄ M. A. Georgeson and G. D. Sullivan. Contrast onstan y: deblurring in human
vision by spatial frequen y hannels. Journal of Physiology, 252:627�656, 1975.
[41℄ A. P. Ginsburg. Psy hologi al orrelates of a model of the human system.
In Pro . 1971 Nat. Aerospa e Ele troni s Conf., pages 283�290. IEEE Trans.
Aerospa e Ele troni Systems, 1971.
[42℄ B. E. Goldstein. Sensation & Per eption. Brooks/Cole, 4th edition, 1996.
[43℄ N. Graham. Visual pattern analyzers. Oxford University Press, 1989.
[44℄ N. Graham and J.Ña hmias. Dete tion of grating patterns ontaining two spa-
tial frequen ies: A omparison of single- hannel and multiple- hannel models.
Vision Resear h, 11:251�259, 1971.
[45℄ F. C. A. Groen, I. T. Young, and G. Ligthart. A omparison of di�erent fo us
fun tions for use in autofo us algorithms. Cytometry, 6:81�91, 1985.
[46℄ M. J. Hawken and A. J. Parker. Spatial properties of neurons in the monkey
striate ortex. Pro . R. So . Lon. B, 231:251�288, 1987.
[47℄ G. A. Hay and M. S. Chesters. Signal-transfer fun tions in threshold and
suprathreshold vision. J. Opt. So . Am., 62:990�998, 1972.
Bibliografía 141
[48℄ G. A. Hay and M. S. Chesters. A model of visual threshold dete tion. J. Theor.
Biol., 67:221�240, 1977.
[49℄ D. H. Hubel and T. N. Wiesel. Re eptive �elds of single neurons in the at's
striate ortex. Journal of Physiology, 148:574�591, 1959.
[50℄ D. H. Hubel and T. N. Wiesel. Re eptive �elds, bino ular intera tion and fun -
tional ar hite ture in the at's visual ortex. Journal of Physiology, 160:106�
154, 1962.
[51℄ D. H. Hubel and T. N. Wiesel. Re eptive �elds and fun tional ar hite ture in
two non-striate visual areas (18 and 19) of the at. Journal of Neurophysiology,
28:229�289, 1965.
[52℄ B. R. Hunt and G. F. Sera. Power-law stimulus-response models for measures
of image quality in nonperforman e environments. IEEE Trans. on systems,
man and yberneti s, 8(11):781�791, 1978.
[53℄ A. K. Jain. Fundamentals of Digital Image Pro essing. Prenti e-Hall, Engle-
wood Cli�s, NJ, 1989.
[54℄ A. K. Jain and R. C. Dubes. Algorithms for lustering data. Prenti e-Hall,
Englewood Cli�s, NJ, 1988.
[55℄ M. E. Jernigan and F. D'Astous. Entropy-based texture analysis in the spatial
frequen y domain. IEEE Trans. on Pattern Analysis and Ma hine Intelligen e,
6:237�243, 1984.
[56℄ J. P. Jones and L. A. Palmer. An evaluation of the two-dimensional gabor
�lter model of simple re eptive �elds in at striate ortex. Journal of Neurop-
hysiology, 58:1233�1258, 1987.
[57℄ M. Kabrisky. A proposed model for visual information pro essing in the human
brain. Illinois University Press, Urbana, 1966.
[58℄ S. A. Karunasekera and N. G. Kingsbury. A distortion measure for blo king
artifa ts in images based on human visual sensitivity. IEEE Trans. on Image
Pro essing, 4:713�724, 1995.
[59℄ S. A. Klein and B. Beutter. Minimizing and maximizing the joint spa e-spatial
frequen y un ertainty of gabor-like fun tions: omment. J. Opt. So . Am. A,
9(2):337�340, 1992. JOSA Communi ations.
142 Bibliografía
[60℄ J. J. Koenderink. The stru ture of images. Biologi al Cyberneti s, 50:363�370,
1984.
[61℄ J. J. Koenderink and A. J. van Doorn. Re eptive �eld families. Biologi al
Cyberneti s, 63:291�297, 1990.
[62℄ J. Kominek. Still image ompression an issue of qua-
lity. Available from University of Waterloo, Water-
loo, Ontario, Canada, Department of Computer S ien e.
http://links.uwaterloo. a/pub/Fra tals/Papers/Waterloo/kominek94b.ps.gz,
ele troni edition, 1994.
[63℄ E. S. Krendel and J. Wodinsky. Visual sear h in a unstru tured visual �eld.
J. Opt. So . Am., 50:562�568, 1960.
[64℄ A. Law and W. Kelton. Simulation models and analysis. M Graw-Hill, 2
edition, 1991.
[65℄ A. Leger, T. Oma hi, and G. K. Walla e. The jpeg still pi ture ompression
algorithm. Opti al Engineering, 30(7):947�954, 1991.
[66℄ J. O. Limb. Distortion riteria of the human viewer. IEEE Trans. on systems,
man and yberneti s, 9(12):778�793, 1979.
[67℄ T. Lindeberg. Dete ting salient blob-like image stru tures and their s ales with
a s ale-spa e primal sket h: A method for fo us-of-attention. IJCV, 11:283�
318, 1993.
[68℄ Y. Lu and R. C. Jain. Reasoning about edges in s ale spa e. IEEE Trans. on
Pattern Analysis and Ma hine Intelligen e, 14(4):450�467, 1992.
[69℄ L. Ma�ei and A. Fiorentini. The visual ortex as a spatial frequen y analyser.
Vision Resear h, 13:1255�1267, 1973.
[70℄ J. Malik and P. Perona. Preattentive texture dis rimination with early vision
me hanisms. J. Opt. So . Am. A, 7(5):923�932, 1990.
[71℄ R. J. W. Mans�eld. Neural basis of orientation per eption in primate vision.
S ien e, 186:1133�1135, 1974.
[72℄ R. J. W. Mans�eld and S. F. Ronner. Orientation anisotropy in monkey visual
ortex. Brain Res., 149:229�234, 1978.
Bibliografía 143
[73℄ S. Mar elja. Mathemati al des ription of the responses of the simple orti al
ells. J. Opt. So . Am., 70(11):1297�1399, 1980.
[74℄ E. Marg, J. E. Adams, and B. Rutkin. Experientia, 24:348, 1968.
[75℄ H. Marmolin. Subjetive mse measures. IEEE Trans. on Systems, man and
yberneti s, 16(3):486�489, 1986.
[76℄ D. Marr. Vision. Freeman, San Fran is o, California, 1982.
[77℄ J. Martínez-Baena, J. Fdez-Valdivia, and J. A. Gar ía. A multi hannel au-
tofo using s heme for gray-level shape s ale sele tion. Pattern Re ognition,
30(10):1769�1786, 1997.
[78℄ J. Martínez-Baena, J. Fdez-Valdivia, and J. A. Gar ía. Per eptual distor-
tion riteria based on human visual model. In IS&T/OSA Opti s & Imaging
in the Information Age, pages 348�353, Ro hester, New York (USA), 1997.
IS&T/OSA.
[79℄ J. Martínez-Baena, J. Fdez-Valdivia, J. A. Gar ía, and Xose R. Fdez-Vidal. A
new image distortion measure based on a data-driven multisensor organization.
Pattern Re ognition, 31(8):1099�1116, 1998.
[80℄ J. Martínez-Baena, J. A. Gar ía, and J. Fdez-Valdivia. On the sele tion of
signi� ant s ales for gray-level shape. In Pro eedings IPMU '96, volume III,
pages 1519�1524, Granada (Spain), 1996.
[81℄ J. Martínez-Baena, J. A. Gar ía, J. Fdez-Valdivia, and J. Chamorro. De-
veloping per eptual distortion measures using visual per eption models. In
A. Sanfeliu, J.J. Villanueva, and J. Vitrià, editors, Pattern Re ognition and
Image Analysis. VII National Simposium on PR & IA, volume 1, pages 275�
280, Bar elona (Spain), 1997. AERFAI, Centre de Visió per Computador. Uni-
versitat Autònoma de Bar elona.
[82℄ J. Martínez-Baena, J. A. Gar ía, J. Fdez-Valdivia, and R. Rodríguez-Sán hez.
S ale sele tion using three di�erent representations for images. Pattern Re og-
nition Letters, 18(14):1453�1467, 1997.
[83℄ J. Martínez-Baena, Alexander Toet, Xose R. Fdez-Vidal, A. Garrido, and
R. Rodríguez-Sán hez. A omputational visual distin tness metri . Opti al
Engineering, 37(7):1995�2005, 1998.
144 Bibliografía
[84℄ F. Mokhtarian and A. Ma kworth. S ale-based des ription and re ognition of
planar urves and two-dimensional shapes. IEEE Trans. on Pattern Analysis
and Ma hine Intelligen e, 8(1):34�43, 1986.
[85℄ M. C. Morrone and D. C. Burr. Feature dete tion in human vision: A phase-
dependent energy model. Pro . R. So . Lond. B, 235:221�245, 1988.
[86℄ J. A. Movshon. Two-dimensional spatial frequen y tuning of at striate orti al
neurons. So . Neuros i., 5:799, 1979.
[87℄ J. A. Movshon and D. J. Tolhurst. On the response linearity of neurones in
at visual ortex. Pro eedings of the Physiologi al So iety, 249:56�57, 1975.
[88℄ R. Navarro and A. Tabernero. Multidim. Sys. Signal Pro ess, 2:421, 1991.
[89℄ N. B. Nill and B. H. Bouzas. Obje tive image quality measure derived from
digital image power spe tra. Opti al Engineering, 31(4):813�825, 1992.
[90℄ A. Pantle and R. Sekular. Size-dete ting me hanisms in human vision. S ien e,
162:1146�1148, 1968.
[91℄ A. Parker and M. J. Hawken. Two-dimensional spatial stru ture of re eptive
�elds in monkey striate ortex. J. Opt. So . Am. A, 5:598�605, 1988.
[92℄ W. A. Pearlman. A visual system model and a new distortion measure in the
ontext of image pro essing. J. Opt. So . Am., 68(3):374�385, 1978.
[93℄ G. F. Poggio. Handbook of medi al physiology, volume 2. Mosby, St. Louis, 12
edition, 1968.
[94℄ D. A. Pollen and S. F. Ronner. Visual orti al neurons as lo alized spatial
frequen y �lters. IEEE Trans. on Systems, Man and Cyberneti s, 13(5):907�
916, 1983.
[95℄ D. A. Pollen and J. H. Taylor. The striate ortex and the spatial analisys of
visual spa e. In The neuros ien es, third study program, pages 239�247. MIT
Press, Cambridge, Massa husetts, 1974.
[96℄ W. H. Press, S. A. Teukolsky, W. T. Vetterling, and B. P. Flannery. Numeri al
re ipes in C. The art of s ienti� omputing. Cambridge University Press, 2
edition, 1992.
Bibliografía 145
[97℄ C. R. Rao. Linear Statisti al Inferen e and Its Appli ations. Wiley, New York,
1973.
[98℄ A. M. Rohaly, A. J. Ahumada Jr, and A. B. Watson. Obje t dete tion in natu-
ral ba kgrounds predi ted by dis rimination performan e and models. Vision
Resear h, 37(23):3225�3235, 1997.
[99℄ A. Rosenfeld and M. Thurston. Edge and urve dete tion for visual s ene
analysis. IEEE Trans. on Computing, 20:559�562, 1971.
[100℄ S. R. Rotman, E. S. Gordon, and M. L. Kowal zyk. Modeling human sear h
and target a quisition performan e: I. �rst dete tion probability in a realisti
multitarget s enario. Opti al Engineering, 28(11):1216�1222, 1989.
[101℄ M. B. Sa hs, J. Na hmias, and J. G. Robson. Spatial-frequen y hannels in
human vision. J. Opt. So . Am., 61:1176�1186, 1971.
[102℄ J. A. Saghri, P. S. Cheatham, and A. Habibi. Image quality measure based on
a human visual system model. Opti al Engineering, 28(7):813�818, 1989.
[103℄ D. J. Sakrison. On the role of the observer and a distortion measure in image
transmission. IEEE Trans. on ommuni ations, 25(11):1251�1267, 1977.
[104℄ S. Z. Selim and M. A. Ismail. K-means-type algorithms: a generalized on-
vergen e theorem and hara terization of lo al optimality. IEEE Trans. on
Pattern Analysis and Ma hine Intelligen e, 6:81�87, 1984.
[105℄ C. E. Shannon. The mathemati al theory of ommuni ation. Bell. Syst. Te h.
J., 27:379�423, 1948.
[106℄ C. E. Shannon and W. Weaver. The mathemati al theory of ommuni ation.
University of Illinois, Urbana, 1949.
[107℄ R. Shapley and V. H. Perry. Cat and monkey retinal ganglion ells and their
fun tional roles. Trends in Neuros ien e, 9:229�235, 1986.
[108℄ M. V. Shirvaikar and M. M. Trivedi. Developing texture-based image lutter
measures for obje t dete tion. Opti al Engineering, 31(12):2628�2639, 1992.
[109℄ D. G. Stork and H. R. Wilson. Do gabor provide appropiate des riptions of
visual orti al re eptive �elds? J. Opt. So . Am. A, 7(8):1362�1373, 1990.
146 Bibliografía
[110℄ A. Sutter, J. Be k, and N. Graham. Contrast and spatial variables in texture
segregation: Testing a simple spatial-frequen y hannels model. Per eption &
Psy hophysi s, 46(4):312�332, 1989.
[111℄ J. P. Thomas and J. Gille. Bandwidths of orientation hannels in human vision.
J. Opt. So . Am., 69(5):652�660, 1979.
[112℄ A. Toet. Computing visual target distin tness. Te hni al Report TM-97-A039,
TNO Human Fa tors Resear h Institute, Soesterberg, The Netherlands, 1997.
[113℄ A. Toet. Image data set for testing sear h and dete tion models. Te hni al
Report TM-97-A036, TNO Human Fa tors Resear h Institute, Soesterberg,
The Netherlands, 1997.
[114℄ A. Toet, F. L. Kooi, P. Bijl, and J. M. Valeton. Visual onspi uity determines
human target a quisition performan e. Opti al Engineering, 37(7):1969�1975,
1998.
[115℄ P. Tynan and R. Sekular. Per eived spatial frequen y varies with stimulus
variation. J. Opt. So . Am., 64:1251�1255, 1974.
[116℄ G. Waldman, J. Wootton, and G. Hobson. Visual dete tion with sear h: an
empiri al model. IEEE Trans. on Systems, Man and Cyberneti s, 21(3):596�
606, 1991.
[117℄ G. R. Walla e. The jpeg still pi ture ompression standard. Communi ations
of the ACM, 34:30�44, 1991.
[118℄ B. A. Wandell. Foundations of vision. Sinauer Asso iates In . Publishers,
Sunderland, MA, 1995.
[119℄ A. B. Watson. The ortex transform: Rapid omputation of simulated neural
images. Computer Vision, Graphi s and Image Pro essing, 39:311�327, 1987.
[120℄ A. B. Watson. E� ien y of a model human image ode. J. Opt. So . Am. A,
4(12):2401�2417, 1987.
[121℄ R. J. Watt. Issues in shape per eption. Image and Vision Computing,
11(6):389�394, 1993.
[122℄ M. A. Webster and R. L. De Valois. Relationship between spatial-frequen y
and orientation tuning of striate- ortex ells. J. Opt. So . Am. A, 2(7):1124�
1132, 1985.
Bibliografía 147
[123℄ A. H. Wertheim. A quantitative onspi uity index; theoreti al foundation and
experimental validation of a measurement pro edure. Te hni al Report C-20,
TNO Human Fa tors Resear h Institute, Soesterberg, The Netherlands, 1989.
[124℄ A. P. Witkin. S ale-spa e �ltering. In Pro . of the 8th Int. Joint Conf. on
Arti� ial Intelligen e, volume 2, pages 108�111, 1983.
[125℄ T. T. E. Yeo, S. H. Ong, Jayasooriah, and R. Sinniah. Autofo using for tissue
mi ros opy. Image and Vision Computing, 11(10):629�639, 1993.
[126℄ R. A. Young. The gaussian derivative model for spatial vision: I. retinal me-
hanisms. Spatial Vision, 2:273�293, 1987.
[127℄ A. L. Yuille and T. A. Poggio. S aling theorems for zero- rossings. IEEE
Trans. on Pattern Analysis and Ma hine Intelligen e, 8:15�25, 1986.
148 Bibliografía
Índi e de Materias
An ho de banda, 12
Antialiasing, 13, 14
Autoenfoque, 33
Baston, 2
Brenner, 34, 35, 40, 49, 56, 59
Campo re eptivo, 4, 6, 10, 21, 25, 91
Canal, 7, 13, 21, 34, 89, 91
Canal orti al, 23, 26
Cluster, 111, 113
Clustering, 17
Compresion, 115, 122, 124
Cono, 2
Conspi uidad, 124
Contraste, 8
Cortex visual, 1
CSF, 89
Distinguibilidad, 102, 107
Distorsion, 90
Doyle, 103
Enfoque, 10, 33, 36, 58
Es ala, 31�35, 40, 47, 56, 70, 91, 133,
135
Es ala externa, 40
Es ala global, 6, 31, 57
Es ala interna, 40
Es ala lo al, 6, 73, 74
Fa tor de alidad, 116, 117
Fotore eptor, 2, 89
Fourier, 8
Fovea, 2
Gabor, 9, 11, 21�23, 25, 27, 28, 40, 57,
70, 75, 134
Gausiana, 133
Gaussiana, 58
Gradiente uadrati o, 34, 36, 49, 56
In ertidumbre, 22
Inhibi ión lateral, 11
JPEG, 115, 116, 124, 127
Kolmogorov-Smirnov, 114
Mapa de energia, 75, 76
Masking, 94
Medida de distorsion, 6, 85, 90, 91
MSE, 87
Multi anal, 8, 56
Multies ala, 31
Nervio opti o, 3
Nota ion, 6
Ojo, 1
Orienta ion, 7, 8, 10, 12
Parti ion, 11, 14, 15, 19
Per eptual, 7, 85, 89, 124
Pixelado, 98
149
150 Índice de Materias
Probabilidad de dete ion, 111
Punto iego, 2
Punto de interes, 75�77
Re ti� a ion de media onda, 23, 25
Retina, 1, 2
RMSE, 87, 94, 95, 98, 102, 111, 117
Roseta, 8
Ruido, 37, 51, 58, 94, 95
Sensor, 10, 14, 15, 19, 75, 90
Sensor a tivo, 10, 15, 17, 91
SNR, 88
Sobel, 36
SVH, 1, 4, 5, 7, 10, 85, 89
Tenengrad, 34, 36, 49, 56
Transformada del ortex, 9, 21
Varianza, 34, 35, 49, 56, 59
Visibilidad, 103
Zona ex itatoria, 11, 21
Zona inhibitoria, 11, 21