Departamento de Ciencias de la Computación e I.A | Universidad de … · 2013. 12. 12. · ol...

UNIVERSIDAD DE GRANADA

E.T.S. DE INGENIERÍA INFORMÁTICA

Departamento de Cien ias de la Computa ión

e Inteligen ia Arti� ial

Desarrollo de un modelo omputa ional de

representa ión de imágenes y su apli a ión

a la sele ión de es alas naturales y al

ál ulo de medidas de distorsión

TESIS DOCTORAL

JAVIER MARTÍNEZ BAENA

Granada, Marzo de 1999

Desarrollo de un modelo omputa ional de

representa ión de imágenes y su apli a ión

a la sele ión de es alas naturales y al

ál ulo de medidas de distorsión

MEMORIA QUE PRESENTA

Javier Martínez Baena

PARA OPTAR AL GRADO DE DOCTOR EN INFORMÁTICA

Marzo de 1999

DIRECTORES

JOSE ANTONIO JOAQUÍN

GARCÍA SORIA FERNÁNDEZ VALDIVIA

DEPARTAMENTO DE CIENCIAS DE LA COMPUTACIÓN

E INTELIGENCIA ARTIFICIAL

E.T.S. de Ingeniería Informáti a Universidad de Granada

La memoria titulada Desarrollo de un modelo omputa ional de repre-

senta ión de imágenes y su apli a ión a la sele ión de es alas naturales

y al ál ulo de medidas de distorsión, que presenta D. Javier Martínez Baena

para optar al grado de Do tor, ha sido realizada en el Departamento de Cien ias

de la Computa ión e Inteligen ia Arti� ial de le Universidad de Granada bajo la

dire ión de los do tores D. Joaquín Fernández Valdivia y D. Jose Antonio Gar ía

Soria.

Granada, Marzo de 1999.

El Do torando: Los Dire tores:

Fdo. J. Martínez Baena Fdo. J. Fdez. Valdivia Fdo. J. A. Gar ía

AGRADECIMIENTOS

Quisiera expresar mi gratitud ha ia todos aquellos que han he ho posible el de-

sarrollo de esta Tesis, espe ialmente a los que la han estado supervisando desde que

empezó a gestarse hasta que vió la luz, a Joaquín y Jose Antonio.

Igualmente quiero dedi ar este trabajo a otros que también lo han he ho posible,

aunque de forma distinta: a mis padres y a mi hermano. A unos por soportarme

durante varios años y al otro por a� ionarme a estas osas de la té ni a. También

quiero agrade er a M

Ángeles su apoyo, que ha he ho más soportable esta tarea, que

aunque tiene sus satisfa iones también tiene sus desespera iones. Por supuesto, no

puede faltar aquí una espe ial men ión a esa entrañable (... on el tiempo) entidad,

ono ida omo El Despa ho (aunque tiene otros sinónimos), a la que tantos ratos

agradables le debo y que de vez en uando toma aires gallegos.

Finalmente, y no por ello on menos intensidad, he de agrade er la ayuda que

obtenido de todos mis ompañeros del grupo de investiga ión de Análisis de Imágenes

Digitales y sus Apli a iones y, en general, de todo el Departamento de Cien ias de

la Computa ión e Inteligen ia Arti� ial de la Universidad de Granada.

Las publi a iones [80℄, [77℄, [82℄, [78℄, [81℄, [79℄, [83℄ y [30℄ han visto la luz omo

onse uen ia de parte de la investiga ión realizada en esta Tesis Do toral.

Quiero expresar mi agrade imiento al proye to TIC97-1150 por la aporta ión de

fondos y medios materiales para la realiza ión de esta Tesis.

Ángeles,

Ángela y María

Índi e General

Agrade imientos vii

Índi e General xi

Lista de Tablas xiii

Lista de Figuras xvi

1 Introdu ión 1

1.1 El Sistema Visual Humano . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Objetivos de la memoria . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.3 Des rip ión por apítulos . . . . . . . . . . . . . . . . . . . . . . . . 5

2 Modelo de representa ión de imágenes propuesto 7

2.1 Introdu ión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.2 Parti ión del espe tro de fre uen ias . . . . . . . . . . . . . . . . . . 11

2.2.1 Sele ión de sensores a tivos . . . . . . . . . . . . . . . . . . . 15

2.3 Modeliza ión de los ampos re eptivos . . . . . . . . . . . . . . . . . 21

2.4 Resumen del modelo de representa ión propuesto . . . . . . . . . . . 28

3 Dete ión de es alas globales 31

3.1 Dete ión de es alas signi� ativas . . . . . . . . . . . . . . . . . . . . 33

3.1.1 Fun iones de enfoque . . . . . . . . . . . . . . . . . . . . . . . 33

3.1.2 Resultados experimentales . . . . . . . . . . . . . . . . . . . . 37

3.1.2.1 Imagen sintéti a . . . . . . . . . . . . . . . . . . . . 37

3.1.2.2 Imagen biomédi a . . . . . . . . . . . . . . . . . . . 42

3.1.2.3 Imagen astronómi a . . . . . . . . . . . . . . . . . . 47

3.1.3 Robustez frente al ruido . . . . . . . . . . . . . . . . . . . . . 51

3.1.4 Comentarios �nales . . . . . . . . . . . . . . . . . . . . . . . . 56

xii Índice General

3.2 Compara ión on otros métodos de autoenfoque . . . . . . . . . . . . 57

3.2.1 Autoenfoque en el dominio espa ial . . . . . . . . . . . . . . . 57

3.2.2 Autoenfoque en el dominio fre uen ial . . . . . . . . . . . . . 59

3.2.3 Compara ión de resultados . . . . . . . . . . . . . . . . . . . 59

3.3 Con lusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

4 Dete ión de es alas naturales lo ales 73

4.1 Método de dete ión de es alas lo ales . . . . . . . . . . . . . . . . . 74

4.1.1 Dete ión de puntos de interés . . . . . . . . . . . . . . . . . 75

4.1.2 Determina ión de las es alas lo ales sobre los puntos de interés 76

4.2 Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . 77

4.2.1 Imagen biomédi a . . . . . . . . . . . . . . . . . . . . . . . . 77

4.2.2 Es ena natural . . . . . . . . . . . . . . . . . . . . . . . . . . 81

5 Desarrollo de una Medida de Distorsión Per eptual 85

5.1 Medidas existentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

5.1.1 Medidas lási as no per eptuales . . . . . . . . . . . . . . . . 87

5.1.2 Medidas per eptuales . . . . . . . . . . . . . . . . . . . . . . 89

5.2 Medida de distorsión per eptual . . . . . . . . . . . . . . . . . . . . . 90

5.3 Experimento de enmas aramiento . . . . . . . . . . . . . . . . . . . . 94

5.4 Efe to de pixelado . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

5.5 Distinguibilidad de objetos . . . . . . . . . . . . . . . . . . . . . . . . 102

5.5.1 Ordena ión de imágenes en base a la visibilidad de objetos

presentes en ellas . . . . . . . . . . . . . . . . . . . . . . . . . 103

5.5.2 Predi ión de la distinguibilidad visual de objetos . . . . . . . 107

5.5.3 Ordena ión de imágenes de la base de datos del TNO HFRI . 111

5.5.4 Búsqueda visual . . . . . . . . . . . . . . . . . . . . . . . . . 115

5.6 Evalua ión de la alidad de imágenes omprimidas . . . . . . . . . . 115

5.6.1 Rela ión entre la medida de distorsión d

y el fa tor de alidad

de ompresión . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

5.6.2 Experimento 2 . . . . . . . . . . . . . . . . . . . . . . . . . . 122

5.6.3 Rela ión entre la alidad visual de imágenes omprimidas y la

onspi uidad visual . . . . . . . . . . . . . . . . . . . . . . . . 124

Con lusiones y líneas futuras 129

A Nota ión 131

Índice General xiii

B Fun iones gaussianas y Gabor 133

B.1 Fun iones gaussianas . . . . . . . . . . . . . . . . . . . . . . . . . . . 133

B.2 Fun iones de Gabor . . . . . . . . . . . . . . . . . . . . . . . . . . . 134

Bibliografía 137

Índi e de Materias 149

xiv Índice General

Índi e de Tablas

2.1 Campos re eptivos y respuestas de las élulas de un anal orti al. . 25

3.1 Parámetros de los sensores a tivos de la imagen sintéti a. . . . . . . 38

3.2 Es alas signi� ativas dete tadas por ada uno de los riterios estudia-

dos para los sensores a tivos de la imagen sintéti a. . . . . . . . . . . 38

3.3 Parámetros de los sensores a tivos de la imagen biomédi a de la �gura

3.5. Para ada sensor S (�las) se muestra la fre uen ia radial mínima

, la fre uen ia radial máxima S

, el ángulo mínimo S

el ángulo máximo S

. Las fre uen ias se dan en i los por pixel

( pp) y los ángulos en grados. . . . . . . . . . . . . . . . . . . . . . . 43

3.4 Es alas de la imagen biomédi a obtenidas para ada sensor y on los

uatro riterios de enfoque. . . . . . . . . . . . . . . . . . . . . . . . 43

3.5 Parámetros de los sensores a tivos de la imagen astronómi a. . . . . 47

3.6 Es alas signi� ativas dete tadas por ada uno de los riterios estudia-

dos para los sensores a tivos de la imagen astronómi a. . . . . . . . . 49

3.7 Es alas signi� ativas de la imagen sintéti a obtenidas por los tres mé-

todos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

3.8 Parámetros de los sensores a tivos de la imagen natural. Las tres

últimas olumnas muestran las es alas obtenidas por ada uno de los

métodos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

4.1 Parámetros de los sensores a tivos dete tados para la imagen biomé-

di a junto on la es ala global de ada uno de ellos. . . . . . . . . . . 79

4.2 Parámetros de los sensores a tivos de la es ena natural junto on las

es alas dete tadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

5.1 Valores de RMSE y d

entre la imagen original y ada una de las

imágenes on ruido uniforme de la �gura 5.3. . . . . . . . . . . . . . 95

xvi Índice de Tablas

5.2 Valores de RMSE y d

entre la imagen original y ada una de las

imágenes on ruido no uniforme de la �gura 5.4. . . . . . . . . . . . . 95

5.3 Valores de las medidas de distorsión entre la imagen original (Einstein)

y las imágenes pixeladas. . . . . . . . . . . . . . . . . . . . . . . . . . 100

5.4 Valores de las medidas de distorsión entre la imagen original (es ena

de los bar os) y las imágenes pixeladas. . . . . . . . . . . . . . . . . 100

5.5 Valores de las medidas de distorsión y ordena iones para las parejas

de imágenes de la �gura 5.10. . . . . . . . . . . . . . . . . . . . . . . 107

5.6 Datos de las 17 imágenes de la base de datos del TNO HFRI. Para

ada imagen se muestra el luster al que pertene e y las tres ordena-

iones onsideradas: subjetiva, RMSE y d

. También se muestran

los valores del área que hay por debajo de la urva de probabilidad de

dete ión a umulada y de las otras dos medidas usadas. . . . . . . . 112

5.7 Tasas de error de d

y RMSE en los sub onjuntos sele ionados. . . 114

5.8 Valores de las medidas de distorsión d1 y RMSE entre la imagen ori-

ginal de la �gura 5.18 y ls misma imagen omprimida mediante el

algoritmo JPEG on fa tores de alidad (qf ) entre 1 y 99. . . . . . . 121

5.9 Valores de las medidas de distorsión entre la imagen original y las

imágenes omprimidas. . . . . . . . . . . . . . . . . . . . . . . . . . . 124

Índi e de Figuras

1.1 Corte transversal del ojo y organiza ión elular de la retina. . . . . . 2

1.2 Se ión transversal del erebro que muestra el amino que sigue la

informa ión visual. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.3 Esquema de desarrollo de la Tesis. . . . . . . . . . . . . . . . . . . . 5

2.1 Diferentes rosetas propuestas por varios autores. (A) Daugman. (B)

Ebrahimi y Kunt. (C) Watson. (D) Navarro. . . . . . . . . . . . . . 9

2.2 Per�l 3D de una fun ión de Gabor on simetría par. (A) en el dominio

espa ial y (B) en el dominio fre uen ial. . . . . . . . . . . . . . . . . 11

2.3 Parti ión del espe tro en bandas de orienta ión. Izquierda: Imagen

de referen ia. Dere ha: espe tro de la imagen suavizada a es ala 1 y

la parti ión en uatro bandas de orienta ión. . . . . . . . . . . . . . . 13

2.4 (A) Índi e de antialiasing obtenido sobre la banda B

de la imagen de

la �gura 2.3. (B) Los anales para esta banda serían ada uno de los

intervalos entre máximos y mínimos alternativos de la segunda derivada. 15

2.5 Ejemplo del ál ulo de la parti ión multisensor sobre una imagen digital. 16

2.6 Sele ión de sensores a tivos. . . . . . . . . . . . . . . . . . . . . . . 20

2.7 Modelos de ampo re eptivo propuestos por De Valois et al.. (A)

Suma de 2 gaussianas. (B) Suma de 3 gaussianas. (C) Modelo de

entro on entrado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

2.8 Per�les 3D de fun iones Gabor on diferentes simetrías y desfases. (A)

Simetría par. (B) Simetría impar. (C) Simetría par on desfase de

. (D) Simetría impar on desfase de 180

. . . . . . . . . . . . . . 24

2.9 Fila superior: per�l 2D de las respuestas orrespondientes a las 4

élulas simples que forman un anal orti al. Fila inferior: resultado

de apli ar la re ti� a ión de media onda (RMO). . . . . . . . . . . . 26

3.1 (A) Imagen sintéti a. (B) Sensores a tivos. . . . . . . . . . . . . . . 38

xviii Índice de Figuras

3.2 Fun iones de autoenfoque para los sensores de la imagen sintéti a.

En la primera olumna están las fun iones orrespondientes al riterio

de la Varianza, en la segunda las de Tenengrad, en la ter era las de

Brenner y en la uarta las del Gradiente Cuadráti o. . . . . . . . . . 39

3.3 Es alas dete tadas on el riterio de Brenner. . . . . . . . . . . . . . 41

3.4 Algunas de las es alas dete tadas on el riterio de la varianza. . . . 42

3.5 (A) Imagen biomédi a. (B) Sele ión de sensores a tivos. . . . . . . . 42

3.6 Fun iones de autoenfoque de la imagen biomédi a para los riterios

de la Varianza y Tenengrad. . . . . . . . . . . . . . . . . . . . . . . . 44

3.7 Fun iones de autoenfoque de la imagen biomédi a para los riterios

de Brenner y Gradiente uadráti o. . . . . . . . . . . . . . . . . . . . 45

3.8 Imagen biomédi a �ltrada de a uerdo a distintos sensores a tivos y

algunas de las es alas signi� ativas dete tadas. (A) Sensor S

, � = 3.

(B) Sensor S

, � = 4:5. (C) Sensor S

, � = 13. (D) Sensor S

, � = 2.

(E) Sensor S

, � = 7:5. (F) Sensor S

, � = 3:5. (G) Sensor S

, � = 9.

(H) Sensor S

, � = 3:5. (I) Sensor S

, � = 8:5. . . . . . . . . . . . . 46

3.9 (A) Imagen astronómi a. (B) Sensores a tivos. . . . . . . . . . . . . 47

3.10 Fun iones de autoenfoque para los sensores S

la imagen astronómi a. En la primera olumna están las fun iones

orrespondientes al riterio de la Varianza, en la segunda las de Te-

nengrad, en la ter era las de Brenner y en la uarta las del Gradiente

Cuadráti o. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

3.11 Imagen astronómi a �ltrada de a uerdo a distintos sensores a tivos y

algunas de las es alas signi� ativas dete tadas. (A) Sensor S

, � =

3:5. (B) Sensor S

, � = 5:5. (C) Sensor S

, � = 12:5. (D) Sensor S

� = 2. (E) Sensor S

, � = 6. (F) Sensor S

, � = 9. (G) Sensor S

� = 7:5. (H) Sensor S

, � = 3. (I) Sensor S

, � = 11. . . . . . . . . . 50

3.12 Imagen biomédi a on diferentes niveles de ruido. . . . . . . . . . . . 52

3.13 Evolu ión de las es alas de la imagen biomédi a en presen ia de ruido. 53

3.14 Imagen sintéti a on diferentes niveles de ruido. . . . . . . . . . . . . 54

3.15 Evolu ión de las es alas de la imagen sintéti a en presen ia de ruido. 55

3.16 Imagen sintéti a suavizada a las distintas es alas obtenidas on ada

uno de los métodos sobre el sensor S

. (A) Área que ubre el sensor

. (B.1) � = 4:5. (C.1) � = 1. (C.2) � = 3. . . . . . . . . . . . . . . 61

. (B.1) � = 4:5. (C.1) � = 1. (C.2) � = 3. . . . . . . . . . . . . . . 62

Índice de Figuras xix

. (B.1) � = 5. (C.1) � = 1. (C.2) � = 3. . . . . . . . . . . . . . . . 63

. (B.1) � = 4:5. (C.1) � = 1. (C.2) � = 3:5. . . . . . . . . . . . . . 64

. (B.1) � = 18. (C.1) � = 1. (C.2) � = 14:5. . . . . . . . . . . . . 65

3.21 Re onstru ión de la imagen sintéti a usando la informa ión aso iada

a los sensores a tivos para la representa ión (A) en el dominio espa ial,

(B) en el dominio fre uen ial, (C) en el dominio de Gabor. . . . . . . 66

3.22 (A) Es ena natural. (B) Sensores a tivos dete tados para la es ena

natural. (C) Re onstru ión de la imágen original usando el método

basado en la representa ión en el dominio de Gabor. . . . . . . . . . 67

3.23 Es ena natural �ltrada para los sensores (A) S

, (B) S

, (C) S

y (E) S

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

3.24 (A) Imagen �ltrada on el sensor S

usando la es ala dete tada por el

método basado en la representa ión fre uen ial. (B) Imagen �ltrada

on el sensor S

usando la es ala dete tada por el método basado en

la representa ión espa ial. . . . . . . . . . . . . . . . . . . . . . . . . 70

4.1 (A) Imagen biomédi a, (B) Parti ión multi anal, (C) Sensores a tivos,

(D) Re onstru ión usando el método presentado en la se ión 5. . . 78

4.2 Muestra de los ál ulos para los sensores (A) S

, (B) S

y (C) S

La primera �la muestra la región del espe tro re ogida por el sensor.

La segunda �la muestra el mapa de energía lo al. En la ter era están

superpuestos los máximos (más os uros) y mínimos (más laros) de

los mapas de energía lo al. La uarta �la muestra las regiones de

in�uen ia W (x; y) de los máximos. En la última �la se puede ver un

histograma que muestra en el eje verti al la fre uen ia de apari ión de

ada una de las es alas lo ales dete tadas (eje horizontal). . . . . . . 80

4.3 (A) Es ena natural. (B) Sele ión de sensores a tivos. . . . . . . . . 81

4.4 (A) Sensor S

. (B) Mapa de energía lo al. (C) Máximos del mapa

de energía lo al. (D) Zonas de in�uen ia de los máximos lo ales. (E)

Representa ión 3D de las es alas lo ales. (F) Histograma de es alas

lo ales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

xx Índice de Figuras

4.5 (A) Sensor S

lo ales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

4.6 (A) Sensor S

lo ales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

5.1 Esquema general de la medida de distorsión. . . . . . . . . . . . . . . 92

5.2 (A) Imagen sintéti a usada en el experimento de enmas aramiento.

(B) Parti ión multisensor y sensores a tivos dete tados. . . . . . . . 94

5.3 Imágenes obtenidas añadiendo ruido normal uniforme a la imagen de

la �gura 5.2(A). Las desvia iones estandar de ada una de las imágenes

son (A) � = 10. (B) � = 20. (C) � = 30. (D) � = 45. (E) � = 55.

(F) � = 70. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

5.4 Imágenes obtenidas añadiendo ruido normal no uniforme a la imagen

de la �gura 5.2(A). El ruido se ha apli ado sólo sobre algunas zonas

de la imagen (idénti as para todas las imágenes). Las desvia iones

estandar de ada una de las imágenes son (A) � = 15. (B) � = 30.

(C) � = 50. (D) � = 65. (E) � = 95. (F) � = 120. . . . . . . . . . . 97

5.5 Grá� a omparativa de la medida d

(eje verti al) frente a RMSE

(eje horizontal). La línea dis ontínua muestra la omparativa para las

imágenes on ruido uniforme y la ontínua para las de ruido no-uniforme. 98

5.6 (A) Imagen original. (B) Imagen pixelada 8x8. (C) Imagen pixelada

12x12. (D) Imagen pixelada 16x16. . . . . . . . . . . . . . . . . . . . 99

5.7 (A) Parti ión multisensor de la imagen original de la �gura 5.6 (Eins-

tein). (B) Sensores a tivos. . . . . . . . . . . . . . . . . . . . . . . . 100

5.8 (A) Imagen original. (B) Imagen pixelada 8x8. (C) Imagen pixelada

12x12. (D) Imagen pixelada 16x16. . . . . . . . . . . . . . . . . . . . 101

5.9 (A) Parti ión multisensor de la imagen original de la �gura 5.8 (es ena

de los bar os). (B) Sensores a tivos. . . . . . . . . . . . . . . . . . . 102

5.10 6 parejas de imágenes usadas en el experimento de dete ión de ob-

jetos. Cada pareja onsta de una es ena natural va ía (dere ha) y la

misma es ena on un objeto en el entro (izquierda). (Continúa en

la figura 5.11). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

5.11 (Continua ión de la figura 5.10). . . . . . . . . . . . . . . . . . 105

Índice de Figuras xxi

5.12 Parti ión del espe tro de la imagen on objeto de la pareja A de la

�gura 5.10 y re onstru ión de la imagen usando la e ua ión 5.12. . . 106

5.13 Ordena iones de mejor a peor visibilidad de las imágenes de la �gura

5.10. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

5.14 Muestra de las imágenes de la base de datos del TNO HFRI. (A) n

34, (B) n

20, (C) n

36, (D) n

29, (E) n

15, (F) n

32. . . . . . . . 109

5.15 Rela ión entre la medida omputa ional d1 y la medida psi ofísi a de

distinguibilidad visual. . . . . . . . . . . . . . . . . . . . . . . . . . . 110

5.16 Fun iones de distribu ión teóri as del tiempo de dete ión para las 17

imágenes de la base de datos. Con un ír ulo se indi an los lusters

dete tados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

5.17 Rela ión entre la medida d

y el tiempo medio de búsqueda. La línea

ontínua representa el ajuste por mínimos uadrados. . . . . . . . . . 116

5.18 Muestra de las imágenes usadas en el experimento (1). En la esqui-

na superior izquierda está la imagen original y el resto son imágenes

omprimidas on el algoritmo JPEG a distintos niveles de alidad

(80,40,30,25,20). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118

5.19 Muestra de las imágenes usadas en el experimento (2). Imágenes

omprimidas on el algoritmo JPEG a distintos niveles de alidad

(17,14,11,8,5,2). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

5.20 Comparativa entre los valores de las medidas de distorsión d1 y RMSE

frente al fa tor de alidad del algoritmo de ompresión JPEG. . . . . 120

5.21 Derivadas de las fun iones de la �gura 5.20. . . . . . . . . . . . . . . 122

5.22 (A) Imagen de una mamografía. (B) Mamografía omprimida on un

fa tor de alidad de 80. (C) Mamografía omprimida on un fa tor de

alidad de 20. (D) Mamografía omprimida on un fa tor de alidad

de 10. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

5.23 (A) Parti ión multisensor de la mamografía. (B) Sensores a tivos

dete tados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

5.24 Primera pareja de imágenes. (A) Imagen original on objeto. (E)

Imagen original sin objeto. (B), (C), (D) Imagen (A) omprimida a

niveles de alidad de 10, 9 y 5 respe tivamente. (F), (G), (H) Imagen

(E) omprimida on fa tores de alidad 10, 9 y 5 respe tivamente. . 125

5.25 Segunda pareja de imágenes. (A) Imagen original on objeto. (E)

Imagen original sin objeto. (B), (C), (D) Imagen (A) omprimida a

niveles de alidad de 10, 9 y 8 respe tivamente. (F), (G), (H) Imagen

(E) omprimida on fa tores de alidad 10, 9 y 8 respe tivamente. . 126

xxii Índice de Figuras

5.26 Rela ión entre la métri a d1 y el fa tor de alidad (A) para la primera

pareja y (B) para la segunda pareja (B). . . . . . . . . . . . . . . . . 127

5.27 Rela ión entre la métri a d1 y la medida psi ofísi a de dintinguibilidad

para la primera pareja (línea ontínua) y para la segunda pareja (línea

dis ontínua). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128

B.1 Obten ión de una gaussiana 3D on orienta ión a partir de dos gaus-

sianas 2D orientadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . 134

B.2 Muestra de fun iones gaussianas on diferentes parámetros. . . . . . 135

Capítulo 1

Introdu ión

1.1 El Sistema Visual Humano

El pro eso que se desen adena desde que una señal luminosa atraviesa la órnea hasta

que se produ e algún tipo de per ep ión en el erebro es muy largo aunque o urre

de forma asi instantánea. Esta señal lumíni a sufre una serie de transforma iones

durante el pro eso que ha en posible que seamos apa es de re ono er objetos.

El sistema visual humano (SVH) es bastante omplejo y aún hoy día no es om-

prendido en su totalidad, aunque se ono en iertos aspe tos. Por ejemplo, algo que

pare e laro, sin entrar en ex esivo detalle, son las etapas que sigue el pro eso de

per ep ión visual:

✮ Forma ión de la imagen en la retina. La luz re�ejada por los objetos del mundo

exterior es proye tada en la retina.

✮ Codi� a ión de la imagen retinal y transmisión al órtex visual.

✮ Representa ión. La imagen odi� ada es pro esada por los distintos grupos de

neuronas que hay en el órtex erebral. En este nivel se realizan algunas tareas

simples omo dete ión, dis rimina ión o re ono imiento de formas simples.

✮ Interpreta ión de la imagen. Esta es sin duda la etapa más ompleja, quizá

por ser la menos ono ida. Esta fase se podría onsiderar omo la auténti a

fase de per ep ión de la imagen retinal ya que es ahora uando el erebro

aso ia propiedades per eptuales a las sensa iones presentes en la imagen ( olor,

movimiento, formas, ...).

La estru tura �siológi a del ojo se puede ver en la �gura 1.1. Una vez que la luz

atraviesa la órnea, el humor a uoso, el ristalino y el humor vítreo, esta es proye tada

2 Capítulo 1. Introducción

��

Córnea

Cristalino

Humor acuoso

Nervio óptico

Energía eléctrica

Energía luminosa

Retina

Fóvea

BastonesBipolares

AmacrinasHorizontales

Ganglionares

Humor vítreo

Figura 1.1: Corte transversal del ojo y organiza ión elular de la retina.

sobre la retina, que no es más que una apa de élulas fotorre eptoras, situada en

la parte posterior del ojo, y que está ompuesta de distintos tipos de neuronas,

ada una de los uales tiene un ometido diferente. Estas élulas onvierten la

informa ión lumíni a en señales elé tri as que pueden ser interpretadas o pro esadas

por el erebro.

Aunque en la retina la luz in ide sobre las élulas ganglionares, ama rinas, bi-

polares, horizontales y onos y bastones, por ese orden, el lugar donde empieza a

ser transformada es en estos últimos, las llamadas élulas fotorre eptoras. Esto es

posible debido a que las que están por delante de ellas son transparentes y, por tan-

to, dejan pasar la luz. Los bastones son las élulas que se en argan de la visión en

ondi iones pobres de ilumina ión y son muy numerosos (sobre 100 millones). Están

presentes en toda la retina ex epto en la fóvea y en el llamado punto iego que es la

zona desde donde parte el nervio ópti o ha ia el interior del erebro y en el que no

hay ningún tipo de élula fotorre eptora. Los onos son bastante menos numerosos

(unos 5 millones) y están on entrados en la fóvea, dejando el resto de la retina

bastante despoblada. Estos son los en argados de la visión en buenas ondi iones de

ilumina ión. La fóvea es el punto entral donde se proye tan las imágenes. En este

punto es donde se tiene una mayor agudeza visual debido a la presen ia masiva de

En de�nitiva, la tarea de las élulas fotorre eptoras onsiste en onvertir los

1.1. El Sistema Visual Humano 3

Nervio óptico

Córtex visual

Retina

Figura 1.2: Se ión transversal del erebro que muestra el amino que sigue la informa ión

visual.

estímulos luminosos que impa tan en la retina en señales elé tri as que serán trans-

portadas ha ia otras zonas del erebro mediante las élulas ganglionares que son las

en argadas de dirigir estos impulsos nerviosos ha ia el nervio ópti o. Estos impulsos

sufren iertas transforma iones a su paso por las élulas ama rinas, horizontales y

bipolares [42℄[107℄.

Tras salir del ojo, estos impulsos pasan por diferentes estru turas erebrales, omo

el LGN, antes de llegar a la zona del erebro donde es pro esada la informa ión visual

(�gura 1.2). La zona donde llegan estas señales, situada en la parte posterior del

erebro, se denomina órtex estriado. Más on retamente, el lugar donde se pro esan

los estímulos visuales es la denominada área V1. En esta región hay esen ialmente

tres tipos de élulas distintas: las simples, las omplejas y las hiper omplejas. Cada

una de ellas se espe ializa en dete tar un determinado tipo de estímulos. Hubel y

Wiesel fueron los primeros que investigaron las fun iones de ada una de estas élulas

[49℄[51℄.

Por ejemplo, las élulas simples forman agrupa iones que son apa es de anali-

zar estímulos uyo espe tro onsiste en un rango on reto de fre uen ias espa iales

mientras que las omplejas e hiper omplejas dete tan determinados tipos de movi-

mientos en la señal que se presenta omo estímulo. Cuando de imos que una élula

dete ta un estímulo, queremos de ir que hay un ambio en la a tividad de di ha

neurona (positivo o negativo) uando se le presenta di ho estímulo. Por supuesto,

la a tiva ión o no de una neurona dependerá de la posi ión espa ial del estímulo.

Se denomina ampo re eptivo visual de una neurona al área retinal en la que la luz

in�uye en la respuesta de la neurona.

1.2 Objetivos de la memoria

El objetivo de esta Tesis es el desarrollo de un modelo que permita obtener una re-

presenta ión e� iente de imágenes digitales de niveles de gris. Al hablar de e� ien ia,

no se ha e referen ia tanto a la omplejidad en espa io o tiempo que pueda requerir,

omo al aprove hamiento posterior que se pueda derivar de di ha representa ión. En

este sentido, puesto que en el ampo de la visión arti� ial, el objetivo �nal siempre

es la identi� a ión de formas y su lasi� a ión ( on mayor o menor nivel de abstra -

ión), partimos de la idea de que una representa ión óptima es aquella que ha e un

observador humano uando registra una imagen a través del SVH. Watson [120℄ pro-

pone un modelo de representa ión y evalúa su bondad en base a dos ara terísti as:

la su� ien ia y la ne esariedad. De�ende que una odi� a ión ha de ser su� iente,

en el sentido de que sea apaz de retener toda la informa ión que es apaz de per ibir

un ser humano, y ne esaria porque sólo retiene esa informa ión.

Pero tan importante omo la simula ión de di ho omportamiento inteligente son

los datos de los que se parte. Tanto el SVH omo las té ni as de visión arti� ial,

tienen omo datos de partida la proye ión de la luz en la retina. La retina, omo

se ha di ho antes, es un mosai o bidimensional de fotorre eptores que registran esa

luz y la transmiten ha ia el erebro. La pregunta que se plantea es la siguiente

¾donde empieza el denominado omportamiento inteligente durante el pro eso de

re ono imiento de formas? La razón de esta pregunta es la siguiente: si sabemos

donde omienza di ho omportamiento, podríamos separar la parte del SVH que se

limita a representar la informa ión lumíni a, de la parte que es apaz de interpretar

esa representa ión. Posiblemente, este omportamiento omenzará a estar presente

desde el momento de in idir la luz en la retina, ya que esa energía lumíni a va a

ir sufriendo una serie de transforma iones, durante su amino ha ia el erebro, de

forma que uando llegue al órtex visual ya habrá determinado iertas ara terísti as

del estímulo visual que tengan algún tipo de interpreta ión más o menos dire ta por

parte de las zonas del erebro en argadas del pro eso de per ep ión propiamente

di ho. Pero el verdadero omportamiento inteligente omenzará, sin duda alguna,

uando el estímulo esté representado en el órtex visual. Esta separa ión de fun iones

en el SVH puede mar ar la diferen ia entre un sistema de visión arti� ial inteligente

y un sistema de visión ad-ho . Normalmente, en los sistemas ad-ho tradi ionales,

1.3. Descripción por capítulos 5

Seccion 2.2

Seccion 2.3

PSfrag repla ements

Parti ión

Multisensor

Se ión 2.2

Modelo

Representa ión

Cap. 2

Dete ion

Es alas

Cap. 3

Modeliza ión

de los

Campos Re eptivos

Se ión 2.3

Dete ión de Es alas Lo ales

Cap. 4

Medida de Distorsión Per eptual

Cap. 5

Apli a iones

Figura 1.3: Esquema de desarrollo de la Tesis.

se parte de una representa ión similar a la que hay en la retina, donde tenemos

una matriz bidimensional de intensidades lumíni as, y se realiza el pro eso que se

podría llamar inteligente a partir de di ha representa ión. Di hos sistemas tienen

apli a iones muy espe í� as y limitadas, en parte porque a túan de forma distinta

a omo lo ha e el SVH, ya que éste no apli a la inteligen ia dire tamente sobre

la representa ión retinal. El SVH apli a la inteligen ia sobre la representa ión que

tiene en el órtex de la imagen retinal, donde, en lugar de intensidades lumíni as

tenemos la des rip ión del estímulo en base a un onjunto de des riptores que agrupan

determinado tipo de ara terísti as.

Por tanto, si lo que pretendemos ha er es una tarea que implique similaridad on

el omportamiento humano, pare e lógi o partir de una representa ión similar a la

que usa el SVH para re ono er formas. En esta Tesis se propone una representa ión

para imágenes de niveles de gris que ha e uso de algunas de las ara terísti as del SVH

y que tiene omo objetivo fundamental fa ilitar tareas posteriores de pro esamiento

de di ha imagen.

1.3 Des rip ión por apítulos

El desarrollo de esta memoria se puede ver en el esquema de la �gura 1.3. Esen ial-

mente hay dos partes diferen iadas en la Tesis:

✮ Parte I. En este bloque se desarrolla el modelo de representa ión de imágenes

digitales que se propone. Para ese modelo se usan distintas propiedades del

SVH. En on reto se hará uso de la sele tividad frente a fre uen ial espa ial

y orienta ión de las élulas simples del órtex visual. Este he ho ha e ne e-

saria la parti ión del espa io fre uen ial y la sele ión de aquellos anales que

produz an una repuesta fuerte frente a un determinado estímulo visual; esto

se detalla en la se ión 2.2. Por otra parte, además de la parti ión en anales,

se ne esitará un modelo para los ampos re eptivos (C.R.) de di has élulas;

esto se expli a en la se ión 2.3. Para llevar a abo di ha modeliza ión se ha e

uso de una herramienta de sele ión de es alas globales que se expli a en el

apítulo 3.

✮ Parte II. En esta segunda parte se proponen dos apli a iones del modelo de

representa ión. La primera de ellas ha e uso de él para determinar las es alas

lo ales naturales presentes en imágenes digitales de niveles de gris (Capítulo 4).

La segunda apli a ión usa el modelo para la implementa ión de una medida

de distorsión per eptual entre imágenes (Capítulo 5).

Tras el desarrollo del modelo y sus apli a iones, se ha e una pequeña exposi ión de

líneas futuras a seguir en la investiga ión y se añaden 2 apéndi es on informa ión

adi ional sobre la nota ión usada en la Tesis (apéndi e A) y sobre la genera ión de

fun iones gaussianas y de Gabor (apéndi e B).

Para errar la Tesis se in luye la bibliografía y el índi e de referen ias.

Capítulo 2

Modelo de representa ión de

imágenes propuesto

2.1 Introdu ión

Es ono ido que en las fases ini iales del pro eso de per ep ión visual, el ser huma-

no des ompone la informa ión que re ibe en anales separados de fre uen ias para

analizar por separado ada uno de ellos (Campbell y Robson [14℄, Movshon [86℄, De

Valois et al. [22℄). Este he ho se ha omprobado usando diversos tipos de té ni as:

psi ofísi as (Campbell y Robson [14℄), neuro�siológi as (Campbell et al. [12℄, Blake-

more et al. [10℄), et . Bási amente, todos los investigadores siguen una misma línea

de trabajo para demostrarlo. Sus resultados se basan en experimentos en los que,

tras presentar un estímulo de luz on unas ara terísti as on retas a un sujeto, se

mide la respuesta que produ en las élulas simples del órtex frente a di ho estímulo.

Esa respuesta se medirá de forma distinta según sea el método elegido. Se ha po-

dido omprobar que hay grupos de élulas que se espe ializan en analizar estímulos

on retos. Hay élulas que sólo se a tivan uando el estímulo se mueve o uando el

estímulo está formado por un determinado onjunto de fre uen ias espa iales. La

mayor parte de los experimentos se han llevado a abo on gatos o monos debido

a que tienen iertas similaridades on el SVH (Poggio [93℄, Marg et al. [74℄, Field

[32℄). Ini ialmente fueron Hubel y Wiesel [50℄ quienes des ubrieron en 1962 la sele -

tividad frente a orienta ión de las élulas simples de la región V1 del órtex visual.

Posteriormente fueron Campbell y Robson [14℄ los que postularon que existían ana-

les independientes que operaban de forma lineal y eran sele tivos frente a un rango

limitado de fre uen ias. Finalmente Bla kemore y Campbell [10℄ demostraron que

esos anales eran sele tivos también frente a orienta ión. Los resultados de diferentes

8 Capítulo 2. Modelo de representación de imágenes propuesto

tipos de experimentos llegan a la misma on lusión: la del pro esamiento en anales

independientes; en todos ellos subya e la idea de que en etapas tempranas del pro-

eso de visión se realiza algún tipo de análisis de Fourier (Kabrisky [57℄, Ginsburg

[41℄, Ma�ei et al. [69℄, Pollen et al. [95℄).

Del trabajo de Campbell y Robson [14℄ se dedu ía que el ontraste de uno de los

anales espa io-fre uen iales debía superar un ierto umbral para que el observador

fuese apaz de dete tar esas fre uen ias. La existen ia de este pro eso de sele ión

espa io-fre uen ial fué estable ida por Enroth-Cugell y Robson [28℄. Posteriormente,

fué de nuevo Campbell [13℄ quien veri� ó la sele tividad de fre uen ias del sistema

visual del mono. Los experimentos de adapta ión on gratings realizados por otros

investigadores pusieron de mani�esto la existen ia de anales sele tivos en el SVH

humano similares a los que poseían los animales de los experimentos (Pantle et al.

[90℄, Blakemore et al. [10℄, Tynan et al. [115℄). Fueron Sa hs, Na hmias y Robson

[101℄ y Graham y Na hmias [44℄ quienes, mediante un estudio estadísti o, des artaron

los modelos mono anal en favor de modelos multi anal. Georgeson y Sullivan [40℄

des artaron el enfoque mono anal de Hay y Chesters [47℄ argumentando la gran

limita ión que tiene este tipo de enfoque on la presen ia de ruido.

Uno de los problemas prin ipales on el que nos en ontramos siempre que usamos

un enfoque multi anal a la hora de analizar una imagen, es sele ionar el onjunto

ade uado de anales, es de ir, hay que de idir sobre el número de anales, la fre-

uen ia espa ial entral de ada anal, su orienta ión y su an ho de banda. Hasta

ahora ha habido varias aproxima iones para en ontrar una solu ión razonable a este

problema omo por ejemplo el muestreo del espa io de fre uen ias a intervalos �jos

o el uso de un número �jo de anales prede�nidos sobre el espe tro de fre uen ias

(éste se ono e omo roseta). Dentro de esta parti ión �ja también hay varia ión en

uanto al número de anales y su posi ión en el espe tro. En la �gura 2.1 se pueden

ver distintos modelos propuestos por Watson [120℄ [119℄, Daugman [21℄, Ebrahimi

y Kunt [24℄ y Navarro [88℄. Aquí se puede ver que hay autores que muestrean más

determinados grupos de fre uen ias en detrimento de otros. Por ejemplo, Ebrahimi

y Kunt, usan más anales en las dire iones horizontal y verti al basándose en el

he ho de que el SVH es más sensible a estru turas que tienen esas orienta iones.

Este he ho es debido a la mayor presen ia de neuronas sensibles a di has orienta io-

nes (Mans�eld [71℄, Mans�eld et al. [72℄). Si observamos el espe tro fre uen ial de

es enas naturales, podremos observar una on entra ión mayor de energía en esas

dos orienta iones, este fenómeno es debido al efe to de la gravedad sobre los objetos

del mundo real.

Watson [119℄ propone en 1987 una parti ión on 4 orienta iones y 4 bandas de

2.1. Introducción 9

PSfrag repla ements

(A) (B) (C) (D)

Figura 2.1: Diferentes rosetas propuestas por varios autores. (A) Daugman. (B) Ebrahimi

y Kunt. (C) Watson. (D) Navarro.

fre uen ias además de dos �ltros residuales, uno paso alto y otro paso bajo (transfor-

mada del órtex). Para modelizar ada anal usa un �ltro paso banda que onstruye

en el dominio fre uen ial y que se pare e a una fun ión Gabor aunque no es exa ta-

mente igual. En un trabajo posterior [120℄ evalúa la apli a ión de ese modelo a la

ompresión de imágenes obteniendo buenos resultados.

Sin embargo, el uso de este tipo de parti iones tiene varios in onvenientes:

✮ Puede haber mu hos anales. Esto puede impli ar un serio in onveniente es-

pe ialmente si lo que ha emos es un muestreo fre uen ial a intervalos �jos y la

imagen es grande.

✮ Es ine� iente. Al haber mu hos anales las ne esidades omputa ionales au-

mentan mu ho.

✮ No todos los anales tienen informa ión útil. Habrá anales que tengan sólo

ruido o estru turas no esen iales.

✮ Es posible que los anales sele ionados no hagan una parti ión ade uada.

Se puede dar el aso de la existen ia de estru turas que tengan omponentes

fre uen iales que se separen en varios de estos anales; si apli amos uno de

estos modelos puede que no onsigamos analizar di has estru turas omo una

úni a forma, sino que anali emos sus partes por separado, siendo por tanto más

ompleja la tarea posterior de determinar la presen ia de di has estru turas.

En esta Tesis se propone un modelo que solventa los in onvenientes men ionados

anteriormente, al menos en parte. Teniendo en uenta que no todas las imágenes

tienen el mismo ontenido informa ional, es obvio que tampo o tendrán los mismos

requisitos omputa ionales de ara a su pro esamiento. Sería lógi o pensar, por

tanto, en un modelo de parti ión que fuese dependiente de la imagen, es de ir, dada

una imagen ha er un estudio sobre los posibles anales que ontienen estru turas

más o menos independientes. Posteriormente se podría determinar uales de esos

anales tienen estru turas que son de interés para el pro esamiento posterior que se

vaya a realizar.

El modelo de parti ión propuesto en esta Tesis onsta de dos etapas:

✮ Primera. Parti ión del espe tro fre uen ial en bandas de fre uen ias que

ontengan informa ión homogénea en base a algún riterio objetivo (sensores).

Este paso se detalla en la se ión 2.2. El objetivo de esta fase es obtener una

des omposi ión adaptativa del espe tro que permita llevar a abo la seguda

etapa.

✮ Segunda. Sele ión de aquellos anales que ontengan informa ión su� iente

para realizar la tarea visual que estemos llevando a abo (sensores a tivos).

Este paso se detalla en la se ión 2.2.1.

En este sentido, pare e razonable que si nuestra inten ión es simular de alguna forma

el omportamiento del SVH, para pro esar la informa ión lumíni a de forma análoga

a omo lo ha e un ser humano, tengamos que des omponer la informa ión de entrada

en base a algún riterio objetivo que sea lo más pare ido posible al que usa el SVH.

El problema que se plantea es elegir ese riterio de parti ión de la informa ión que

re ibe el sistema visual. En este trabajo sólo se tendrán en uenta parte de las

ara terísti as de las élulas simples del órtex y del SVH para �ltrar la informa ión

que llega. En on reto se usará la sele tividad frente a orienta ión y fre uen ia

espa ial y la apa idad de enfoque de estru turas.

El riterio que nosotros vamos a tomar es ampliamente a eptado por la omu-

nidad ientí� a aunque se introdu irán varia iones que lo ha en novedoso. Vamos

a onsiderar que las élulas simples se espe ializan en el análisis de bandas de fre-

uen ias espa iales. Por tanto, dado un estímulo luminoso, lo que haremos será

des omponer su espe tro de fre uen ias en bandas, ada una de las uales será anali-

zada por un grupo distinto de élulas. Aquí apare e la no ión de sensor : de�niremos

un sensor omo ada una de las bandas de fre uen ias en las que hemos parti ionado

el espe tro.

Una vez he ha esa parti ión, es de ir, una vez que hemos determinado qué bandas

del espe tro van a ser pro esadas por ada grupo de élulas, habremos de de idir omo

van a ser pro esadas di has bandas. Para ha er esto nos basaremos en experimentos

ya desarrollados por varios autores en los que se estudia omo responden las élulas

frente a estímulos luminosos. Aquí apare e el on epto de ampo re eptivo (C.R.) de

2.2. Partición del espectro de frecuencias 11

PSfrag repla ements

(A) (B)

Figura 2.2: Per�l 3D de una fun ión de Gabor on simetría par. (A) en el dominio espa ial

y (B) en el dominio fre uen ial.

las élulas, que no es más que la región del ampo visual dentro de la ual la luz puede

ausar algún ambio en la respuesta de la élula; por tanto, un grupo de élulas dado

responderá sólo ante aquellas fre uen ias que estén próximas al entro de su C.R.. Se

ha podido omprobar que esos ampos re eptivos tienen aproximadamente el per�l

de una fun ión de Gabor (Figura 2.2). Si observamos el espe tro de Fourier de una

fun ión de Gabor (Figura 2.2.(B)) podemos apre iar que no es más que un �ltro paso

banda sele tivo frente a orienta ión y fre uen ia radial. Por otra parte si miramos

el per�l espa ial de este tipo de fun iones (Figura 2.2.(A)) se pueden apre iar zonas

ex itatorias (la respuesta frente a un estímulo es positiva) y zonas inhibitorias (la

respuesta ante un estímulo es negativa), esto impli a que uando una élula se a tiva

inhibe a las élulas próximas a ella, este efe to es ono ido omo inhibi ión lateral .

A ontinua ión se pro ederá, en una segunda etapa, a espe i� ar uales de es-

tas bandas serán su� ientes de ara a representar la informa ión visual de manera

robusta, es de ir, resistente frente a ruido o detalles inne esarios.

2.2 Parti ión del espe tro de fre uen ias

En esta se ión se desarrollará el método que nos va a permitir parti ionar el espe tro

de fre uen ias de una imagen para su posterior pro esamiento. Puesto que partimos

de las élulas simples del órtex omo unidades bási as para el pro esamiento que

vamos a realizar, habrá que tener en uenta algunas de sus propiedades a la hora

de de idir que áreas del espe tro van a ser analizadas por ada una de ellas. Una

de estas propiedades es la sele tividad frente a orienta ión, es de ir, determinadas

élulas se espe ializarán en el análisis de estímulos que tengan una determinada

orienta ión espa ial. En este sentido Thomas et al. [111℄ omprobaron en 1978 que

el an ho de banda medio que son apa es de pro esar estas élulas estaba entre 10

. Estudios posteriores (1982) de De Valois et al. [23℄ on luyen que el an ho

de banda medio que son apa es de pro esar estas élulas es de alrededor de 40

En ese estudio se llega a esta on lusión aunque hay que tener en uenta algunos

mati es omo que la distribu ión de an hos de banda obtenida para 387 élulas era

muy variada. En sus estudios se on luyó que la mediana de esa distribu ión era

un buen estimador del an ho de banda medio de las élulas simples del órtex (la

mediana era de aproximadamente 40

También hay trabajos donde se habla del an ho de banda medio que han de tener

di hos anales. De Valois et al. [22℄ y Webster et al. [122℄ on luyen que el rango

medio de fre uen ias ubiertas en un anal es de aproximadamente 1.4 o tavas.

Sea f(x; y) la imagen de referen ia on un tamaño de NxN pixeles y sea F

(u; v)

la transformada de Fourier dis reta de f(x; y) suavizada a es ala �, es de ir:

(u; v) = FFT (f (x; y) gs (x; y; �)) (2.1)

donde es el operador de onvolu ión, FFT () es el operador Transformada de

Fourier Dire ta (ver apéndi e A) y donde gs(x; y; �) es un nú leo de onvolu ión

gaussiano simétri o de es ala � de�nido omo:

gs (x; y; �) =

2��

Para ver más detalles sobre los parámetros que pueden de�nir una fun ión gaus-

siana onsultar la se ión B.1.

Puesto que f(x; y) es una fun ión real, su transformada de Fourier es simétri-

a (por la propiedad de simetría onjugada) y por tanto de aquí en adelante sólo

trabajaremos on la mitad superior del espe tro de fre uen ias. También usaremos

nota ión polar en lugar de nota ión artesiana, es de ir, dadas las oordenadas ar-

tesianas (u; v) trabajaremos on las oordenadas polares (�; �) donde � =

es el radio y � = ar tan

es el ángulo.

Una forma ini ial de plantear la sele tividad frente a orienta ión es onsiderar una

serie de orienta iones �jas on el an ho de banda medio propuesto por De Valois y

otros autores, es de ir, vamos a onsiderar 4 bandas de orienta ión de 45

. Por tanto,

el primer paso del modelo onsistirá en dividir el plano fre uen ial en uatro bandas

de orienta ión B

(i = 0; 1; 2; 3) on un ángulo medio de �

= i � 45 + 22:5 grados

PSfrag repla ements

f(x; y) F

(u; v)

(0; 0)

Figura 2.3: Parti ión del espe tro en bandas de orienta ión. Izquierda: Imagen de referen-

ia. Dere ha: espe tro de la imagen suavizada a es ala 1 y la parti ión en uatro

bandas de orienta ión.

(i = 0; 1; 2; 3) y on un an ho de banda de 45

(Figura 2.3). Cada una de estas bandas

será parti ionada en anales de fre uen ias espa iales de forma que en ada uno de

ellos aislaremos datos espe trales que umplan un ierto riterio de homogeneidad.

Este riterio ha de impli ar que los omponentes espa io-fre uen iales de un sensor

tienen similar importan ia en uanto a la aporta ión que ha en en la imagen. Una

onse uen ia inmediata de esto es la separa ión de anales que ontienen ruido de

otros anales, on un nivel de a tividad mayor, que ontienen diferentes tipos de

estru turas. Esto se hará ha iendo uso del índi e de antialiasing �

), de�nido

sobre ada una de las bandas B

, y que representa la antidad relativa de informa ión

espe tral que hay en la banda B

onsiderando el rango de fre uen ias [0; �

(�; �)j d�d�

donde el numerador es la suma de los omponentes fre uen iales para la banda

de orienta ión B

en el rango de fre uen ias [0; �

) de la imagen de referen ia

suavizada a es ala � = 1 y el denominador es la suma de todos los omponentes

espe trales de la banda B

para la imagen de referen ia suavizada a es ala � = 1.

El suavizado de la imagen se ha e para eliminar las fre uen ias muy altas debidas al

ruido de uantiza ión o digitaliza ión de la imagen.

En otras palabras, el índi e de antialiasing representa la antidad de informa ión

que hay por debajo de una fre uen ia dada (esto para ada una de las bandas B

Una vez que tenemos los uatro índi es (uno para ada banda), haremos uso de

ellos para parti ionar ada una de las bandas en anales de fre uen ias de a uerdo a

un riterio de homogeneidad. En nuestro aso, lo que haremos será bus ar aquellos

rangos de fre uen ias en los que se produz a una varia ión signi� ativa en la velo idad

de re imiento de la fun ión de antialiasing. Esta fun ión es monótona re iente

(�gura 2.4) y en ella se va a umulando progresivamente la energía ontenida de la

banda B

; por tanto, un in remento en la velo idad de re imiento de la misma, nos

está indi ando que en la imagen hay estru turas uya energía está on entrada en

a partir del punto donde se in rementa la velo idad. Por otra parte uando la

velo idad de re imiento de re e hasta al anzar un valor mínimo tendremos el aso

ontrario, es de ir, tendremos el límite superior del rango de fre uen ias de mayor

ontribu ión, en B

, para alguna de las estru turas presentes en la imagen.

Para determinar la velo idad de re imiento de �

) al ularemos su segun-

da derivada y sobre ella bus aremos los extremos (máximos y mínimos) lo ales que

representarán la máxima y mínima velo idad de re imiento de di ha fun ión. Sean

, ..., �

los extremos lo ales en ontrados (donde n

+1 es el número total de

extremos en ontrados). Esta se uen ia de extremos lo ales nos está dando la parti-

ión espe tral bus ada, es de ir, ahora tenemos la banda B

partida en n

anales de

fre uen ias [�

) on j = 0; :::; n

�1, ada uno de los uales ontiene un rango de

fre uen ias espa iales de importan ia relativa semejante dentro de B

. En la �gura

2.4 se puede observar la fun ión de antialiasing �

) al ulada sobre la banda

de la imagen de la �gura 2.3 (izquierda) y su segunda derivada on los extremos

lo ales mar ados. Para el ál ulo de la segunda derivada se debe apli ar un método

que sea robusto frente al ruido (Mokhtarian et al. [84℄, Jain et al. [53℄). Esto es

debido a que el espe tro de fre uen ias de una imagen tiene una gran antidad de

pi os ( asi de pixel a pixel) que no son signi� ativos y que si no son eliminados de

alguna forma lo úni o que ha en es rear multitud de anales que no aislan ninguna

informa ión de utilidad. La esen ia del método es la determina ión de grupos de

fre uen ias que umplan una determinada ondi ión, aunque haya alguna fre uen ia

intermedia aislada que no la umpla estri tamente. Para el desarrollo de este trabajo

se ha elegido el operador LoG (Lapla iana de Gaussiana) sele ionando el parámetro

de es ala de la gaussiana � = 2. En el aso de la �gura 2.4 se ha usado un � mayor

para apre iar mejor los extremos de la segunda derivada.

A ada uno de los anales que obtenemos lo llamaremos de ahora en adelante

sensor y por tanto a la parti ión obtenida la llamaremos parti ión multisensor . En

la �gura 2.5 se puede ver un esquema ompleto del pro eso de ál ulo de la parti ión

multisensor. Partimos de la imagen ini ial, f(x; y), y del espe tro de fre uen ias de

0 20 40 60 80 100 120-0.002

-0.0015

-0.001

-0.0005

0.0005

0 20 40 60 80 100 120

PSfrag repla ements

(A) (B)

Figura 2.4: (A) Índi e de antialiasing obtenido sobre la banda B

de la imagen de la �gura

2.3. (B) Los anales para esta banda serían ada uno de los intervalos entre

máximos y mínimos alternativos de la segunda derivada.

la imagen onvolu ionada on un nú leo gaussiano de es ala � = 1, F

(u; v). Pos-

teriormente, pro esaremos por separado ada una de las uatro bandas, B

obteniendo para ada una de ellas el índi e de antialiasing �

) y los orres-

pondientes extremos lo ales de su segunda derivada. Estos extremos determinarán

la parti ión del espe tro que estamos bus ando.

Dado un sensor S, llamaremos S

a la fre uen ia radial mínima que de�ne

el sensor, S

a la fre uen ia radial máxima que de�ne el sensor, S

al ángulo

mínimo que de�ne el sensor y S

al ángulo máximo que de�ne el sensor. De estos

parámetros podemos obtener el ángulo medio del sensor �

y la fre uen ia radial

media �

En la siguiente se ión se puede ver omo la parti ión multisensor obtenida se

puede apli ar para evitar los problemas que plantean las parti iones �jas dis utidas.

2.2.1 Sele ión de sensores a tivos

Una vez que tenemos la parti ión multisensor analizaremos la importan ia de la

informa ión ontenida en ada sensor. El objetivo de esta fase es sele ionar el

sub onjunto de sensores que, dentro de la parti ión, aislan informa ión espe tral o-

rrespondiente a estru turas signi� ativas presentes en la imagen de entrada f(x; y).

Los sensores de este sub onjunto serán los llamados sensores a tivos. Esto tiene dos

ventajas importantes, por una parte redu imos el osto omputa ional del pro eso

al des artar el análisis de gran parte de la informa ión y por otra evitamos analizar

sensores que ontengan ruido y detalles po o relevantes. Esta sele ión de sensores

PSfrag repla ements

f(x; y)

(u; v)F

(u; v)

Parti ión B

Parti ión multisensor

Figura 2.5: Ejemplo del ál ulo de la parti ión multisensor sobre una imagen digital.

está inspirada en la do trina de Barlow [7℄ [8℄. El segundo de sus dogmas di e: �El

sistema sensorial está organizado para de�nir omo ompleta una representa ión del

estímulo sensorial on el menor número posible de neuronas a tivas�. Barlow se basa,

además de en eviden ias �siológi as, en la teoría de la informa ión de Shannon [105℄

[106℄ de la que se desprende que es posible disminuir el número de unidades a tivas

sin pérdida de informa ión. Por otra parte es ono ida la alta redundan ia de la

informa ión visual por lo que pare e lógi o ha er una sele ión de la informa ión

que vamos a pro esar. No es tarea fá il obtener un modelo de representa ión que

sea ompleto en el sentido de Barlow, por tanto, estas ideas sólo nos van a servir

de punto de partida para proponer un modelo de parti ión que intenta a er arse a

esa ompletitud. Esta parti ión estará ompuesta por aquellos sensores que onten-

gan su� iente informa ión omo para des ribir las estru tras signi� ativas presentes

en la imagen. De esta forma, des artaremos aquellos otros sensores que ontienen

informa ión redundante de ara a un pro esamiento posterior de la imagen.

El problema se entra enton es en determinar uantos y uales de los sensores

serán su� ientes para des ribir el ontenido informativo de la imagen sin perder las

estru turas signi� ativas y on la menor redundan ia posible.

Para determinar la importan ia relativa de ada sensor ara terizaremos a ada

uno de ellos on una medida que nos indique la antidad de informa ión relativa que

ontiene:

(�; �)j

d�d�

(�; �)j

d�d�

donde jF

(�; �)j es la poten ia del espe tro de la imagen f(x; y) suavizada a

es ala � = 1 en la posi ión (�; �), la doble integral

representa la sumatoria sobre

el se tor espe tral orrespondiente al sensor S

y la integral

es la sumatoria sobre

el espe tro ompleto.

Otras alternativas a esta pondera ión se pueden ver en (Rao [97℄, D'Astous [18℄,

Jernigan et al. [55℄) donde apare en otras formas de utilizar determinadas propieda-

des estadísti as de ada sensor omo lo aliza ión, tamaño, entropía, et .

Una vez tenemos ara terizados ada uno de los sensores apli aremos un método

de lustering ( lasi� a ión no supervisada) para agrupar los sensores en dos atego-

rías: a tivos y no-a tivos. Por a tivos vamos a denominar a aquellos on mayor nivel

de respuesta y por no-a tivos a aquellos que tienen menor nivel de respuesta aunque

no sea totalmente nulo.

El método de lustering apli ado es el ono ido omo k-medias (Jain et al. [54℄).

Este método onsiste en ir agrupando su esivamente los elementos de que disponemos

en lases de forma que la distan ia entre ada elemento y la lase a la que pertene e

es la menor posible. Para ini ializar el algoritmo se eligen tantos elementos omo

lusters deseemos obtener y asignamos uno a ada luster. Posteriormente, vamos

tomando el resto de elementos y los vamos in luyendo en el luster más er ano. Una

vez que están todos los elementos asignados hemos de ir uno por uno y ver si existe

algún otro luster que esté más er a que el luster al que fué asignado ini ialmente.

Este pro eso se repite hasta que no se produ en ambios.

Este algoritmo tiene varios grados de libertad en uanto a la sele ión de muestras

ini iales (semillas), la de�ni ión del entro de un luster o la de�ni ión de la distan ia

entre un elemento y un luster. Las semillas son los elementos ini iales que se asignan

a ada luster y se puede optar por varias alternativas de sele ión; por ejemplo, se

pueden tomar elementos de forma aleatoria o se pueden ordenar todos los elementos

y sele ionar varios de ellos de forma que estén equiespa iados en la ordena ión que

han tomado. En nuestro aso, el número de lases es 2 y se ha optado por la segunda

forma de elegir las semillas.

El entro de un luster se ha de�nido omo la media de los elementos que per-

tene en a di ho luster y la distan ia entre un elemento y un luster se ha de�nido

omo la distan ia eu lídea entre el elemento y el entro del luster.

Por otra parte el algoritmo también permite variar el método de itera ión. Una

posibilidad onsiste en al ular el entro de un luster uando hayamos a abado

de omprobar que todos los elementos están en el luster más próximo; después de

reasignar todos los elementos y al ular el entro del luster repetiremos el pro eso

hasta que no haya ambios. La segunda op ión onsiste en re al ular el entro de

los lusters ada vez que un elemento es ambiado de un luster a otro. En nuestro

aso se ha optado por la segunda op ión.

El algoritmo se puede esquematizar de la siguiente forma: Dados un onjunto

de N sensores = fW

; 1 � k � Ng y los pesos de ada uno de ellos W

ini ializa ión del algoritmo sería la siguiente:

- fmax ()g

- fmin ()g

- � C

= max (C

= min (C

- � fW

Si (jC

j < jC

Fin-Si

Card[C

Ahora omenzaría el pro eso iterativo que va reasignando los elementos al luster

más er ano hasta que estén todos bien situados:

Repetir

ambio - falso

salto luster - falso

Si [(W

) ^ (jC

j < jC

� fW

salto luster - verdad

Si-No Si [(W

) ^ (jC

j < jC

� fW

salto luster - verdad

Fin-Si

Si (salto luster = verdad)

Card[C

ambio - verdad

Fin-Si

Mientras ( ambio = verdad)

donde la fun ión Card [C

℄ denota el número de elementos del luster C

�nalizar este algoritmo tendremos los sensores a tivos en el luster C

y los no a tivos

en el C

La onvergen ia de este algoritmo está demostrada por Selim e Ismail [104℄.

En la �gura 2.6 se puede ver la sele ión realizada sobre el onjunto de sensores

obtenidos en la �gura 2.5. En la parte superior está la parti ión multisensor ompleta

( ompuesta por 98 sensores) seguida de una grá� a en la que se muestran los sensores

ordenados por sus pesos W

de mayor a menor. Con una línea verti al se muestra

la separa ión entre los dos lusters obtenida mediante el algoritmo k-medias. En la

parte inferior se muestran los sensores pertene ientes al luster de a tivos (izquierda)

y al de no-a tivos (dere ha).

PSfrag repla ements

Sensores a tivos (14) Sensores No-a tivos (84)

Figura 2.6: Sele ión de sensores a tivos.

2.3. Modelización de los campos receptivos 21

2.3 Modeliza ión de los ampos re eptivos

Hasta ahora sólo se ha hablado de parti ionar el espe tro de fre uen ias en anales

pero no se ha di ho nada sobre la forma de pro esar la informa ión de esos anales.

Aquí es ne esario apli ar algún modelo que simule (al menos en parte) el omporta-

miento que el SVH tiene al analizar la informa ión de los anales.

En esta se ión se propondrá un modelo que nos permita modelar el omporta-

miento de las élulas simples del órtex frente a estímulos visuales. Por tanto, lo

que en de�nitiva haremos será modelizar los ampos re eptivos de di has élulas.

Esto onsiste en proponer un modelo de fun ión teóri a que ajuste, on un mínimo

error, los ampos re eptivos medidos de forma experimental por distintos autores.

De forma grá� a, el ampo re eptivo lo podemos representar omo una super� ie

bidimensional (x,y,z ), tal que, en ada posi ión (ejes x e y) situamos el nivel de

a tividad de las élulas frente al estímulo (eje z ).

En la literatura rela ionada on modelos de visión per eptual, se pueden en on-

trar multitud de fun iones teóri as que tienen similitudes on los ampos re eptivos

de las élulas simples. Una ara terísti a que tienen todas estas fun iones es la

presen ia de una región entral en la que se produ e una alta respuesta frente al

estímulo, rodeada de varias regiones de in�uen ia negativa. Estas regiones negati-

vas no indi an que la respuesta de las élulas sea negativa, sino que la respuesta de

di has élulas se ve inhibida por la a tiva ión de otras élulas (las entrales). Ini ial-

mente Hubel y Wiesel [50℄ pensaban que sólo había dos o tres regiones inhibitorias

o ex itatorias pero después se ha omprobado que hay más. Gran parte de estas

fun iones están derivadas de la familia de las gaussianas (Koenderink et al. [61℄),

omo por ejemplo diferen ias de gaussianas (Young [126℄, Stork et al. [109℄, Klein et

al. [59℄). Watson [119℄ propuso un esquema en el que usaba unos �ltros similares a

fun iones de Gabor; este esquema sirvió para obtener un modelo, al que denominó

transformada del órtex , que permitía tener una representa ión multies ala de una

imagen asumiendo una separa ión en anales fre uen iales del estímulo visual.

De Valois et al. [23℄, proponen tres alternativas para modelar di hos ampos

(�gura 2.7):

✮ Suma de 2 gaussianas de polaridad invertida on el mismo entro geométri-

o, de forma que tengamos una región ex itatoria en el entro y dos regiones

inhibitorias a los lados.

✮ Suma de 3 gaussianas de forma que la de mayor desvia ión estándar representa

la región ex itatoria entral, y las otras, de polaridad negativa, simulan el

PSfrag repla ements

(A) (B) (C)

Figura 2.7: Modelos de ampo re eptivo propuestos por De Valois et al.. (A) Suma de 2

gaussianas. (B) Suma de 3 gaussianas. (C) Modelo de entro on entrado.

omportamiento de las regiones inhibitorias de los �an os.

✮ El ter er modelo (al que llama de entro on entrado), asume que la respuesta

positiva frente a un estímulo se da sólo en un punto del entro del ampo

re eptivo, formando las regiones inhibitorias la mayor parte del ampo re eptivo

alrededor de di ho punto.

Hay una gran variedad de modelos basados en fun iones de tipo gaussiano (Haw-

ken et al. [46℄, Parker et al. [91℄, Malik et al. [70℄). El punto omún de todas estas

fun iones es que siempre tenemos una región ex itatoria entral (de mayor o menor

amplitud) y regiones inhibitorias laterales.

En esta Tesis se hará uso de fun iones de Gabor omplejas para modelizar los

ampos re petivos. Mar elja [73℄ fué el primero que usó la teoría desarrollada por

Gabor [36℄ para modelizar los ampos re eptivos y a él le siguieron mu hos otros omo

Daugman [19℄, Jones y Palmer [56℄ y Ati k y Redli h [5℄ por ejemplo. Además del

pare ido fun ional de este tipo de fun iones on los ampos re eptivos de las élulas

simples del órtex, hay otra razón importante para usarlas en la modeliza ión y es

que onsiguen minimizar el prin ipio de in entidumbre de Heisenberg. Esto, apli ado

al tema que nos on ierne, signi� a que se puede onseguir una máxima lo aliza ión

de las estru turas presentes en la imagen de forma simultánea en el dominio espa ial

y en el dominio fre uen ial. Esto se tradu e en la minimiza ión el produ to de la

varianza del ampo re eptivo en el dominio espa ial por la varianza de di ho ampo

en el dominio fre uen ial (Daugman [20℄).

Estas fun iones se han usado on éxito en diferentes tareas, omo por ejemplo en

la dis rimina ión de texturas (Fogel et al. [34℄, Sutter et al. [110℄).

Hay otro punto importante a tener en uenta en el omportamiento de las élulas

simples y es que, independientemente del modelo de ampo re eptivo que se propon-

ga, estas élulas tienen un omportamiento no lineal (Mar elja [73℄, Andrews et al.

[4℄, Daugman [19℄) frente a los estímulos que las a tivan. Posteriormente, la salida

de di has élulas se ombina de forma lineal para obtener lo que sería la salida de un

anal orti al.

Como se ha di ho antes, dado un determinado estímulo, on una determinada

fre uen ia espa ial y orienta ión, son varias las élulas simples que se a tivan. Este

onjunto de élulas forma lo que se denomina anal orti al. Dado un estímulo, se ha

omprobado que se a tivan dos élulas adya entes para analizarlo. Estas dos élulas

tienen la pe uliaridad de que sus ampos re eptivos tienen un desfase de 90

(Pollen

et al. [95℄) y podrían ser modelados on dos fun iones de Gabor, una on simetría

par y otra on simetría impar (�gura 2.8 (A) y (B)). Por otra parte, la respuesta

de una élula ha de ser siempre positiva, esto impli a que la informa ión que hay

sobre las regiones inhibitorias del ampo re eptivo no sería analizada, es de ir, las

respuestas negativas son trun adas a ero. Este es uno de los efe tos de no linealidad

que se produ en en estas élulas. En on reto, el trun amiento a ero de las regiones

negativas de los ampos re eptivos se ono e omo efe to de re ti� a ión de media

onda. Foster et al. [35℄ omprobaron que élulas adya entes desfasadas en 180

eran a tivadas por un estímulo de una misma fre uen ia espa ial y orienta ión. Si

observamos el per�l de una fun ión de Gabor on simetría par (o impar) y apli amos

un desfase de 180

podremos observar que estamos obteniendo la misma fun ión pero

on polaridad opuesta. En la �gura 2.8 se puede observar omo afe ta este desfase

al per�l de una fun ión de Gabor, en (A) tenemos la fun ión on 0

de desfase

(simetría par), en (B) podemos verla on un desfase de 90

(simetría impar), en (C)

podemos observar un desfase de 180

(simetría par) y en (D) se observa el desfase de

(simetría impar). De todo esto se obtiene que, dado un estímulo, intervienen

uatro élulas para analizarlo: un primer par on un desfase de 90

(en uadratura

de fase) y un segundo par de polaridad inversa al primero que se en arga de analizar

la informa ión que trun a el primer par debido al efe to de re ti� a ión de media

En de�nitiva, podemos on luir que uatro ampos re eptivos elementales de

diferente simetría y polaridad analizan un subdominio omún en una determinada

orienta ión y fre uen ia espa ial, o lo que es lo mismo, podemos de ir que pares de

élulas simples en uadratura de fase permiten espe i� ar la informa ión de amplitud

y fase para una fre uen ia espa ial y orienta ión, dada una región del espa io visual

(Pollen et al. [94℄).

Por tanto, dado un anal orti al on una orienta ión �, una fre uen ia entral � y

un an ho de banda �, podemos des ribir su respuesta frente a un estímulo f(x; y), en

base a los per�les de las fun iones de Gabor orrespondientes a ada una de las uatro

élulas que son a tivadas. Vamos a llamar

al primer par de élulas adya entes

PSfrag repla ements

(A) (B)

(C) (D)

Figura 2.8: Per�les 3D de fun iones Gabor on diferentes simetrías y desfases. (A) Simetría

par. (B) Simetría impar. (C) Simetría par on desfase de 180

. (D) Simetría

impar on desfase de 180

Célula Campo re eptivo Respuesta

(x; y; �; �; �) p

(x; y; �; �; �)

(x; y; �; �; �) p

(x; y; �; �; �)

(x; y; �; �; �) p

(x; y; �; �; �)

(x; y; �; �; �) p

(x; y; �; �; �)

Tabla 2.1: Campos re eptivos y respuestas de las élulas de un anal orti al.

(en uadratura de fase) y

al otro par de élulas ( on polaridad invertida).

Los ampos re eptivos de di has élulas y sus orrespondientes respuestas pueden

ser des ritos por tanto mediante las fun iones de la tabla 2.1 donde g

(x; y; �; �; �)

(x; y; �; �; �) son fun iones de Gabor par e impar respe tivamente y donde los

(x; y; �; �; �) son las mismas fun iones tras apli arles la re ti� a ión de media onda.

La formula ión de una fun ión de Gabor ompleja es la siguiente:

gb (x; y; �; �; �) =

2��

exp (i (w

y)) (2.5)

donde w

se obtienen de las siguientes expresiones:

= tan �;

= � (2.6)

de esta forma, la parte on simetría par de la Gabor es:

(x; y; �; �; �) =

2��

y) (2.7)

y la impar:

(x; y; �; �; �) =

2��

sin (w

y) (2.8)

Para ver más detalles sobre los parámetros de fun iones de Gabor se puede on-

sultar el apéndi e B.2.

La re ti� a ión de media onda se puede obtener a partir de la formula ión de los

ampos re eptivos mediante las siguientes e ua iones:

PSfrag repla ements

() �g

Primer par Segundo par

RMO RMORMORMO

Figura 2.9: Fila superior: per�l 2D de las respuestas orrespondientes a las 4 élulas simples

que forman un anal orti al. Fila inferior: resultado de apli ar la re ti� a ión

de media onda (RMO).

(x; y; �; �; �) =

(x; y; �; �; �) f(x; y)j+ g

(x; y; �; �; �) f(x; y))

(x; y; �; �; �) =

(x; y; �; �; �) f(x; y)j+ g

(x; y; �; �; �) f(x; y))

(x; y; �; �; �) =

(j�g

(x; y; �; �; �) f(x; y)j � g

(x; y; �; �; �) f(x; y))

(x; y; �; �; �) =

(j�g

(x; y; �; �; �) f(x; y)j � g

(x; y; �; �; �) f(x; y))

En la �gura 2.9 se pueden apre iar los per�les de los ampos re eptivos de las

élulas modelizados mediante fun iones de Gabor y los mismos per�les tras apli arles

la re ti� a ión de media onda. También se puede apre iar el desfase de 90

las élulas orrespondientes a ada par y el desfase de 180

entre los dos pares de

élulas.

Dada la señal de entrada f (x; y) a un anal dado obtendremos una salida p

(x; y)para

ada una de las élulas (i = 1; 2; 3; 4)

Una vez que tenemos las respuestas individuales de ada élula, hemos de usar

un modelo que las ombine y produz a una salida para el anal orti al en onjunto.

Andrews et al. [4℄, Movshon et al. [87℄ y Pollen y Ronner [94℄ demostraron que las

élulas simples realizaban, aproximadamente, una sumatoria lineal de sus respuestas.

De a uerdo a este resultado, podemos ha er uso del siguiente modelo para ombinar

las respuestas no-lineales de ada una de las élulas simples: dado un estímulo f(x; y)

y un anal orti al on parámetros �, � y �, la respuesta de di ho anal, p(x; y), la

vamos a des omponer en dos fun iones, una dada por la suma de los �ltros on

simetría par y otra dada por la suma de los �ltros de simetría impar:

(x; y) = p

(x; y; �; �; �) + p

(x; y; �; �; �) = f(x; y) g

(x; y; �; �; �)

(x; y) = p

(x; y; �; �; �) + p

(x; y; �; �; �) = f(x; y) g

(x; y; �; �; �)

(2.10)

lo que puede ser expresado de la forma:

p(x; y) = f(x; y) gb(x; y; �; �; �) = p

(x; y) + ip

(x; y) (2.11)

o lo que es lo mismo, la salida de un anal orti al la podemos obtener tras

onvolu ionar la señal de entrada on un �ltro de Gabor omplejo uyos parámetros

vienen dados por los del anal orti al que estamos onsiderando. Hasta aquí, se ha

dado una justi� a ión matemáti a del modelo partiendo de eviden ias biológi as y

que apoya la hipótesis de la modeliza ión de los ampos re eptivos mediante �ltros

de Gabor omplejos.

El modelo presentado en esta memoria parte de estas eviden ias para modelar los

ampos re eptivos mediante fun iones de Gabor. Llegados a este punto, el problema

que se plantea es la determina ión de los parámetros de tales fun iones . Si hi iésemos

uso de un enfoque multi anal �jo, es de ir, �jando a priori los anales en los que se

va a dividir el espe tro fre uen ial, sería tarea simple determinar los parámetros

de estas fun iones, ya que estos estarán rela ionados, de una forma más o menos

dire ta, on la posi ión y an ho de banda de los anales. Nuestro problema radi a

en que la parti ión no se �ja a priori y es, por tanto, dependiente de la imagen en

uestión. Esto signi� a que, puesto que los parámetros de las fun iones Gabor están

rela ionadas on los parámetros que de�nen ada anal, no podremos determinarlos

antes de haber realizado di ha parti ión y, por tanto, estos parámetros habrán de ser

también dependientes de la imagen.

En el apéndi e B se pueden ver on ierto detalle los parámetros que podemos

aso iar a una fun ión Gabor. En esta Tesis sólo se va a ha er uso de tres de ellos: la

fre uen ia radial �, la orienta ión � y la es ala espa ial �. Una fun ión de Gabor, se

onstruye modulando una fun ión gaussiana mediante una fun ión de tipo sinusoidal

(seno o oseno). En este trabajo asumiremos que la fun ión gaussiana es isotrópi a

y, por tanto, oin idirán las sigmas (�) espa iales en el eje de la x y en el eje de la y

de la misma, de forma que uando hablemos de es ala (sigma), asumiremos de forma

implí ita que ambas es alas tienen la misma magnitud (�

= �). Por otra

parte, al ser la fun ión gaussiana isotrópi a, no tiene mu ho sentido ha er uso del

ángulo que forma esa gaussiana on respe to al eje horizontal y por tanto podemos

suponer que ese ángulo vale siempre ero.

La idea, por tanto, es ha er uso de una fun ión Gabor, gb(x; y; �; �; �), para

analizar la informa ión ontenida en un determinado anal S de parámetros �

. Para que la fun ión se entre en el análisis de esa informa ión, es obvio que su

entro, en el dominio fre uen ial, dado por � y � ( oordenadas polares) habrá de

estar situado en la misma posi ión que el entro del sensor �

. En la �gura

2.2(B) se puede ver que una fun ión de Gabor, en esen ia, no es más que un �ltro

paso banda sensible a orienta ión. El úni o parámetro que queda por determinar es

la es ala espa ial del �ltro, es de ir, la amplitud del �ltro. Para determinarla se hará

uso de té ni as de autoenfoque que se detallan en el apítulo 3.

2.4 Resumen del modelo de representa ión propuesto

Para �nalizar el apítulo, se muestran, de forma resumida, las hipótesis de partida

y el modelo de representa ión desarrollado.

Partimos de algunas de las propiedades del SVH que se han ido en ontrando a

lo largo de los últimos años. Las más importantes son las siguientes:

✮ La sele tividad frente a orienta ión y fre uen ia espa ial de las élulas simples

del área V1 del órtex visual. Esto inspira la etapa de la parti ión multi anal

del espe tro de fre uen ias.

✮ Las eviden ias de que hay élulas que tienen una respuesta más pronun iada

que otras frente a un estímulo visual. De aquí se deriva la sele ión de sensores

a tivos.

✮ La similitud de los ampos re eptivos de di has élulas, medidos de forma

experimental, on las fun iones teóri as de Gabor. Además, a esto se une

la minimiza ión del prin ipio de in ertidumbre en espa io y fre uen ia omo

onse uen ia del uso de �ltros de Gabor omplejos.

El modelo propuesto se puede esquematizar mediante las siguientes etapas:

✮ Parti ión del espe tro de fre uen ias y sele ión de sensores a tivos:

✬ Obten ión de la parti ión multisensor:

✫ Cál ulo de los índi es de antialiasing �

(�) on i = 0; 1; 2; 3.

✫ Lo aliza ión de los extremos lo ales de las derivadas segundas de los

índi es �

(�).

2.4. Resumen del modelo de representación propuesto 29

En esta etapa se dete tan zonas del espe tro donde se en uentran estru -

turas poten iales de interés. Al �nalizar este paso tenemos un onjunto

de N sensores fS

; 0 � i < Ng que de�nen la parti ión realizada.

✬ Sele ión de sensores a tivos:

✫ Cál ulo del peso relativo,W

, de los sensores a tivos on i = 0; :::; N�

1 para evaluar la importan ia relativa de ada sensor S

✫ Clasi� a ion de los sensores en dos grupos, a tivos y no-a tivos, me-

diante el algoritmo K-medias apli ado sobre los pesos W

Al �nalizar esta etapa tendremos el sub onjunto de sensores on mayor

a tividad: el grupo de sensores a tivos.

✮ Modeliza ión de los ampos re eptivos de los sensores a tivos:

✬ Cada ampo re eptivo será modelado mediante una fun ión de Gabor

ompleja de parámetros � (fre uen ia radial media), � (orienta ión media)

y � (es ala espa ial). La fre uen ia y orienta ión medias estarán de�nidas

por el propio sensor.

✬ Para determinar la es ala se hará uso de la té ni a de autoenfoque en el

dominio de Gabor presentada en el apítulo 3.

En los apítulos 4 y 5 se podrá veri� ar su validez tras su apli a ión a dos tareas

on retas: la dete ión de es alas naturales lo ales y el ál ulo de una medida de

distorsión per eptual.

Capítulo 3

Dete ión de es alas globales

Uno de los prin ipales objetivos de las etapas ini iales de la visión espa ial es a-

ra terizar los ambios de luminan ia que se produ en en la retina de forma que en

los pro esos posteriores se pueda determinar informa ión sobre las ara terísti as

de la es ena que se está visualizando. Para ada ambio de luminan ia, se debería

medir, al menos, la lo aliza ión del ambio, su extensión espa ial y la amplitud de

la dispersión de luminosidad.

El SVH es apaz de enfo ar en el rango orre to de es alas y por tanto puede

lo alizar objetos en una imagen aumentando o disminuyendo el nivel de emborrona-

miento para analizar on más o menos detalle la estru tura de los objetos (Hay et al.

[48℄). Por tanto, para desarrollar un sistema de pro esamiento automáti o de imá-

genes que simule este omportamiento será importante analizar la dependen ia de la

estru tura de una imagen respe to de la resolu ión o es ala de di ha imagen. Pare e

un he ho laro que en el pro eso de per ep ión visual se analizan las imágenes a

distintos niveles de resolu ión simultáneamente (Koenderink [60℄). El problema que

se plantea en este apítulo es la extra ión automáti a de las es alas signi� ativas de

las estru turas de niveles de gris presentes en la imagen, todo ello sin ono imiento

a priori sobre que tipo de estru turas hay o sobre su lo aliza ión. Como demuestra

Gar ía et al. [37℄, el ono imiento de la es ala aso iada a las diferentes estru turas

presentes en la imagen fa ilita el pro esamiento posterior.

Para dete tar las diferentes es alas a las que o urren estru turas de interés en la

imagen varios autores propusieron y desarrollaron el análisis multies ala (Rosenfeld

et al. [99℄, Witkin [124℄, Koenderink [60℄, Babaud et al. [6℄, Yuille et al. [127℄,

Lindeberg [67℄). Apli ando operadores de diferente tamaño a la imagen, el análisis

multies ala re oge la informa ión en un rango dado de es alas. En imágenes natura-

les, no todas las es alas intermedias dentro de un rango son realmente signi� ativas;

32 Capítulo 3. Detección de escalas globales

tan sólo algunas se orresponden on estru turas de interés (Marr [76℄). Por ejemplo,

a un nivel alto de resolu ión, un árbol está ompuesto de hojas on una ompleja

estru tura de venas que las re orren. En el siguiente nivel, ada hoja es una úni a

región y en el siguiente nivel vemos la opa del árbol omo un úni o objeto. Hay un

rango natural de resolu iones que se orresponden on ada uno de esos niveles de

des rip ión. Esto nos lleva a que una misma estru tura se puede interpretar omo

objetos diferentes, dependiendo del nivel de resolu ión elegido para representarla. En

esta se ión nos referiremos al on epto de es ala omo a aquellos niveles naturales de

des rip ión en los uales, un sub onjunto (generalmente distinto) de partes de la es-

ena visual, son interpretados omo objetos re ono ibles por un observador. El he ho

de que se determine una es ala omo signi� ativa no impli a la existen ia explí ita

de un objeto en la imagen sino que puede impli ar la existen ia de una estru tura

que se rea omo onse uen ia de la unión de otras estru turas más pequeñas.

Las té ni as multies ala habituales tienen el gran problema de que la integra ión

de la informa ión resultante del pro esamiento a diferentes es alas no se ha e en base

a ningún ono imiento on reto sobre los niveles de resolu ión a los que se mani�estan

las estru turas en la imagen (Lu et al. [68℄). Puesto que estos métodos representan

ara terísti as en todas las es alas (dis retas) dentro de un rango, habrá una gran

redundan ia entre las imágenes de es alas onse utivas ya que la varia ión entre ellas

es pequeña. Esto ondu e a un pro esamiento ine� iente en etapas posteriores.

En este apítulo se proponen diversas alternativas para la sele ión de es alas

signi� ativas, aunque, en esen ia, todas ellas están basadas en el análisis de la nitidez

de las estru turas presentes en la imagen �ltrada a distintas es alas.

Teniendo en uenta las ara terísti as del SVH en uanto al análisis en paralelo de

diferentes anales espa io-fre uen iales (ver se ión 2.2) (Jones et al. [56℄, Daugman

[21℄, Watt [121℄) se propone un esquema en el que, tras ha er una des omposi ión

del espe tro en anales separados de fre uen ias, se bus arán las es alas signi� ativas

para ada uno de esos anales. Esas es alas, por tanto, harán apare er las estru turas

que se per iben en la imagen y que tengan presentes los omponentes fre uen iales

que hay en ada uno de los anales sele ionados. Las estru turas que somos apa es

de identi� ar no tienen porqué existir en la imagen, por ejemplo, la opa del árbol

no es algo que exista por si mismo en el ejemplo anterior, sino que es una nueva

estru tura que se rea omo onse uen ia de unir las hojas entre si.

El uso de un enfoque multi anal, nos ha permitido identi� ar objetos signi� ati-

vos y segregarlos sin un ono imiento a priori sobre ellos. En esta etapa se trata de

ha er un aprendizaje sobre uál es la es ala ideal para ada uno de esos objetos. El

he ho de separar en anales independientes ada objeto es muy importante ya que

3.1. Detección de escalas significativas 33

de esta forma podemos al ular la es ala sin que unos objetos inter�eran on otros.

3.1 Dete ión de es alas signi� ativas

Una vez que se ha realizado la parti ión del espe tro, tal omo se expli ó en la

se ión 2.2 vamos a pro eder a sele ionar las es alas signi� ativas para ada uno

de los sensores a tivos de la parti ión. En esta se ión se estudiará la sele ión de

es alas signi� ativas ha iendo uso de un esquema de autoenfoque multi anal. En este

aso las té ni as de autoenfoque están basadas en una representa ión de la imagen

dada en el dominio de Gabor.

Las ventajas que tiene este método son que, por una parte, se aprove ha la

formula ión de las fun iones de Gabor para sele ionar aquellas fre uen ias que están

in luidas en ada uno de los sensores evitando así ha er uso de �ltros paso-banda

ideales on los problemas que estos onllevan (efe to de anillado) y, por otra parte,

se ha e uso de una propiedad de las fun iones de Gabor omplejas, y es que permiten

una óptima lo aliza ión simultánea en el dominio espa ial y en el fre uen ial.

3.1.1 Fun iones de enfoque

Para omprender mejor omo se van a apli ar las fun iones de enfoque para la de-

te ión de es alas puede ser útil omentar brevemente el papel que juegan estas

fun iones en mi ros opía. Se puede ver (Groen et al. [45℄) para más detalles sobre

este tipo de fun iones.

El autoenfoque es esen ial en sistemas de mi ros opía automáti os donde se pre-

sentan un gran número de muestras que ne esitan ser digitalizadas y analizadas.

Cuando tenemos muestras multi- apa (en una misma es ena apare en objetos a dis-

tintas profundidades) no es posible tener una imagen en la que estén bien enfo adas

todas las estru turas simultáneamente. Debido a la limita ión de la profundidad

de ampo, si una de las apas está bien enfo ada, el resto estarán desenfo adas en

mayor o menor grado y por tanto se verán emborronadas.

Los algoritmos de autoenfoque bus an el máximo de una fun ión de enfoque.

Esta fun ión es una medida de la alidad del enfoque omo fun ión de la posi ión

axial (eje z ) y estará muestreada en un rango dis reto de posi iones a lo largo del eje

z. La fun ión devolverá un valor que indique la nitidez de la imagen para un punto

de enfoque dado. La distan ia al objeto que se orresponde on el máximo valor de

esta fun ión será la elegida para asegurar un mejor enfoque de la imagen.

El objetivo de esta se ión es desarrollar un método e� iente para la represen-

ta ión de formas de nivel de gris que solu ione algunos de los in onvenientes que

presentan los métodos tradi ionales multies ala.

Si retomamos el ejemplo del árbol, podemos obtener una se uen ia de imágenes

emborronadas mediante un �ltro gaussiano tomando un rango de es alas su� iente-

mente amplio. Para es alas grandes, todas las hojas apare erán omo una úni a masa

emborronada formando lo que sería la opa del árbol. Conforme vamos de re iendo

en la es ala irán apare iendo on más nitidez las hojas separadas entre sí y si segui-

mos disminuyendo de es ala podremos llegar al nivel de detalle de las venosidades

en las hojas. Por tanto debería haber un rango natural de es alas determinado por

los distintos niveles signi� ativos de des rip ión. El punto importante es que para

a es alas naturales, las estru turas orrespondientes estarán bien ontrastadas y así

tendrán un ontorno bien de�nido. Por tanto, para resolver nuestro problema hare-

mos uso de una fun ión de enfoque que medirá la laridad on que son distinguidas

las estru turas de la imagen �ltrada mediante un nú leo gaussiano de es ala �. Pues-

to que estamos asumiendo un modelo de separa ión en anales espa io-fre uen iales

independientes, esta fun ión de enfoque habrá que apli arla sobre ada una de las

imagenes obtenidas tras realizar un �ltrado previo que sele ione los omponentes

fre uen iales que pertenez an a ada anal. Conse uentemente, dado un sensor, ten-

dremos que ha er un �ltrado que restrinja los omponentes fre uen iales afe tados

para posteriormente al ular la fun ión de enfoque propuesta sobre la imagen �ltrada

variando la es ala � en un rango dis reto de valores. Un nivel de emborronamiento �

que produz a un máximo lo al de la fun ión de enfoque será una es ala signi� ativa a

la que apare en estru turas signi� ativas on omponentes fre uen iales en el rango

de�nido por el sensor.

En este estudio se han onsiderado 4 posibles fun iones de enfoque debido a su

simpli idad omputa ional y sus buenas propiedades (Yeo et al. [125℄): Tenengrad,

Brenner, Gradiente uadráti o y Varianza. Con las tres primeras fun iones se estu-

dia el gradiente de la imagen partiendo de la base de que uanto mayor sea di ho

gradiente mejor de�nidos estarán los ontornos.

Puesto que una imagen es, en de�nitiva, algo físi amante observable (la luminan-

ia en fun ión de las oordenadas espa iales), es ne esario que expresemos la es ala

en unidades adimensionales, he ho este que se deriva de la ley de invarianza frente a

es ala (ver Flora k et al. [33℄ para más detalles).

Dada una imagen f(x; y) y un sensor S, vamos a de�nir la respuesta de la imagen

frente al sensor S a es ala � omo:

(x; y; �) = jf(x; y) gb (x; y; �; �

)j (3.1)

donde �

son el ángulo medio y la fre uen ia radial media del sensor S

respe tivamente, y la fun ión gb() es un �ltro de Gabor omplejo de�nido en la e ua-

ión 2.5. De esta forma, al onvolu ionar la imagen on el �ltro de Gabor omplejo

entrado en �

, estamos realizando un �ltrado de aquellas fre uen ias que se

en uentran en el área espe tral o upada por el sensor S. El objetivo es determinar

las es alas naturales óptimas �

, ..., �

para di ho sensor. La opera ión jj obtiene

la envolvente o módulo de la imagen ompleja que se obtiene tras �ltrar on el �ltro

de Gabor y se de�ne omo:

jt(x; y)j =

(x; y) + t

(x; y) (3.2)

Se parte de la idea de que las estru turas espa iales on omponentes fre uen ia-

les en el sensor S deberían apare er mejor ontrastadas uando �ltramos la imagen

f(x; y) a una es ala signi� ativa que uando lo ha emos a una es ala po o signi� a-

tiva. Para determinar la nitidez de las estru turas presentes en una imagen �ltrada a

es ala � haremos uso de los uatro riterios de enfoque men ionados anteriormente.

✮ Criterio de la Varianza

Es de esperar que las es alas signi� ativas aso iadas a las estru turas presentes en un

anal deberán produ ir un alisamiento de la respuesta on mayor varianza de niveles

de gris que los alisamientos a es alas no signi� ativas. Esto sugiere que una posible

fun ión de enfoque sea la varianza de niveles de gris de la imagen dada por:

(�) =

(x; y; �) � �

donde �

es la media de niveles de gris de J

(x; y; �):

N �M

(x; y; �) (3.4)

y donde N y M son los tamaños horizontal y verti al en píxeles de la imagen.

✮ Criterio de Brenner

Con esta fun ión se pretende medir la nitidez de las fronteras de la imagen respuesta.

Una imagen más nítida tendrá unas fronteras mejor de�nidas y, por tanto, si al u-

lamos el gradiente de di ha imagen, tendremos que en los bordes de las estru turas

este tendrá un valor relativamente más elevado. El gradiente es al ulado de una

forma muy simple:

(�) =

(x+ 2; y; �) � J

(x; y; �))

✮ Criterio de Tenengrad

De nuevo, este riterio se basa en el ál ulo del gradiente, aunque se ha e uso de un

operador más so�sti ado que tiene en uenta el gradiente verti al y horizontal:

(�) =

(x; y; �) + S

(x; y; �)

donde S

son las onvolu iones de J

on los operadores de Sobel horizontal

y verti al respe tivamente y que se pueden ver en la tabla siguiente:

-1 0 1 1 2 1

-2 0 2 0 0 0

-1 0 1 -1 -2 -1

es de ir:

(x; y; �) = J

(x; y; �) M

(x; y; �) = J

(x; y; �) M

✮ Criterio del Gradiente uadráti o

Esta fun ión parte de la misma idea que los dos métodos anteriores, pero al ula el

gradiente omo diferen ia entre píxeles adya entes horizontales y verti ales:

(�) =

(x+ 1; y; �) � J

(x; y; �))

(x; y + 1; �)� J

(x; y; �))

Una vez formulados los uatro riterios, el objetivo es en ontrar, para ada uno de

ellos las es alas (�) que los maximizan. La ompara ión entre estas uatro fun iones

se ha he ho teniendo en uenta 3 riterios de evalua ión:

1. La fun ión de enfoque debe de ser omputa ionalmente e� iente.

2. La fun ión de enfoque deberá al anzar máximos en aquellos puntos que se

orrespondan on es alas signi� ativas de estru turas presentes en la imagen y

on ontenido espe tral en el sensor analizado.

3. La fun ión de enfoque ha de ser robusta frente al ruido.

Respe to a la e� ien ia, las uatro fun iones son relativamente sen illas desde el

punto de vista omputa ional y por tanto esta ondi ión se umple sin problema.

El umplimiento del segundo punto se analiza en la se ión 3.1.2 donde se ha e

una dis usión al respe to en base a resultados experimentales.

Para determinar si la fun ión umple o no el ter er objetivo se han realizado una

serie de experimentos que se muestran en la se ión 3.1.3.

En el estudio de éste o de ualquier otro trabajo que entre su aten ión sobre

la sele ión de es alas signi� ativas sin informa ión a priori, hay que tener presente

que estamos ante un problema bastante omplejo y posiblemente intratable desde

un punto de vista puramente matemáti o. Por tanto, las solu iones aquí aportadas

no pretenden ser exa tas ni óptimas, sino sólo una aproxima ión que nos permita

generar unas hipótesis de partida válidas.

3.1.2 Resultados experimentales

Para determinar la validez de las es alas dete tadas por ada uno de los uatro

riterios de enfoque propuestos los apli aremos sobre una imagen sintéti a (se ión

3.1.2.1), y dos imágenes naturales, una biomédi a (se ión 3.1.2.2) y una que ontiene

una galaxia espiral (se ión 3.1.2.3).

3.1.2.1 Imagen sintéti a

En este experimento se pretende ha er un estudio ontrolado sobre la bondad de

las es alas que son apa es de dete tar ada uno de los métodos propuestos. La

imagen en uestión se puede ver en la �gura 3.1. En la misma imagen se pueden

ver, además, los sensores a tivados de la parti ión multisensor. Esta imagen se ha

generado insertando una serie de ír ulos pequeños formando dos grupos de siete.

Cada ír ulo es una pequeña ampana de gauss.

Si ha emos un estudio visual de la imagen podemos distinguir varias estru turas

sin mayor problema. La primera estru tura que somos apa es de separar del resto

son los pequeños ír ulos individuales. Si vemos la parti ión multisensor observamos

que son a tivados uatro sensores, en las uatro orienta iones, de aproximadamante

el mismo rango de fre uen ias espa iales. Cada uno de ellos ontiene la informa ión

PSfrag repla ements

(A) (B)

Figura 3.1: (A) Imagen sintéti a. (B) Sensores a tivos.

Sensor S

8 14 135

8 13 0

6 13 45

7 12 90

Tabla 3.1: Parámetros de los sensores a tivos de la imagen sintéti a.

fre uen ial aso iada a las estru turas del tamaño de las pequeñas bolas. Puesto que

las bolas son isotrópi as son dete tadas en todas las orienta iones. Si seguimos on

nuestro estudio visual, y analizamos la es ena a una es ala superior, podemos ver dos

agrupa iones laras que onstan de siete bolas ada una y si seguimos aumentando

de es ala podemos ver una úni a agrupa ión on una orienta ión de algo más de 90

grados.

Ahora vamos a ver los resultados que propor ionan los métodos bajo estudio. En

la tabla 3.1 se pueden ver los datos numéri os orrespondientes a los sensores a tivos.

En la �gura 3.2 se muestran las fun iones de enfoque para esta imagen y en la

tabla 3.2 se resumen las es alas signi� ativas.

Sensor Varianza Tenengrad Brenner Gradiente C.

2, 11 2 0.5, 6.5, 14, 24.5 2, 3

2, 15.5 2 0.5, 6, 20.5, 24.5 2, 3

2.5 2 0.5, 6, 24.5 2

2.5, 6 2 0.5, 6, 19.5, 24.5 2

3.5 2 0.5, 11.5, 24.5 2

Tabla 3.2: Es alas signi� ativas dete tadas por ada uno de los riterios estudiados para los

sensores a tivos de la imagen sintéti a.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

200000

400000

600000

800000

1.2e+06

1.4e+06

1.6e+06

1.8e+06

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

200000

400000

600000

800000

1.2e+06

1.4e+06

1.6e+06

1.8e+06

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

1.2e+08

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

200000

400000

600000

800000

1.2e+06

1.4e+06

1.6e+06

1.8e+06

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

1.2e+08

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

200000

400000

600000

800000

1.2e+06

1.4e+06

1.6e+06

1.8e+06

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

1.2e+08

1.4e+08

1.6e+08

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 240

500000

1.5e+06

2.5e+06

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

PSfrag repla ements

Figura 3.2: Fun iones de autoenfoque para los sensores de la imagen sintéti a. En la primera

olumna están las fun iones orrespondientes al riterio de la Varianza, en la

segunda las de Tenengrad, en la ter era las de Brenner y en la uarta las del

Gradiente Cuadráti o.

Para ha er una orre ta interpreta ión de los datos mostrados hay que tener en

uenta los on eptos de es ala interna y es ala externa de una imagen (Koenderink

[60℄). Ambas es alas ha en referen ia, respe tivamente, al tamaño mínimo y máximo

que pueden tener las estru turas presentes en la imagen. La es ala interna vendrá

dada por la resolu ión de la imagen y la externa por el tamaño de la imagen. En

mu hos asos se puede ver que se obtienen es alas signi� ativas muy altas, estas no

deberían ser tenidas en uenta debido a que están por en ima de la es ala externa de

la imagen. De igual forma, en determinados asos se obtienen es alas muy pequeñas

que están por debajo de la es ala interna. En nuestro aso on reto, puesto que

estamos ha iendo un análisis sobre un espe tro de fre uen ias parti ionado, estas

es alas estarán a otadas también por las fre uen ias radiales que de�nen ada sensor,

es de ir, en sensores de fre uen ias muy bajas, la es ala interna aumentará y en

sensores de fre uen ias altas la es ala externa disminuirá.

La evalua ión de las fun iones de enfoque se ha e en un rango dis reto de es alas

(en este aso on reto hasta � = 24:5) y en el aso de que la fun ión sea re iente

al �nal de este rango impli a que se mar ará el punto � = 24:5 omo máximo lo al

aunque el máximo de la fun ión se en uentre más a la dere ha del mismo.

En la �gura 3.3 se pueden ver las respuestas que produ en los sensores a tivos

onsiderando las es alas signi� ativas dete tadas por el riterio de Brenner para la

imagen sintéti a. Las imágenes de esta �gura se obtienen �ltrando la imagen original

on fun iones de Gabor que tienen omo parámetros los de los sensores a tivos junto

on las es alas dete tadas.

Obviamente, tras ver los resultados, el riterio que más es alas dete ta es el de

Brenner; la uestión es determinar la alidad de di has es alas. Como punto de

partida podemos partir del análisis visual previo que hi imos sobre esta imagen.

Este riterio es apaz de dete tar las bolas de forma individual (primera olumna de

la �gura 3.3) y las dos estru turas de orden superior men ionadas ( on los sensores

). Además de estos objetos, también realiza otras uniones de bolas, en grupos

de dos y de tres y en diversas orienta iones que también tienen sentido. Los otros

riterios también dete tan las estru turas bási as (bolas individuales) pero no son

apa es de unir di has estru turas para formar agrupa iones on sentido. El úni o

que dete ta algunas de estas es alas grandes es el de la Varianza.

En la �gura 3.4 tenemos algunas de las estru turas que se dete tan on los otros

tres riterios y no on el riterio de Brenner. Estas es alas dete tan las bolas de forma

individual. La es ala en este aso es algo superior a la dete tada por Brenner para

las bolas individuales pero es orre to en ambos asos ya que lo que pretendemos es

dar una aproxima ión para el ál ulo de di has es alas y, en ualquier aso, el sentido

PSfrag repla ements

� = 0:5

� = 0:5 � = 6:5 � = 14

� = 24:5

� = 6

� = 6 � = 20:5

� = 19:5

� = 11:5

Figura 3.3: Es alas dete tadas on el riterio de Brenner.

PSfrag repla ements

� = 2� = 2 � = 2:5� = 2:5

Figura 3.4: Algunas de las es alas dete tadas on el riterio de la varianza.

PSfrag repla ements

(A) (B)

Figura 3.5: (A) Imagen biomédi a. (B) Sele ión de sensores a tivos.

de las es alas es obtener el parámetro ne esario para la fun ión de Gabor de forma

que se per iban estru turas on sentido en la imagen.

Tras estudiar este aso, pare e laro que los riterios de Tenengrad y del Gradien-

te uadráti o no produ en muy buenos resultados ya que se limitan a dete tar las

estru turas bási as que hay en la imagen sin dete tar agrupa iones de las mismas.

Por ontra, Brenner es apaz de realizar distintas agrupa iones de estru turas indi-

viduales para formar estru turas más omplejas que ninguno de los otros riterios es

apaz de onseguir. El riterio de la Varianza dete ta las estru turas individuales y

algunas de las posibles agrupa iones que se pueden extraer de la imagen.

3.1.2.2 Imagen biomédi a

Este experimento es una répli a del anterior pero realizado sobre una imagen natural.

En la �gura 3.5 tenemos una imagen biomédi a de tamaño 128x128 píxeles junto on

la sele ión de sensores a tivos para la misma. Los datos numéri os que re�ejan

di hos sensores a tivos se pueden ver en la tabla 3.3.

En las �guras 3.6 y 3.7 se pueden ver las fun iones de autoenfoque que se obtienen

Sensor S

2 10 135

6 13 90

2 6 90

2 6 45

6 10 0

Tabla 3.3: Parámetros de los sensores a tivos de la imagen biomédi a de la �gura 3.5. Para

ada sensor S (�las) se muestra la fre uen ia radial mínima S

, la fre uen ia

radial máxima S

, el ángulo mínimo S

y el ángulo máximo S

fre uen ias se dan en i los por pixel ( pp) y los ángulos en grados.

3, 23 2.5 3.5, 14.5 2.5

13, 24 4.5, 13 6.5, 24.5 4.5, 13.5

2, 6.5, 24.5 2 2, 7.5 1.5

4 3.5, 9 3, 10, 17.5 3, 9

4.5 3.5 2.5, 18 3.5

2.5, 8.5 2.5 2, 8.5, 23.5 2.5, 5

Tabla 3.4: Es alas de la imagen biomédi a obtenidas para ada sensor y on los uatro ri-

terios de enfoque.

para ada uno de los riterios y sensores a tivos. En la tabla 3.4 se pueden ver las

es alas dete tadas para ada sensor y riterio.

Al igual que o urría en el experimento de la se ión anterior, Brenner es el riterio

on mayor riqueza de es alas sele ionadas y Tenengrad y el Gradiente Cuadráti o

los más pobres. La Varianza dete ta orre tamente las estru turas pequeñas pero de-

te ta menos agrupa iones que Brenner. En la �gura 3.8 se pueden ver algunas de las

imágenes �ltradas para los sensores a tivos y ha iendo uso de las es alas dete tadas

por los uatro métodos. Puesto que las élulas de la imagen son aproximadamente

ir ulares y de un tamaño similar y relativamente grande, es lógi o que tengamos

sensores a tivos en las uatro orienta iones y de fre uen ias bajas. Es en estos senso-

res donde se dete ta la presen ia de las élulas omo estru turas independientes on

una es ala � que varía entre 3 y 4. Además de estas estru turas, también se dete tan

estru turas un po o menores que se orresponderían on los omponentes internos

de las élulas. Finalmente, algunas élulas se unen para rear una nueva estru tura

de mayor tamaño.