INSTITUTO POLITÉCNICO...

82
“RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR DE INFORMACIÓN BIDIMENSIONAL” T E S I S QUE PARA OBTENER EL GRADO DE: MAESTRO EN CIENCIAS EN INGENIERÍA ELECTRÓNICA PRESENTA: ING. RODRIGO TADEO GARCÍA ASESOR DR. FRANCISCO JAVIER GALLEGOS FUNES MÉXICO, D. F., JUNIO DE 2008 INSTITUTO POLITÉCNICO NACIONAL ESCUELA SUPERIOR DE INGENIERÍA MECÁNICA Y ELÉCTRICA SECCIÓN DE ESTUDIOS DE POSGRADO E INVESTIGACIÓN

Transcript of INSTITUTO POLITÉCNICO...

Page 1: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

“RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR DE INFORMACIÓN BIDIMENSIONAL”

T E S I S

QUE PARA OBTENER EL GRADO DE:

MAESTRO EN CIENCIAS EN INGENIERÍA ELECTRÓNICA

PRESENTA:

ING. RODRIGO TADEO GARCÍA

ASESOR

DR. FRANCISCO JAVIER GALLEGOS FUNES

MÉXICO, D. F., JUNIO DE 2008

INSTITUTO POLITÉCNICO NACIONAL

ESCUELA SUPERIOR DE INGENIERÍA MECÁNICA Y ELÉCTRICA

SECCIÓN DE ESTUDIOS DE POSGRADO E INVESTIGACIÓN

Page 2: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico
Page 3: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico
Page 4: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

I

Resumen

La reconstrucción de objetos se considera un área de investigación muy importante. Se han desarrollado distintos modelos formales que permiten a la computadora adquirir el conocimiento que los humanos usan para entender las formas de los objetos y, en cierto modo, comprender éstas como lo hacen los humanos.

El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico como matemático. La importancia de este problema estriba no solo en su valor teórico sino también en sus aplicaciones prácticas. Áreas como la comunicación hombre-máquina y visión artificial para robots de uso industrial, defensa militar, tratamiento médico e investigación geológica requieren de la reconstrucción de 2D a 3D.

En esta tesis mostramos la técnica de reconstrucción de objetos en tres dimensiones por medio de la extracción de contornos, en la cual, los objetos que se desean reconstruir son rebanados y las imágenes en 2D que se obtienen de las rebanadas son tratadas con algoritmos de procesamiento de imágenes para obtener una estructura del objeto en 3D. Posteriormente, esta estructura es visualizada en tercera dimensión empleando técnicas de realidad virtual.

Page 5: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

II

Abstract

The object reconstruction is considered an area of important research. There are developed different formal models that allow to computer to acquire the knowledge needed that the humans use to understand the forms of the objects and in certain way to understand these like the human do it. The problem to change from two dimensions to three dimensions is as much theoretical as mathematician. The importance of this problem consists not only on its theoretical value but also on its practical applications. Areas like the man - machine communication and artificial vision for industrial robots, military defense, medical treatment, and geological investigation need of reconstruction from 2D to 3D. In this thesis we show the reconstruction technique of objects in three dimensions by means of use of the contour extraction, in which the objects that are wanted to reconstruct are sliced and the 2D images that are obtained from the slices are treated by image processing algorithms to obtain a structure of the object in 3D. Then, this structure is visualized in 3D using virtual reality techniques.

Page 6: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

III

ÍNDICE

1. Introducción.

1.1. Introducción a la reconstrucción en 3D. 1 1.2. Objetivo. 3 1.3. Justificación. 3 1.4. Alcance. 3 1.5. Contenido de la tesis. 4 1.6. Bibliografía. 4

2. Estado del Arte.

2.1. Introducción. 5 2.2. Fundamentos de imágenes digitales. 5

2.2.1. Captura de imágenes. 5 2.2.2. Estructura de una imagen. 6 2.2.3. Modelo RGB. 8

2.3. Métodos para reconstruir objetos en tres dimensiones. 8 2.3.1. Proyección de franjas. 9 2.3.2. Interferometría de Talbot. 11 2.3.3. Formas a partir de la visión estereoscópica. 12

2.3.3.1.Geometría del sistema estereoscópico y obtención de la distancia.

15

2.3.4. Formas a partir de variaciones de la intensidad. 17 2.4. Segmentación. 20

2.4.1. Concepto de derivada en la extracción de bordes. 21 2.5. Interpolación. 22

2.5.1. Interpolación bilineal. 23 2.6. Operaciones morfológicas. 23

2.6.1. Principios básicos. 24 2.6.2. Definiciones elementales. 26

2.7. Conclusiones. 26 2.8. Bibliografía. 27

3. Método Propuesto.

3.1. Introducción. 28 3.2. Método para la reconstrucción de objetos en 3D a partir de la

extracción de contornos y el algoritmo Marching cubes.

28 3.3. Adquisición de datos. 29

3.3.1. Captura de imágenes. 29

Page 7: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

IV

3.4. Procesamiento de la imagen. 31 3.4.1. Conversión de imagen RGB a escala de grises. 32 3.4.2. Extracción de bordes. 32 3.4.3. Dilatación. 36 3.4.4. Rellenado de regiones. 37 3.4.5. Supresión de estructuras en la frontera. 39 3.4.6. Erosión. 42

3.5. Construcción de la superficie. 43 3.5.1. Creación de isosuperficie. 44 3.5.2. Iluminación y sombreado. 48

3.5.2.1. Algoritmo de Phong para la iluminación y sombreado. 48 3.5.2.2. Iluminación de una superficie. 51

3.6. Conclusiones. 59 3.7. Bibliografía. 59

4. Resultados experimentales.

4.1. Introducción. 60 4.2. Reconstrucción de objetos a partir de muestras reales. 60

4.2.1. Prueba 1. 60 4.2.2. Prueba 2. 62

4.3. Reconstrucción de objetos a partir de imágenes de Tomografía. 64 4.3.1. Prueba 1. 64

4.4. Discusión de resultados. 66 4.5. Conclusiones. 67 4.6. Bibliografía. 67

5. Conclusiones.

5.1. Conclusiones. 68 5.2. Trabajo a futuro. 69

Page 8: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

V

Índice de figuras

Figura 2.1. Ejemplo de una imagen digital en escala de grises. 7 Figura 2.2. Ejemplo de una imagen digital RGB. 7 Figura 2.3. Tetraedro de color RGB. 8 Figura 2.4. Geometría óptica para el método de proyección de franjas

utilizando luz blanca. 9

Figura 2.5. a) Objeto bajo estudio que corresponde a una salpicadera de VW; b) Relieve recuperado.

11

Figura 2.6. a) Objeto bajo estudio que corresponde a horma de zapato; b) Relieve recuperado.

11

Figura 2.7. Interferómetro de Talbot. 12 Figura 2.8. a) Objeto del cual se desea la topografía: empaque; b) Relieve

recuperado.

12 Figura 2.9. a) Sistema de visión estereoscópica biológico; b) Superposición

de las imágenes en ambos ojos.

14 Figura 2.10. a) Imagen original estereoscópica izquierda; a) Imagen

estereoscópica derecha.

14 Figura 2.11. a) Imagen obtenida por la sustracción de las figs. 2.10(a y b);

b) Imagen estereoscópica.

15 Figura 2.12. Geometría de un par de cámaras en estereo con ejes ópticos

paralelos.

16 Figura 2.13. Geometría de un par de cámaras en estereo con ejes ópticos

paralelos desde una perspectiva superior.

16 Figura 2.14. Tres imágenes sintéticas diferentes de la misma esfera

obtenidas bajo diferentes condiciones de iluminación.

17 Figura 2.15. Ángulo sólido y área proyectada. 18 Figura 2.16. Representación de un vector en un sistema local de

coordenadas mediante el ángulo polar θ y el azimut ϕ.

19 Figura 2.17. Ángulos de iluminación (θi,ϕ i) y observación o proyección

(θe,ϕe).

19 Figura 2.18. a) Imagen original mostrando una línea de exploración

horizontal; b) perfil de intensidad a lo largo de dicha línea.

21 Figura 2.19. Concepto de primera y segunda derivada para la extracción de

bordes.

22 Figura 2.20. Concepto de interpolación. 22 Figura 2.21. Esquema gráfico de la interpolación bilineal. 23 Figura 2.22. Un ejemplo de conjunto de puntos. 25 Figura 2.23. Elementos Estructurales típicos. 25 Figura 2.24. a) Imagen original; b) Traslación por el vector ( )1,0=h . 26 Figura 3.1. Diagrama general de las etapas del método propuesto. 28 Figura 3.2. Tomografías de un cerebro. 29

Page 9: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

VI

Figura 3.3. Esquema de cámara de captura. 30 Figura 3.4. Alineación de cámara. 31 Figura 3.5. Proceso para la conversión de una RGB a una imagen escala

de grises.

33 Figura 3.6. a)Imagen original; b) Imagen de la magnitud del gradiente; c)

Imagen binarizada considerando un umbral T de 80 para la magnitud del gradiente; d) Imagen del ángulo del gradiente.

35 Figura 3.7. a) Región de la imagen de dimensión 3x3; b) Máscara usada

para obtener xG en el punto central de la región 3x3; c) Máscara usada para obtener yG en el mismo punto. Estas mascaras se denominan operadores de Sobel.

35 Figura 3.8. Imagen Elemental. 35 Figura 3.9. a) Imagen Original; b) Resultado de aplicar la máscara de la

figura 3.7(b) para obtener xG ; c)Resultado de aplicar la máscara de la figura 3.7(c) para obtener yG ; d) Imagen de Gradiente completa obtenida utilizando la ecuación (3.4); e) y f) Imagen binarizada utilizando la ecuación (3.6). T=10 y T=20 respectivamente.

37 Figura 3.10. Ejemplo de dilatación. 37 Figura 3.11. Dilatación fila por fila. 38 Figura 3.12. a) Imagen original; b) Imagen original binaria; c) Dilatación

como una expansión en cruz.

39 Figura 3.13. Proceso de rellenado de una región. 40 Figura 3.14. a) Imagen dilatada; b) Imagen rellenada. 40 Figura 3.15. a) Conectividad de 4; b) Conectividad de 8; c) Estructuras

formadas a partir de una conectividad de 4; d) Estructuras formadas a partir de una conectividad de 8.

41 Figura 3.16. a) Imagen rellenada; b) Imagen sin estructuras en el marco. 41 Figura 3.17. Erosión. 42 Figura 3.18. Erosión gráfica con un elemento estructural simétrico. 43 Figura 3.19. Erosión de una imagen. 43 Figura 3.20. Cubo lógico. 44 Figura 3.21. Cubo lógico con 7 vértices por encima del umbral y uno por

debajo.

45 Figura 3.22. Numeración de vértices y aristas de un cubo lógico. 45 Figura 3.23. a) Cubo lógico y su complemento, b) Cubo lógico y su rotación. 46 Figura 3.24. Quince casos efectivos de un cubo lógico. 47 Figura 3.25. Construcción de una superficie. 47 Figura 3.26. Diagrama de reflexión. Los vectores son N (normal de

superficie), L (fuente de luz), R (reflexión) y V (dirección de visión).

49 Figura 3.27. Diagrama de reflexión en dos superficies. 50

Page 10: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

VII

Figura 3.28. Explicación gráfica de la fórmula de Phong. 51 Figura 3.29. Normal de una superficie. 52 Figura 3.30. Ubicación del vector L. 54 Figura 3.31. Diagrama para el calculo del vector R. 55 Figura 3.32. Proyección de m en L. 56 Figura 3.33. Ubicación del observador V. 57 Figura 3.34. Iluminación de una superficie. 58 Figura 4.1. Objeto usado para la prueba 1 (papa). 60 Figura 4.2. Muestra de imágenes de rebanadas (papa). 60 Figura 4.3. Reconstrucción con a) 17 rebanadas, b) 33 rebanadas y c) 65

rebanadas.

61 Figura 4.4. Objeto usado para la prueba 2 (manzana). 62 Figura 4.5. Muestra de imágenes de rebanadas (manzana). 62 Figura 4.6. Reconstrucción con a) 12 rebanadas, b) 21 rebanadas y c) 43

rebanadas. 63

Figura 4.7. Muestra de imágenes de Tomografía. 64 Figura 4.8. Reconstrucción con a) 30 rebanadas; b) 14 rebanadas y c) 10

rebanadas. 65

Figura 4.9. Diferentes vistas de la cabeza reconstruida. 66

Page 11: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

VII

Índice de tablas

Tabla 4.1. Parámetros usados en la prueba 1. 61 Tabla 4.2. Parámetros usados en la prueba 2. 63 Tabla 4.3. Parámetros usados en la prueba de Tomografía. 64

Page 12: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

IX

Nomenclatura

4321 ,,, aaaa Factores de ponderación. B Elemento estructural.

b Distancia entre los centros de proyección.

d Disparidad.

f Longitud focal efectiva de cámara.

yx GG , Gradiente de los elementos en x y y de una imagen, respectivamente.

nIII L21, Funciones de intensidad.

DI II , Planos de imagen izquierdo y derecho.

pa III ,, Intensidad total, ambiental y de la fuente de luz, respectivamente.

( )kji ,, Coordenadas de un píxel o vértice.

sda kkk ,, Coeficientes de reflexión ambiente, difusa y especular, respectivamente.

VRNL ,,, Vectores unitarios de la fuente de luz, la normal, la reflexión especular y del observador, respectivamente.

m Proyección del vector L en N.

O Origen.

DI OO , Centros de proyección izquierdo y derecho.

0p Periodo de la rejilla proyectada.

DI PP , Punto de imagen izquierdo y derecho.

VISTALUZ PP , Ubicación de la fuente de luz y del observador.

Q Punto de una superficie.

T Umbral de borde.

321 ,, VVV Vértices de un triángulo en el espacio.

Page 13: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

X

ZYX ,, Ejes de coordenadas.

CX Complemento de X.

921, zzz L Operadores de Sobel.

nzzz L21, Funciones de superficie. α Ángulo que se forma con la normal de la rejilla proyectada y el eje

óptico o ángulo entre los vectores R y V. ( )xφ Transformación morfológica de x.

η Índice de brillantez.

λ Longitud de la onda de iluminación.

θ Ángulo polar o ángulo entre los vectores N y L o N y R.

ee ϕθ , Ángulos de observación o proyección.

ii ϕθ , Ángulos de iluminación.

ϕ Ángulo azimut.

v Frecuencia de la rejilla de difracción.

⊗⊕, Dilatación y erosión.

Page 14: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL I. INTRODUCCION

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

1

I. Introducción 1.1. Introducción a la reconstrucción en 3D.

La reconstrucción en tres dimensiones (3D) es el proceso mediante el cual, los objetos reales son reproducidos en la memoria de una computadora, manteniendo sus características físicas de dimensión, volumen y forma. El problema puede enfocarse como la relación entre una imagen en un sistema de coordenadas 2D, y un objeto en un sistema de coordenadas en 3D. Existen algoritmos de orientación para resolver este problema: arriba-abajo y abajo-arriba [1].

Los algoritmos arriba-abajo construyen un conjunto de suposiciones y propiedades esperadas a partir de un cierto conocimiento aplicable. Esas propiedades se verifican en los diferentes niveles de procesamiento en la dirección arriba-abajo hasta llegar a la imagen de datos. En este caso, la comprensión de la imagen es un modelo de verificación interno, de forma que el modelo es aceptado o es rechazado. Por ejemplo, imaginemos un gran hotel con un gran estacionamiento en el que se encuentra cierto coche. Desde la ventana de una habitación se divisa el estacionamiento, siendo el objetivo la localización del coche desde la ventana. La primera meta es encontrar el estacionamiento. Una submeta puede ser detectar todos los coches del color y marca del coche a detectar y decidir cuál de éstos corresponde a las especificaciones del coche dado. Todas las submetas pueden conseguirse utilizando modelos generales (conocimiento general) de coches, colores, marcas y modelos. Si las submetas se van consiguiendo al final habrá que decidir en base a un conocimiento específico de nuestro coche, de forma que el coche seleccionado sea aceptado o no. Si es rechazado habrá que comenzar la búsqueda en algún nivel superior, por ejemplo buscando otro del mismo modelo y color.

El algoritmo abajo-arriba comienza en la imagen mediante su segmentación para

extraer la información que puede ser útil en posteriores procesos, a continuación describe las regiones que pueden corresponder con objetos reales o partes de los objetos para llegar al reconocimiento de éstos, lo que se conoce como comprensión de la imagen (image understanding) [2]. La técnica abajo-arriba fue propuesta por Marr, que fue uno de los pioneros en el estudio de la visión por computadora. Marr sostiene que un sistema de visión por computadora es un ejemplo de un dispositivo de procesamiento de información con tres niveles [3]: 1) La teoría computacional. Describe lo que se supone que va a hacer el dispositivo, qué información proporciona procedente de otra información de entrada y describe la lógica de la estrategia que realiza esta tarea. 2) La representación y el algoritmo. Describe cómo se procesa y se representa la información, y qué algoritmos lo realizan.

Page 15: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL I. INTRODUCCION

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

2

3) La implementación. Es la realización de los algoritmos en software o hardware.

El planteamiento consiste en la delimitación de las superficies, luego a la descripción de características y finalmente a la descripción 3D. Estas transformaciones están determinadas desde la imagen 2D, a lo que Marr denomina el bosquejo principal completo (full primal sketch), luego al bosquejo 2.5D (two-and-a-halfdimensional sketch: 2.5D sketch) y de aquí a la representación en 3D.

El bosquejo principal completo consiste en la detección de cambios de intensidad en la imagen. Lo primero consiste en localizar estos cambios mediante el uso de un operador Gaussiano para crear una imagen después de la cual se extraen los puntos de borde o contorno mediante el operador Laplaciano [4]. Se utilizan diferentes valores de desviación estándar, es decir a diferentes escalas. La persistencia de un borde en las diferentes escalas proporciona la evidencia de una característica física en la escena 3D. Para finalizar, los puntos de borde se agrupan de acuerdo a su localización y orientación, para obtener información de ciertas estructuras subyacentes en la imagen (bordes, barras, etc.), que son agrupadas y que posteriormente pueden proporcionar información sobre la orientación de las superficies 3D.

El bosquejo 2.5D reconstruye las distancias relativas a partir de las superficies detectadas en la escena y puede denominarse mapa de profundidad [5]. Para la salida de esta etapa se utilizan las entradas de la etapa anterior, pero en sí misma no proporciona la reconstrucción 3D (en este sentido está a medio camino entre la representación 2D y 3D, de ahí su nombre), en particular todavía no se puede afirmar nada sobre los otros lados de cualquier objeto. Existen varias vías para llegar al 2.5D, siendo su hilo conductor la estrategia abajo-arriba sin utilizar ningún conocimiento sobre el contenido de la escena sino simplemente ciertas pistas adicionales tales como la naturaleza de la luz o los efectos del movimiento.

Una vez vistos los dos enfoques más comunes el objetivo es conseguir la forma, esto es, las superficies y su orientación 3D. Con tal propósito, existe una familia de técnicas denominadas formas a partir de X, donde X representa un cierto número de opciones. La teoría de Marr está basada en el sistema de visión humano, donde la profundidad de los objetos es obtenida a partir de las imágenes de la retina. Son varios los métodos para obtener una representación de la escena 3D, a saber: -Formas a partir de variaciones de la intensidad. -Formas a partir de la visión estereoscópica. -Formas a partir del movimiento. -Formas a partir de las texturas. - Formas a partir del enfoque. -Geometría fractal.

Page 16: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL I. INTRODUCCION

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

3

El concepto de obtención de la forma varía de unos métodos a otros: mientras que en unos, la forma se refiere a la obtención de la orientación de las superficies a través del gradiente de las mismas o de sus perpendiculares en los puntos de la superficie (formas a partir de las variaciones de intensidad, o de la textura mediante proyección perspectiva); en otros, la forma se refiere a la obtención de la estructura 3-D o distancias desde un sistema de referencia a los puntos de las superficies (formas a partir de la visión estereoscópica, del movimiento o del enfoque) y en otros a la obtención de los ángulos de inclinación y sesgo (formas a partir de la textura mediante proyección ortográfica). 1.2. Objetivo.

El objetivo principal de esta tesis es implementar algoritmos de procesamiento de imágenes para la reconstrucción de objetos en 3D a partir de información bidimensional. Los objetivos específicos de este trabajo son los siguientes:

1. Utilizar la técnica de extracción de contornos adecuada para la implementación de ésta al proyecto de tesis.

2. Aplicar una técnica de segmentación para el propósito de la extracción de contornos.

3. Implementar un algoritmo para la visualización de los objetos en tres dimensiones. 1.3. Justificación.

En la actualidad, un gran numero de objetos (por ejemplo, un automóvil, un reloj, una bota de esquiar, el cráneo humano, etc.) están diseñados con formas sumamente complejas que son imposibles de describir mediante formulaciones matemáticas sencillas, la copia de una creación, que por definición es única, permite a un gran número de personas beneficiarse de dicha creación, es por ello que muchos de los productos fabricados en serie parten de un prototipo o modelo único que sirve de patrón para lanzar la producción. De aquí nace la idea de crear copias virtuales de los objetos o reconstruirlos en 3D. Hay muchas técnicas de reconstrucción de objetos en 3D, pero la mayoría requieren de recursos elevados, por lo anterior se propone la reconstrucción de objetos empleando técnicas de segmentación orientadas a contornos. 1.4. Alcance.

El alcance para este proyecto de tesis, es obtener la reconstrucción en 3D de un objeto a partir de alguna de las técnicas de reconstrucción de visión artificial e implementar los algoritmos óptimos para la técnica de reconstrucción elegida.

Page 17: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL I. INTRODUCCION

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

4

1.5. Contenido de la tesis. En el Capítulo 2 se muestra la estructura de una imagen, es decir, su interpretación de manera digital y los tipos de formatos que existen. También se presenta un panorama general de lo que son las técnicas de reconstrucción en 3D, segmentación, interpolación y operaciones morfológicas.

En el Capítulo 3 se presentan los algoritmos utilizados para la reconstrucción de objetos en 3D, el cual está basado en la reconstrucción por medio de la extracción de contornos.

El Capítulo 4 muestra los resultados experimentales realizados mediante el uso de los

algoritmos propuestos. También se presentan distintos objetos reconstruidos en 3D y las ventajas y desventajas del método propuesto.

En el Capítulo 5, se presentan las conclusiones obtenidas a partir de los resultados

mostrados en el Capítulo 4. 1.6. Bibliografía. [1] P. Rubio, “Un algoritmo eficiente para la búsqueda de correspondencias en visión

estereoscópica”, Informática y Automática, 26, 5-15, 1993. [2] D. Marr, Vision, W.H. Freeman & Co., San Francisco, 1982. [3] D. Marr, La visión, Alianza Editorial, Madrid, 1985. [4] T. Poggio, Cooperative computation of stereo disparity, Science, 194, 283-287, 1976. [5] G. Pajares, J. M. de la Cruz, Visión por Computador, Alfaomega, 2002.

Page 18: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL II. ESTADO DEL ARTE.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

5

II. Estado del Arte 2.1. Introducción.

En este capítulo se presenta de forma general cómo se adquiere una imagen, sus componentes y su estructura, se da una breve explicación de lo que es el espacio de color RGB, además se explican de manera ilustrativa técnicas de reconstrucción en 3D, las cuales se consideran las más representativas o afines al método propuesto en esta tesis, y finalmente se explican conceptos como segmentación, operaciones morfológicas e interpolación usados en las técnicas de reconstrucción. 2.2. Fundamentos de imágenes digitales.

El procesamiento digital de imágenes es el conjunto de técnicas que se aplican a las imágenes digitales con el objetivo de mejorar la calidad o facilitar la búsqueda de información [1].

El interés de los métodos de procesamiento de imágenes digitales se fundamenta en dos áreas principales de aplicación: a) Mejor calidad para la interpretación humana; b) Procesamiento de los datos de la escena para la percepción autónoma de las máquinas. En el intento por dotar a las máquinas de un sistema de visión aparece el concepto de visión artificial. En la mayoría de los sistemas, la capacidad sensorial de la visión es complementada con mecanismos sensoriales tales como: detectores de alcance de profundidad o de proximidad [1]. Desde una perspectiva general, la visión artificial es la capacidad de la máquina para ver el mundo que le rodea, más precisamente para deducir la estructura y las propiedades del mundo tridimensional a partir de una o más imágenes bidimensionales. 2.2.1 Captura de imágenes.

La generación de una imagen en un tiempo particular conlleva el muestreo de la imagen definida de forma continua en un conjunto discreto de localizaciones del plano de la imagen y luego la cuantización de dicha muestra. Esto es, determinar el valor de la imagen continua en cada una de las diferentes localizaciones discretas de la imagen (cada valor localizado de forma discreta se denomina muestra de la imagen) y luego asignar a cada muestra una etiqueta entera discreta, que es representativa del rango en el que varía la muestra [2]. Una vez hecha esta cuantificación se obtiene una imagen digital, que es como se representa en la computadora, es decir, tendremos una matriz de números enteros en la cual cada valor entero representa la reflectancia de los objetos de la escena en un tiempo discreto y en un punto discreto del plano de la imagen.

Page 19: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL II. ESTADO DEL ARTE.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

6

Los principales dispositivos para la captura de imágenes usados para la visión artificial son las cámaras de televisión y los dispositivos de acoplamiento de carga (CCD). Los primeros producen una señal continua de vídeo, en donde el número de líneas (propio de cada sistema de video) y la frecuencia de muestreo originan lo que se conoce como nivel de resolución espacial, el muestreo espacial junto con la cuantización en amplitud origina la imagen digital. En cuanto a los dispositivos CCD, que generalmente producen una señal continua de video, cabe distinguir dos categorías: sensores de exploración de línea y de área. Un sensor CCD de exploración de línea consta de una fila de M elementos semiconductores llamados photosites. Los fotones procedentes de la escena excitan el elemento semiconductor, de forma que el grado de excitación es proporcional a la intensidad luminosa o reflectancia en ese punto. Una imagen en este tipo de sensores se obtiene cuando se han captado N imágenes lineales. Este tipo de sensores tiene una gran aceptación en aplicaciones donde los objetos se mueven en dirección perpendicular a la dirección de captura del sensor, de suerte que dicho movimiento produce la imagen bidimensional. Los sensores de área son similares a los de exploración de línea, pero con la diferencia que los photosites se agrupan en forma de matriz con M elementos por fila y N elementos por columna.

Independientemente del tipo de sensor utilizado, la imagen que ha de ser tratada por la computadora se presenta digitalizada espacialmente en forma de matriz con una resolución de MxN elementos. Cada elemento de la matriz, denominado píxel (Picture element), tendrá un valor asignado que corresponde con el nivel de luminosidad del punto correspondiente en la escena captada, dicho valor es el resultado de la cuantización de intensidad o nivel de gris. Los términos intensidad y nivel de gris se suelen usar indistintivamente. 2.2.2. Estructura de una imagen

Una imagen digital en escala de grises es una matriz de MxN elementos numéricos cuyos valores posibles van del 0 (negro) al 255 (blanco), siendo este número la intensidad luminosa en determinado punto o píxel. Por convención el origen de la imagen se encuentra en el extremo izquierdo superior y para su procesamiento los valores son normalizados, tal como se muestra en la Figura 2.1 [3].

Una imagen digital a colores está formada por tres matrices de MxN elementos

numéricos cuyos valores posibles van del 0 (negro) al 255 (blanco), cada elemento numérico representa la intensidad luminosa en cada una de las bandas espectrales del RGB (Rojo, Verde, Azul), de cada punto o píxel. A diferencia de las imágenes en escala de grises, las imágenes a color requieren de la combinación de las tres bandas de color para representar el color de un píxel (ver Figura 2.2). Por ejemplo, un determinado punto blanco de una imagen en escala de grises se describiría: P(x, y) = 255, sin embargo en una imagen a colores para describir el color del mismo punto se realizaría así: P(x, y) = (255,255,255), esto debido a que el (0,0,0) corresponde al negro absoluto y el (255,255,255) al blanco absoluto [2].

Page 20: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL II. ESTADO DEL ARTE.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

7

Figura 2.1. Ejemplo de una imagen digital en escala de grises

Figura 2.2. Ejemplo de una imagen digital RGB

Valores de la imagen normalizados

Origen

y

x

Valores de la imagen normalizados

Page 21: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL II. ESTADO DEL ARTE.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

8

2.2.3. Modelo RGB

En el modelo RGB cada color aparece en sus componentes espectrales primarios; rojo verde y azul [3]. Este modelo esta basado en el sistema de coordenadas cartesianas. El subespacio de color de interés es el tetraedro mostrado en la Figura 2.3, en el cual, los valores RGB están en 3 vértices; cyan, magenta y amarillo, el negro corresponde al origen y el blanco al vértice mas alejado del origen. En este modelo, la escala de grises se extiende desde el negro al blanco a lo largo de la diagonal que une esos dos puntos, y los colores son puntos dentro del tetraedro, definidos por vectores desde el origen. Por conveniencia, se asume que todos los vectores han sido normalizados, de modo que el tetraedro de la Figura 2.3 es el tetraedro unitario, es decir, todos los valores de R, G y B están en el rango [0,1]. Las imágenes de este modelo se forman por la combinación en diferentes proporciones de cada uno de los colores primarios RGB. Esto es lo que ocurre en los fotosensores de los monitores o de las videocámaras.

Figura 2.3. Tetraedro de color RGB. Los puntos a lo largo de la diagonal principal tienen valores de gris, desde el negro en el origen (0,0,0) al punto (1,1,1).

2.3. Métodos para reconstruir objetos en tres dimensiones.

Además de las aplicaciones de la digitalización en ingeniería inversa (por ejemplo, réplicas de modelos, ingeniería de producto, inspección dimensional, control de calidad, aplicaciones avanzadas de ingeniería), se pueden mencionar las aplicaciones médicas, arte y restauración, comercio electrónico, aplicaciones multimedia, aplicaciones avanzadas, etc., [4]. De lo mencionado anteriormente se intuye la importancia de las técnicas de digitalización, que son clasificadas en dos grandes grupos: sistemas con contacto (digitalizadores mecánicos) y sin contacto (digitalizadores láser y sistemas de visión óptica) [5].

Azul

Verde

Escala de Grises

Blanco

Negro

Cyan

Magenta

Amarillo

B

R

(0,1,0) G

(0,0,1)

Rojo (1,0,0)

Page 22: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL II. ESTADO DEL ARTE.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

9

Entre las técnicas sin contacto están la técnica de proyección de franjas e interferometría Talbot. La adquisición de datos se realiza mediante la obtención de la fase por técnicas de detección sincrónica espacial (método directo) [6] o desplazamiento de fase y obtención de los parámetros del sistema óptico, los cuales están involucrados en el vector de sensibilidad, obteniendo así las dimensiones de topografía del objeto analizado en coordenadas reales. 2.3.1. Proyección de Franjas.

La Figura 2.4 muestra la geometría óptica donde se puede obtener la relación de la altura del objeto bajo estudio ( )z∆ . Se proyecta una rejilla de Ronchi [7] con sus líneas paralelas al eje y, el eje z coincide con la dirección de observación y el plano xy (z = 0) es un plano de referencia, es decir, la altura es igual a 0 en este plano. La normal de la rejilla proyectada hace un ángulo α con respecto al eje óptico. La superficie es entonces iluminada por una iluminación incoherentemente y cosenoidal producida por la rejilla de Ronchi y observada por una cámara CCD en la normal del plano xy.

Figura 2.4. Geometría óptica para el método de proyección de franjas utilizando luz blanca.

La distribución de intensidad observada en la normal del plano xy es [7],

( ) ( )⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

⎥⎦

⎤⎢⎣

⎡−⎟⎟

⎞⎜⎜⎝

⎛+= απ tan2cos1, 11 zx

pKyxI (2.1)

donde αcos0pp = , K es una constante, ( )yxzz ,11 = y p0 es el periodo de la rejilla proyectada.

Si se tiene una segunda superficie ( )yxzz ,22 = , la cual puede representar una desviación con respecto a una superficie de referencia z1, (la cual es plana), su intensidad es representada por

Page 23: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL II. ESTADO DEL ARTE.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

10

( ) ( )⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

⎥⎦

⎤⎢⎣

⎡−⎟⎟

⎞⎜⎜⎝

⎛+= απ tan2cos1, 22 zx

pKyxI . (2.2)

Las distribuciones de intensidad (2.1) y (2.2) son representadas por señales de voltaje V1

y V2 en la PC, respectivamente. Haciendo contorneo electrónico de Moire, la imagen de video resultante es proporcional a

( ) ( )⎥⎦

⎤⎢⎣

⎡−⎟⎟

⎞⎜⎜⎝

⎛−⎥

⎤⎢⎣

⎡−⎟⎟

⎞⎜⎜⎝

⎛=−∝− απαπ tan2costan2cos 212121 zx

pzx

pIIVV . (2.3)

Sustituyendo p en función de p0, la ecuación (2.3) llega a ser [8],

( ) ( )⎥⎦

⎤⎢⎣

⎡−⎟⎟

⎞⎜⎜⎝

⎛−⎥

⎤⎢⎣

⎡−⎟⎟

⎞⎜⎜⎝

⎛=−∝− ααπααπ senzx

psenzx

pIIVV 2

01

02121 cos2coscos2cos . (2.4)

De la identidad trigonométrica ( ) ( )BAsenBAsenBA −+=−212coscos , (2.4) puede

escribirse como [8]

( ) ( )⎥⎦

⎤⎢⎣

⎡⎟⎠⎞

⎜⎝⎛ +

−×⎥⎦

⎤⎢⎣

⎡−=− ααπαπ sen

zzx

psensenzz

psenII

2cos2 12

012

021 . (2.5)

La ecuación (2.5) representa el patrón de franjas proyectado originalmente pero

desplazado en fase y modulado en amplitud por el factor ( ) ⎥⎦

⎤⎢⎣

⎡− απ senzz

psen 12

0

.

La función de modulación corresponde a las franjas de Moire, teniendo un mínimo

cuando

( ) παπ nsenzzp

=− 120

(2.6)

donde n es un entero y el intervalo de contorno está dado por

αsen

pz 0=∆ . (2.7)

La fase del objeto es obtenida aplicando la técnica de detección sincrónica espacial

(conocida como detección directa de la fase). La Figura 2.5 presenta una salpicadera de

Page 24: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL II. ESTADO DEL ARTE.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

11

carro digitalizada con esta técnica. La Figura 2.6 muestra una horma de calzado, sólo que en este caso, se obtuvo información en los 360° del objeto al ser rotado éste con respecto al eje y [9]. En este caso, el objeto es colocado sobre una mesa motorizada giratoria de alta resolución (0.01°) y se le proyecta un patrón de franjas de Ronchi en cada desplazamiento angular.

Figura 2.5. a) Objeto bajo estudio que corresponde a una salpicadera de VW; b) Relieve recuperado.

Figura 2.6. a) Objeto bajo estudio que corresponde a una horma de zapato; b) Relieve recuperado.

2.3.2. Interferometría de Talbot.

En el fenómeno de Talbot [10], (conocido como auto-imágenes o imágenes de Fourier), no requiere de componentes ópticos para formar una imagen. El efecto de auto-imágenes se debe a la propiedad de las rejillas de difracción que, cuando son iluminados por un frente de ondas coherente y monocromático, se forman imágenes fieles de ellas sin necesidad de componentes ópticos. Los planos de Talbot son equidistantes y están localizados a distancias ( )λ2vN del objeto, donde N = 1,2,3,…, es el orden de los planos de Talbot, v es la frecuencia de la rejilla de difracción y λ es la longitud de onda de iluminación. La interferometría de Talbot utiliza una de las auto-imágenes como una rejilla proyectada sobre el objeto, la cual se deforma de acuerdo a la topografía del objeto. La rejilla deformada es captada con una CCD y superpuesta con una rejilla física o sintética [11] de

a) b)

a) b)

Page 25: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL II. ESTADO DEL ARTE.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

12

la misma frecuencia que la rejilla física usada para generar las auto-imágenes, obteniendo un patrón de moire de la información del relieve del objeto. La distancia entre franjas del patrón representa la variación en profundidad de la muestra bajo estudio correspondiente a la dirección z. Al considerar un estado de referencia y uno deformado donde las fases de patrones de franjas son moduladas respectivamente por (2.1) y (2.2), el intervalo de contorno esta dado por (2.7), donde p0 es el periodo de la rejilla que genera la auto-imagen.

La Figura 2.7 muestra el arreglo (v = 50 líneas/plg, α =14.5°) utilizado para obtener la

forma de un empaque que es mostrada en la Figura 2.8.

Figura 2.7. Interferómetro de Talbot para obtener la topografía del objeto mostrado en la Figura 2.8.

Figura 2.8. a) Objeto del cual se desea la topografía: empaque; b) Relieve recuperado

Las técnicas ópticas de reconstrucción 3D son una tecnología no invasiva que alcanzan

excelentes resoluciones y son útiles en labores de inspección o supervisión, siendo cuantitativamente más objetivas, fiables y consistentes que la inspección humana. Según las propiedades del objeto tales como: tamaño, forma y tipo de material se elige una técnica de reconstrucción adecuada en función de la resolución deseada. 2.3.3. Formas a partir de la visión estereoscópica.

La visión estereoscópica constituye un procedimiento para la obtención de la forma de los objetos en la escena [12]. En este caso la forma se determina a través de la distancia de

a) b)

Page 26: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL II. ESTADO DEL ARTE.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

13

los objetos en relación con un sistema de referencia. La obtención de la distancia ha sido una preocupación constante en algunos sistemas, particularmente en los diseñados para la navegación robótica, donde el robot necesita conocer en cada momento la estructura de la escena para navegar en el entorno. Con tal propósito se han desarrollado técnicas y dispositivos, a saber [3]: a) Los sensores de ultrasonido, que utilizan la energía acústica. b) Triangulación, una fuente de luz emite un haz con un cierto ángulo que al incidir sobre una superficie es reflejado, el haz reflejado es recogido por un detector. Al estar la fuente y el detector separados una cierta distancia se obtiene un triángulo con el haz incidente y reflejado con lo que se puede conocer la distancia del objeto. c) Luz estructurada, consiste en proyectar una configuración de luz (lámina de luz generada con una lente cilíndrica o hendidura estrecha, láser). La distorsión de la luz es captada por una cámara de visión y con ello se puede obtener la distancia. d) Telémetro de tiempo de vuelo, basado en láser o en ultrasonido, determinan la distancia de los objetos midiendo el tiempo que tarda la onda en retornar, sabiendo a la velocidad con la que viajan las ondas se puede determinar la distancia. e) Visión estereoscópica artificial, donde dos o más cámaras captan la misma escena y por triangulación se determina la distancia.

Entre los métodos y técnicas anteriores, podemos diferenciar los métodos activos y pasivos. Los métodos activos son aquellos que intervienen externamente sobre la escena, iluminándola o enviando un haz energético. Por el contrario, los pasivos no actúan sobre la escena. A la categoría de activos pertenecen los apartados a), b), c) y d), mientras que a la categoría de pasivos pertenece la visión estereoscópica.

La visión estereoscópica artificial toma como referencia el modelo estereoscópico

biológico, donde el desplazamiento relativo de los ojos permite obtener la profundidad de los objetos o la tercera dimensión mediante un simple proceso de triangulación a partir de las dos imágenes generadas del mismo objeto de la escena en cada ojo. Esto es posible por el hecho de que los ojos están desplazados entre sí, y las imágenes de los objetos en ambos ojos se muestran desplazadas según la distancia de los objetos a los ojos. En la Figura 2.9(a) se muestra un sistema estereoscópico biológico observando dos objetos (estrella y triángulo) a distintos niveles de profundidad, en las correspondientes retinas de los ojos se obtienen las respectivas imágenes. Si juntamos las imágenes obtenidas por ambos ojos obtenemos la imagen de la Figura 2.9(b) en la que se observa que la separación relativa entre las imágenes de los dos triángulos es menor que la separación relativa entre las imágenes de las estrellas. Este fenómeno se explica por el hecho de que la estrella en la escena 3-D se encuentra más próxima a los ojos que el triángulo. La separación relativa

Page 27: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL II. ESTADO DEL ARTE.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

14

entre las imágenes de un mismo objeto de la escena 3-D es lo que se denomina como disparidad.

En visión estereoscópica artificial se utilizan dos cámaras separadas una distancia

relativa. El procedimiento consiste en captar dos o más imágenes de una misma escena. Cada imagen es capturada desde una posición de las cámaras ligeramente diferente a las anteriores, de suerte que las imágenes se presentan ligeramente desplazadas entre sí permitiendo la obtención de la distancia a la que se encuentra un determinado objeto.

Figura 2.9. a) Sistema de visión estereoscópica biológico; b) Superposición de las imágenes de ambos ojos.

En la Figura 2.10 se muestra un par de imágenes estereoscópicas captadas mediante un

sistema de visión artificial con dos cámaras alineadas horizontalmente, de forma que los objetos en las imágenes solo presentan un desplazamiento horizontal y no vertical.

Figura 2.10. a) Imagen original estereoscópica izquierda; b) Imagen estereoscópica derecha.

Este desplazamiento también se pone de manifiesto mediante la simple operación

aritmética de sustracción de imágenes. Si realizamos la sustracción de las imágenes de la Figura 2.10 obtenemos la imagen de la Figura 2.11(a), donde se puede comprobar que a menor distancia de los objetos a las cámaras, mayor desplazamiento relativo de las imágenes de los objetos y viceversa. Si no hay desplazamiento, es decir se trata de la misma imagen, la imagen de la Figura 2.11(b) aparece totalmente gris sin ningún tono coloreado, mientras que en este mismo caso la imagen de la Figura 2.11(a) aparecerá totalmente negra.

a) b)

a)

b)

Page 28: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL II. ESTADO DEL ARTE.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

15

Figura 2.11. a) Imagen obtenida por la sustracción de las imágenes de la Figura 2.10; b) Imagen estereoscópica.

El proceso de la visión estereoscópica consta de los siguientes pasos [13]:

-Adquisición o captura de las imágenes. -Geometría del sistema. -Extracción de las imágenes. -Correspondencias de características. -Obtención de la distancia.

La adquisición de las imágenes se describió en la Sección 2.2.1 y la geometría del sistema y obtención de la distancia se tratara en los siguientes capítulos.

2.3.3.1 Geometría del sistema estereoscópico y obtención de la distancia.

Un sistema convencional está caracterizado por un par de cámaras con sus ejes ópticos

mutuamente paralelos y separados por una distancia horizontal llamada línea base, en la Figura 2.12 es el parámetro b [3]. Las cámaras tienen sus ejes ópticos perpendiculares a la línea base y sus líneas de exploración o epipolares paralelas a la línea base. Las líneas epipolares son líneas uniendo las imágenes izquierda y derecha de un mismo punto en la escena. El desplazamiento entre los ejes ópticos de las dos cámaras es horizontal, esto se traduce en el hecho de que las imágenes de un punto determinado de la escena captado por ambas cámaras difiere solamente en la componente horizontal.

Las Figuras 2.12 y 2.13 muestran la geometría de un par de cámaras estéreo, representadas por sus modelos puntuales con sus planos imagen, II e ID reflejados sobre sus centros de proyección OI y OD, respectivamente. El origen del sistema de coordenadas de referencia está en O, siendo la longitud focal efectiva de cada cámara f y la línea base b. Los ejes de coordenadas del universo X, Y y Z se sitúan entre los ejes de ambas cámaras. Supongamos que PI(xI, yI, zI) y PD(xD, yD, zD) son las proyecciones del punto P(X,Y,Z) de la escena 3D. Los rayos de proyección POI y POD definen el plano de proyección del punto de la escena 3D llamado plano epipolar. Para un punto dado PI en la imagen izquierda, su punto de correspondencia PD en la imagen derecha debe caer en la línea de intersección del plano epipolar y el plano de la imagen, es decir, sobre la línea epipolar. La línea epipolar en la imagen derecha correspondiente a un punto PI en la imagen izquierda define el espacio de búsqueda dentro del cual se situará el correspondiente punto PD. Como consecuencia de la geometría de la imagen se obtiene la denominada restricción epipolar, que ayuda a

a) b)

Page 29: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL II. ESTADO DEL ARTE.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

16

limitar el espacio de búsqueda de correspondencias, de manera que en el sistema de ejes paralelos convencional todos los planos epipolares originan líneas horizontales al cortarse con los planos de las imágenes. En un sistema con la geometría anterior se obtiene un valor de disparidad d, para cada par de puntos emparejados PI(xI, yI) y PD(xD, yD) dado por d = xI-xD.

Figura 2.12. Geometría de un par de cámaras en estereo con ejes ópticos paralelos.

Figura 2.13. Geometría de un par de cámaras estereo con ejes ópticos paralelos desde una perspectiva superior.

Considerando una relación geométrica de semejanza de triángulos, las coordenadas del

punto de la escena P(X,Y,Z) pueden deducirse observando la Figura 2.13,

P(X,Y,Z)

Z

X

ZI

ZD

PI

xI

II

ID

xD

PD

b/2

b/2

OD

OI

O

f

f

P(X,Y,Z)

ZI ZD

IDII PDPI

YI

OI XI

YD

ODXDX

Z

O

b

f

f

Línea epipolar

Y

Page 30: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL II. ESTADO DEL ARTE.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

17

dfbZ

Zfbxxd

bXZfx

bXZfx

fx

Z

Xb

O

fx

Z

Xb

ODI

D

I

DD

II

=⇒=−=⇒

⎪⎪⎭

⎪⎪⎬

⎟⎠⎞

⎜⎝⎛ −=

⎟⎠⎞

⎜⎝⎛ +=

⎪⎪⎪

⎪⎪⎪

=−

=+

2

2

2:

2:. (2.8)

Cuando se utiliza esta geometría, la profundidad Z es inversamente proporcional a la disparidad de la imagen y para una disparidad dada, a mayor b mayor d, lo que sugiere que la línea base puede incrementarse para mejorar la exactitud de la profundidad medida, pero lleva consigo que ambas imágenes tengan menos características comunes, es decir, menos bordes o regiones procedentes de los objetos de la escena, debido a las desapariciones y oclusiones de las imágenes de dichos objetos. 2.3.4. Formas a partir de variaciones de la intensidad.

La imagen de un objeto 3D depende de su forma, propiedades de reflectancia y la distribución de las fuentes de luz. En la Figura 2.14 se muestran tres imágenes sintéticas del mismo objeto, en este caso, una esfera bajo diferentes condiciones de iluminación. Se observa cómo las imágenes formadas son realmente diferentes aunque pertenezcan al mismo objeto. Este sencillo ejemplo, muestra la importancia de la posición y distribución de las fuentes de iluminación a la hora de determinar el brillo en las imágenes.

Figura 2.14. Imágenes sintéticas de la misma esfera obtenidas bajo diferentes condiciones de iluminación. El objetivo consiste en obtener la estructura 3D o la forma de las superficies a partir de

variaciones del brillo o intensidad de la imagen. Las variaciones del brillo o tonalidad son conocidas en terminología inglesa como “shading”. La percepción de una superficie depende de su tonalidad, es decir, la captura de imágenes es determinada, además, por la geometría de las cámaras y por la relación radiométrica entre el mundo y su imagen. Las imágenes recibidas por los humanos en sus actividades visuales diarias provienen normalmente de la luz reflejada por los objetos. La naturaleza básica de una imagen puede caracterizarse por dos componentes: a) la cantidad de luz incidente en la escena, que está siendo observada y que proviene de una fuente de luz y b) la cantidad de luz reflejada por los objetos de la escena, también llamados componentes de iluminación y reflectancia. Aunque ambas se conocen informalmente como brillo, sus unidades de medida son diferentes [14].

Page 31: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL II. ESTADO DEL ARTE.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

18

La cantidad de luz o iluminación que incide en una superficie es la potencia por unidad de área ( )2. −mW incidente en la superficie. La cantidad de luz emitida por la superficie en cualquier dirección se denomina reflectancia, que es la potencia por unidad de área proyectada en la dirección de radiación y por unidad de ángulo sólido o stereoradián ( )srmW .. 2− . En la Figura 2.15, el área escorzada de una superficie en cualquier dirección es el área de la superficie proyectada en la dirección bajo consideración; para una superficie plana, el área escorzada es el producto del área de la superficie con el coseno del ángulo entre la superficie normal y la dirección de proyección.

Figura 2.15. Angulo sólido y área proyectada.

La reflectancia de la escena depende de la cantidad de luz que incide sobre la superficie

y la fracción de esa luz incidente que se refleja en todas direcciones, que se conoce como el albedo de la superficie y que depende del material de la superficie. También depende de la geometría de la reflexión de la luz, como sucede en un espejo. La reflectancia de una superficie dependerá generalmente de la dirección a partir de la cual es observada así como de la dirección a partir de la cual es iluminada. Se pueden describir esas direcciones en términos de un sistema de coordenadas local saliente de la superficie, tal y como muestra la Figura 2.16. Consideremos una perpendicular a la superficie, concretamente su normal n y una línea de referencia arbitraria sobre la superficie. Las direcciones pueden describirse especificando el ángulo θ entre un rayo y la normal, y el ángulo ϕ entre una proyección perpendicular del rayo en la superficie y la línea de referencia en la superficie. Los ángulos se denominan ángulo polar θ y ángulo azimutal ϕ. Para comprender mejor esta representación podríamos hablar de latitud y longitud, siendo la línea de referencia el meridiano correspondiente. Esto permite especificar la dirección ( )ii ϕθ , a partir de la cual la luz incide sobre la superficie y la dirección ( )ee ϕθ , en la cual es emitida hacia el observador, en realidad la dirección de proyección hacia la cámara (ver Figura 2.17). El

Hemisferio unitario

Area proyectada (Acosθ) de A en la dirección t

Page 32: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL II. ESTADO DEL ARTE.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

19

brillo de la superficie en un punto está determinado por los rayos emitidos por la superficie hacia la cámara u observador y está gobernado por los valores eeii ϕθϕθ ,,, .

Figura 2.16. Representación de un vector en un sistema local de coordenadas mediante el ángulo polar θ y el azimut ϕ.

Figura 2.17. Angulos de iluminación (θi,ϕ i) y observación o proyección (θe,ϕe).

A partir de esto, se crea un mapa de reflectancia que pone de manifiesto la relación entre

la orientación de la superficie y la intensidad de la imagen y codifica la información sobre las propiedades de reflectancia y las distribuciones de fuente de luz. Esto supone que la iluminación de la escena es una función de la dirección de iluminación y no de la posición. Este hecho implica tres suposiciones adicionales:

1) Las fuentes de iluminación están distantes de las superficies proyectadas. 2) La iluminación secundaria no es significativa; esto es, la iluminación de las

superficies proyectadas por luz reflejada procedente de otras superficies o de parte de la misma superficie no es importante.

Page 33: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL II. ESTADO DEL ARTE.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

20

3) La luz no es obstruida por otras superficies antes de llegar a la superficie proyectada.

Finalmente, el mapa de reflectancia es una herramienta utilizada para obtener la forma

de las superficies a partir de las imágenes. 2.4. Segmentación.

La segmentación es el proceso por el cual se extrae de una imagen cierta información para su posterior uso. La segmentación está basada en dos principios fundamentales: la segmentación a bordes (discontinuidad) y en orientada a regiones (similitud) [15]. Una región es en términos generales un área de la imagen en la que sus píxeles poseen propiedades similares (de intensidad, color, etc.), mientras que un borde es una línea que separa dos regiones (discontinuidad).

Tanto la detección de bordes como la de regiones implican una manipulación de la imagen original, que supone en definitiva una transformación de estas, de forma que los valores de los píxeles originales son modificados mediante ciertas funciones de transformación u operadores.

Para la detección de bordes se tienen los siguientes tipos de operadores [16],

-Operadores primera derivada. -Operadores segunda derivada. -Operadores morfológicos.

Mientras que para la detección de regiones, se tienen las siguientes técnicas [16],

-Binarización con el uso de umbrales. -Crecimiento de regiones mediante el uso de píxeles. -División de regiones. -Similitud de textura, color o niveles de gris.

A veces la calidad de la imagen no es lo suficientemente buena, por lo que no se puede extraer la información adecuadamente, esto implica tener que utilizar ciertas técnicas de mejora de la calidad de la imagen original. Los procesos que pueden considerarse dentro de esta etapa son: a) suavizado y b) realzado. El primero se encamina hacia la supresión de ruido introducido durante la captura de la imagen, mientras que el segundo está encaminado a eliminar falsos reflejos y sombras que dificultan la extracción de la información. Si la calidad de la imagen captada es suficientemente buena para la aplicación en cuestión, esta etapa puede eliminarse.

Los puntos de borde o simplemente bordes son píxeles alrededor de los cuales la imagen presenta una brusca variación de los niveles de gris. El objetivo consiste en, dada una

Page 34: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL II. ESTADO DEL ARTE.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

21

imagen que pueda estar o no corrompida por ruido, localizar los bordes más probables generados por los elementos de la escena y no por el ruido.

En realidad el término borde se refiere a cadenas de puntos de borde, esto es, fragmentos de contorno. Esto no impide que la imagen también pueda contener puntos aislados que presentan un alto contraste en los niveles de gris. Los puntos de borde se denominan a veces en terminología anglosajona “edgels” (procedente de edge element). Existen varias razones que sostienen el interés por los bordes. Los contornos de los objetos sólidos de la escena, las marcas en las superficies, las sombras, todas generan bordes.

La Figura 2.18 ilustra los conceptos anteriores, se trata de una imagen de intensidad y perfil a lo largo de la línea blanca de exploración mostrada. Se observa cómo las principales variaciones corresponden a contornos perfectamente delimitados. El ruido también origina falsos contornos por lo que un buen algoritmo de detección de bordes debería de tratar el ruido subyacente.

Figura 2.18. a) Imagen original mostrando una línea de exploración horizontal; b) Perfil de intensidad a lo largo de dicha línea.

2.4.1. Concepto de derivada en la extracción de bordes.

En la Figura 2.19 se puede observar que los bordes (transición de oscuro a claro o viceversa) se modelan como una rampa en lugar de hacerlo como un cambio brusco de intensidad, debido a que en la imagen original suelen estar desdibujados como resultado del muestreo. La primera derivada es cero en todas las regiones de intensidad constante y tiene un valor constante en toda la transición de la intensidad. La segunda derivada, en cambio, es cero en todos los puntos, excepto en el comienzo y al final de una transición de intensidad. Por tanto, un cambio de intensidad se manifiesta como un cambio brusco en la primera derivada y presenta un cruce por cero (es decir, se produce un cambio de signo en su valor) en la segunda derivada. Este cambio de signo se denomina en la bibliografía en lengua inglesa como “zero-crossing”.

a) b)

Page 35: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL II. ESTADO DEL ARTE.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

22

Figura 2.19. Concepto de primera y segunda derivada para la extracción de bordes.

Entre los operadores basados en la primera derivada están los operadores gradiente, Sobel, Prewitt, Roberts, Kirsch, Robinson, y Frei-chen; y los operadores basados en la segunda derivada son el operador Laplaciano y el Laplaciano de la Gaussiana [17]. 2.5. Interpolación.

Interpolación es intercalar la estructura de un objeto en otro (ver Figura 2.20) [18].

Figura 2.20. Concepto de interpolación.

En una imagen la interpolación puede considerarse como el cálculo del valor de intensidad de un píxel, en una posición cualquiera, como una función de los píxeles que le rodean. Supongamos que deseamos calcular el valor del píxel de coordenadas (x,y) en la Figura 2.21, en función de los valores de los píxeles de la rejilla. Una forma de hacerlo es suponer que el píxel toma el mismo valor que el más cercano. En la Figura 2.21 tomaría el valor de p(i,j). Otra posibilidad es asociarle la intensidad media asociada a los dos píxeles más cercanos, uno en x y el otro en y. En la misma figura tomaría el valor de medio de p(i,j) y p(i+1,j).

Imagen con bordes

Perfil de intensidad de una linea horizontal

Primera derivada

Segunda derivada

Page 36: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL II. ESTADO DEL ARTE.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

23

Figura 2.21. Esquema grafico de la interpolación bilineal.

2.5.1. Interpolación bilineal.

Una forma de interpolar con mejores resultados pero con mayor coste computacional es la interpolación bilineal [3], la cual asigna al píxel en cuestión un valor medio ponderado de las intensidades de los cuatro píxeles que le rodean. Los factores de ponderación vienen dados por la distancia entre el píxel y los del entorno. Los factores de ponderación se calculan de la manera siguiente,

⎟⎟⎠

⎞⎜⎜⎝

⎛∆

−⎟⎠⎞

⎜⎝⎛

∆−=

ydy

xdxa 111 , ⎟⎟

⎞⎜⎜⎝

⎛∆

−∆

=y

dyx

dxa 12 , y

dyx

dxa∆

⎟⎠⎞

⎜⎝⎛

∆−= 13 ,

ydy

xdxa

∆∆=4 (2.9)

donde 10 ≤≤ dx , 10 ≤≤ dy , 1=∆x y 1=∆y , por lo que, ( )( )dydxa −−= 111 , ( )dydxa −= 12 , ( )dydxa −= 13 , dxdya =4 (2.10) Finalmente, el valor del píxel interpolado, en función de los cuatro de su entorno, queda: ( ) ( ) ( ) ( ) ( )1,1,11,,, 4321 +++++++= jipajipajipajipayxp (2.11) 2.6. Operaciones Morfológicas.

La morfología matemática comenzó a desarrollarse a finales de los setentas, y permanece hoy en día como una parte del análisis de las imágenes. La morfología matemática está basada en la geometría y la forma. Las operaciones morfológicas simplifican las imágenes y preservan las formas principales de los objetos [3].

dx=a dy=b

p(i+1, j) ∆x

∆y

p(i+1, j+1)

p(i, j+1) p(i, j)

),( yxp

Page 37: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL II. ESTADO DEL ARTE.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

24

En visión artificial es frecuente utilizar la morfología para el tratamiento de regiones en el sentido de determinar cómo se pueden cambiar, contar o evaluar. La morfología puede utilizarse para las siguientes tareas: -Suavizar los bordes de una región. Esto es útil por ejemplo si se necesita mejorar un borde, ya que usando técnicas de segmentación estándar, los bordes se presentan generalmente ruidosos debido tanto al proceso de captura como a los procesos de segmentación, apareciendo sobre ellos pequeños valles o protuberancias, que pueden suprimirse mediante transformaciones morfológicas. -Separar determinadas regiones que el proceso de segmentación presenta unidas. -Unir regiones que han sido separadas durante la segmentación. -Como consecuencia de los dos puntos anteriores facilitar el cómputo de regiones en una imagen. 2.6.1 Principios básicos.

La morfología matemática aprovecha las propiedades de los conjuntos de puntos, los resultados de la geometría integral y la topología. La premisa inicial consiste en suponer que las imágenes reales pueden ser modeladas utilizando conjuntos de puntos de cualquier dimensión (por ejemplo el espacio Euclidiano N-dimensional). El espacio Euclidiano 2D ( 2E espacio euclidiano bidimensional) y su sistema de subconjuntos es un dominio natural para la descripción de formas planas. Desde la perspectiva de conjuntos se consideran las operaciones habituales de ellos, a saber: inclusión (⊂ o )⊃ , unión ( )∪ , intersección ( )∩ , complemento ( )C o conjunto vacío (φ ). La diferencia de conjuntos se define por

CYXYX ∩=− [19].

La visión por computadora utiliza el equivalente digital del espacio euclidiano, conjuntos cuyos elementos son pares de enteros para imágenes binarias o conjuntos de triples para imágenes de gris.

Un punto se representa por un par de números enteros que corresponden a las coordenadas de la imagen digital. Por tanto, una imagen binaria puede tratarse como un conjunto de puntos 2D. Los puntos que pertenecen a los objetos en la imagen representan un conjunto X. En imágenes binarias estos puntos son píxeles con valor binario uno. Los puntos del conjunto complementario CX corresponden al fondo con valores binarios igual a cero. Fijándonos en la imagen de la Figura 2.22, el origen, marcado por un punto, tiene coordenadas ( )0,0 y las coordenadas de cualquier punto se interpretan como (posición en la fila, posición en la columna) con respecto al origen. Además, los puntos que pertenecen al objeto se marcan con “1”. Cualquier punto x de una imagen discreta X puede considerarse

Page 38: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL II. ESTADO DEL ARTE.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

25

un vector con respecto al origen ( )0,0 . El conjunto X considerando exclusivamente los valores lógicos 1 viene dado por ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ){ }3,3,2,3,3,2,2,2,3,1,2,1,1,1,3,0,2,0,1,0=X .

⎥⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢⎢

⎡•

0000001100011000111001110

Figura 2.22. Un ejemplo de conjunto de puntos.

Una operación morfológica φ viene dada por la relación de la imagen (conjunto de puntos X) con otro pequeño conjunto de puntos B, llamado elemento estructural. B se expresa con respecto a un origen local O (llamado punto representativo). Algunos elementos estructurales típicos (obviamente desde el punto de vista binario) se muestran en la Figura 2.23 en la cual el punto representativo se marca por un punto. El elemento estructural de la Figura 2.23(a) tiene la forma de conjunto de puntos

( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ){ }1,1,0,1,1,1,1,0,0,0,1,0,1,1,0,1,1,1 −−−−−−=B , mientras que la expresión para la Figura 2.23(b) es: ( ) ( ) ( ) ( ) ( ){ }0,1,1,0,0,0,1,0,0,1 −−=B . La Figura 2.23(c) ilustra la posibilidad de que el punto O no sea un miembro del elemento estructural B, cuya representación en forma de conjunto seria ( ) ( ){ }1,0,1,0 −=B , obsérvese que no aparece el punto de coordenadas ( )0,0 al tener un valor binario de cero y por consiguiente no se considera un miembro del conjunto estructural B.

Figura 2.23. Elementos estructurales típicos.

La transformación morfológica ( )Xφ aplicada a la imagen X significa que el elemento

estructural B se desplaza por toda la imagen. Suponiendo que B se posiciona sobre algún punto de la imagen, el píxel de la imagen correspondiente al punto representativo O de B se denomina píxel actual. El resultado de la relación (que puede ser cero o uno) entre la imagen X y el elemento estructural B en la posición actual se almacena en el píxel actual de la imagen.

111111111

•1

1111• 101 •

a) b) c)

Page 39: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL II. ESTADO DEL ARTE.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

26

2.6.2 Definiciones elementales.

a) Dualidad. La dualidad de operaciones morfológicas se deduce de la existencia del conjunto complementario; de modo que para cada transformación morfológica ( )Xφ existe una transformación dual ( )CX*φ tal que [19],

( ) ( )( )CC XX φφ =* (2.12)

b) Traslación. La traslación del conjunto de puntos X por el vector h se denota por hX y

se define por,

⎭⎬⎫

⎩⎨⎧

∈∀+=∈= XxhxdEdX h :2 (2.13)

esto se ilustra en la Figura 2.24, donde (a) muestra la imagen original y (b) la imagen trasladada por el vector ( )1,0=h

Figura 2.24. a) Imagen original; b) Traslación por el vector ( )1,0=h .

c) Complemento de un conjunto X es { }XxxX C ∉= | .

d) Diferencia de dos conjuntos X y Y es { }YxXxxYX ∉∈=− ,| .

2.7. Conclusiones

El estado del arte presentado en este capítulo se realizó basándonos en dos ideas, primero proporcionar al lector los conceptos básicos para comprender el método propuesto y segundo presentar las técnicas de reconstrucción en 3D relacionadas con éste. Por otra parte, la investigación se realizó pensando en que las técnicas de reconstrucción en 3D se puedan aplicar con facilidad y con un consumo mínimo de recursos, desafortunadamente al trabajar con visualización 3D y adquisición de imágenes, la mayoría de métodos demandan hardware y software especializado, es decir, mejores computadoras, tarjetas de video, cámaras de video, programas, así como tiempo de procesamiento. Por

⎥⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢⎢

⎡•

0001000011001100001000010

⎥⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢⎢

0010000110011000010000100

a) b)

Page 40: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL II. ESTADO DEL ARTE.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

27

tanto, después de investigar varias técnicas de reconstrucción en 3D, algunas presentadas en este capítulo, se llego a la conclusión que la mejor opción sería la reconstrucción a partir de la extracción de contornos (utilizando operaciones morfológicas y operadores primera derivada), y los algoritmos de Marching cubes y de iluminación de Pong debido a que estos algoritmos requieren un mínimo de hardware y software, es decir, pueden ser implementados en una PC de uso general. 2.8 Bibliografía.

[1] K.S. Fu, R.C. González, C.S.G. Lee, Robótica: control, detección, visión e inteligencia, Mc. Graw-Hill, Madrid, 1988.

[2] A. Roselfeld, A. C. KaK, Digital picture processing, vols. 1 and 2, Academic Press, NY, 1982.

[3] G. Pajares, J. M. de la Cruz, Visión por Computador, Alfaomega, 2002. [4] http://www.plastunivers.com/Arees/enginversa/resumen.htm [5] A. Martínez, Evaluación de formas de superficies: comparación de distintas técnicas

ópticas, Tesis de Maestría, Centro de Investigación Científica y de Educación Superior de Ensenada, 1987.

[6] D. Malacara-Hernández, M. Servin, Z. Malacara, Interferogram analysis for optical testing. Marcel Deber Inc., NY, 1998.

[7] K.J. Gasvik, Optical metrology. John Wiley&Sons Ltd., Great Britain. 1987. [8] H.J. Tiziani, Optical measurement techniques and applications, Artech House,

Boston 1997. [9] J.A. Rayas, R. Rodríguez-Vera, A. Martínez, Proc. SPIE 5766, 101, 2005. [10] J.W. Goodman, Introduction to Fourier Optics. Mc-Graw-Hill Inc., NY, 1996. [11] J.M. Flores M., (2004). Determinación de topografía de un gasket mediante la

proyección de una imagen de Talbot, Tesis de Maestría, Centro de Investigaciones en Óptica, León, GTO. México.

[12] http://www.users.red3i.es/~stereoweb/vision.htm [13] Barnard, S. and Fishler, M. (1982). Computational Stereo, ACM Computing

Surveys. [14] B.K.P. Horn, M.J. Brooks, The variational Approach for shape from shading,

Computer vision graphics and image processing, 33, 174-208, 1986. [15] K.S. Fu, Syntactic Pattern Recognition, Ln T.Y. Young and K.S. Fu (Eds.)

Handbook of Pattern Recognition and Image Processing, Prentice-Hall 85-117, 1986.

[16] Rafael C. Gonzáles, Richard E. Woods, Tratamiento digital de imágenes, Addison-Wesley /Díaz de Santos, 1996.

[17] E. Trucco, A. Verri, Introductory Techniques for 3-D Computer Vision, Prentice-Hall, Upper Saddle River: NJ, 1998.

[18] James D. Foley, Andries van Dam, Steven K. Feiner, Computers Graphics. 2nd ed. Addison-Wesley Publishing Company, 1990.

[19] J. Serra, Image Analysis and Mathematical Morphology, Academic Press, London, 1982

Page 41: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL III. MÉTODO PROPUESTO.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

28

III. Método Propuesto 3.1. Introducción.

En este capítulo se muestra el método propuesto y se explica con detalle cada uno de los algoritmos que integran este método. 3.2. Método para la reconstrucción de objetos en 3D a partir de la extracción de contornos y el algoritmo Marching cubes.

Básicamente el método propuesto consiste de tres etapas: adquisición de datos, procesamiento de la imagen y construcción de la superficie. Tal como se muestra en la Figura 3.1, éstas contienen otras subetapas las cuales serán explicadas a continuación:

Figura 3.1. Diagrama general de las etapas del método propuesto.

Adquisición de datos

Procesamiento de la imagen

Construcción de la superficie

Captura de la imagen (RGB, bmp, jpg)

Dilatación.

Rellenado de regiones.

Supresión de estructuras en la

frontera.

Erosión

Creación de isosuperficie.

Iluminación.

Unión de los contornos por medio de cubos lógicos. Marching cubes

Extracción de bordes

Segmentación por operaciones morfológicas

Conversión de imagen RGB a escala de grises

Algoritmo de Phong para la iluminación y sombreado

Operador primera derivada “Sobel”

Page 42: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL III. MÉTODO PROPUESTO.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

29

1 - Adquisición de datos: Se obtienen múltiples capas 2D de información. 2 - Procesamiento de la imagen: Algunos algoritmos usan técnicas de procesamiento de imágenes para encontrar datos dentro de la estructura 3D o filtrar datos de la imagen original siendo este último nuestro objetivo. 3 - Construcción de la superficie: Lo usual es utilizar elementos volumétricos en 3D, como cubos o polígonos. 3.3 Adquisición de datos.

Normalmente los métodos para la obtención de datos 2D están relacionados con el campo de la medicina y más concretamente con el uso de las distintas capas que se obtienen de métodos médicos, tales como Tomografía Computarizada (TC), Resonancia Magnética (RM) y Tomografía Computarizada de Emisión de Fotón Único (SPECT).

Las imágenes en dos dimensiones de estas técnicas sirven de gran ayuda a los médicos en los diagnósticos de sus pacientes, pero tienen el inconveniente de que no se ven los órganos en su forma original. La Figura 3.2 muestra las distintas capas de un cerebro.

Figura 3.2. Tomografías de un cerebro.

Se puede crear una imagen bidimensional con un punto de vista tridimensional arbitrario

utilizando múltiples imágenes de cortes transversales. Primero, se deben crear las imágenes de los cortes transversales. Luego, apilando visualmente los cortes, obtenemos el volumen y se puede visualizar la apariencia del objeto tridimensional. Se pueden crear imágenes de cortes transversales de un objeto con las técnicas anteriormente citadas. Una vez obtenida la imagen volumétrica, podemos aplicar el algoritmo de Marching cubes, que genera una superficie a partir de un valor de umbral dado. Desafortunadamente, el acceso a las secuencias de imágenes no es fácil, por tal razón, se procedió a capturar las imágenes por medio de una cámara, la cual tomará fotografías de rebanadas de objetos, las cuales simularán una tomografía o resonancia magnética. 3.3.1 Captura de imágenes.

Para la captura de las imágenes se utilizo una cámara web con resolución de 640x480

píxeles, la cual captura las imágenes en color RGB y en formato bmp. Esta captura se realizó en un ambiente controlado, es decir, con una fuente de luz incandescente ubicada a cierta distancia de la rebanada del objeto y en un lugar cerrado donde ninguna otra fuente

Page 43: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL III. MÉTODO PROPUESTO.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

30

de luz pudiera afectar al procesamiento o a la captura de la imagen, tal como se muestra en la Figura 3.3. Por otra parte el software utilizado para la adquisición de las imágenes fue Matlab.

Figura 3.3. Esquema de cámara de captura.

En la construcción del sistema de captura se tomó en consideración la resolución de

640x480 píxeles de la cámara Web, se ubico o alineo la cámara a una distancia en la cual se tomara una imagen de la rebanada de un objeto con medidas de 17 cm de ancho y 22.5 cm de largo, el sobrante de la estructura de la caja solo sirvió para tener un margen de movilidad de la rebanada. Se trato de sacar estas medidas lo más aproximado posible. Debido de que el número de píxeles por unidad de área varía según la posición de la cámara, además cada imagen debe conservar su proporción de píxeles, esto es, la cámara es de 640x480 y se desea una imagen de 22.5x17, entonces,

[ ] [ ][ ]pixelesimagenladeLarqo

cmobjetodelLarqopixelesimagenladeAnchoobjetodelAncho x= (3.1)

cm66.22480

17*640==

Por lo tanto, la cámara quedo alineada como se muestra en la Figura 3.4.

Cámara Web

Fuente de iluminación

30 cm

29 cm

39 cm Rebanada del objeto

Page 44: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL III. MÉTODO PROPUESTO.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

31

Figura 3.4. Alineación de cámara.

3.4 Procesamiento de la imagen.

Una vez que se tiene la secuencia de imágenes, éstas pasan por 6 procesamientos o transformaciones de imágenes, que son:

I. Conversión de imagen RGB a imagen escala de grises. II. Extracción de bordes.

III. Dilatación. IV. Rellenado de regiones. V. Supresión de estructuras en la frontera.

VI. Erosión.

A continuación se explican estos procesamientos. Es preciso aclarar que para una mejor comprensión de ellos, se han utilizado tres imágenes diferentes, pues éstas muestran con mayor detalle los procesamientos o transformaciones realizados. Por tanto, en la conversión de imagen RGB a escala de grises se utilizó la imagen de un paisaje [1], que por su amplia gama de colores muestra claramente el cambio entre una imagen y otra, mientras que para la extracción de bordes se utilizó la imagen de un oso sobre una mesa [2], la cual contiene bordes que se detectan a simple vista y para las operaciones morfológicas se utilizó la imagen de una escultura (tomada por el autor), la cual por su estructura y forma, sus contornos son mas fáciles de apreciar.

Cámara web

22.66 cm

17 cm

39 cm

Page 45: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL III. MÉTODO PROPUESTO.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

32

3.4.1 Conversión de imagen RGB a escala de grises.

La propiedad más básica de una imagen es su modo. Hay tres modos posibles: RGB, escala de grises, e indexado. En el Capítulo 2 se habló de las imágenes RGB y de escala de grises, se excluyeron las indexadas ya que no fueron utilizadas en esta tesis. En esencia la diferencia entre una imagen en escala de grises y una imagen en RGB es el número de “canales de color”, una imagen en escala de grises tiene uno y una imagen RGB tiene tres.

Una imagen a color RGB puede ser pensada como tres imágenes superpuestas, una coloreada de rojo, otra de verde, y otra de azul, esto es, se requerirá la extracción de características de cada imagen, por tal motivo se decidió trabajar con una sola imagen pero en escala de grises. Para obtener una imagen en escala de grises, se tomo un porcentaje de cada una de las componentes RGB, es decir, BGRGris 117.0587.0299.0 ++= , (dichos porcentajes son estándares comúnmente utilizados). Una vez que se tiene dichos porcentajes de la intensidad por píxel, se suman para conformar una nueva imagen en escala de grises, la cual es la mejor representación de la imagen a color RGB, ya que contiene una porción de cada una de las componentes. Este proceso se muestra en la Figura 3.5. 3.4.2 Extracción de bordes. En la Sección 2.4.1 se habló acerca de la extracción de bordes mediante un operador de primera derivada de tipo Sobel, es decir, que la localización de los bordes está dada por las variaciones de intensidad.

El gradiente de una imagen ( )yxf , en un punto ( )yx, se define como un vector bidimensional dado por [3],

( )[ ]( )

( )⎥⎥⎥⎥

⎢⎢⎢⎢

∂∂∂∂

=⎥⎦

⎤⎢⎣

⎡=

yxfy

yxfx

GG

yxfGx

y

,

,, (3.2)

donde el vector G apunta en dirección de la variación máxima de f en el punto ( )yx, por unidad de distancia, con la magnitud y dirección dadas por

22yx GGG += ; ( )

x

y

GG

yx 1tan, −=φ . (3.3)

Es la práctica habitual aproximar la magnitud del gradiente con valores absolutos [2],

yx GGG +≈ (3.4)

Page 46: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL III. MÉTODO PROPUESTO.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

33

Figura 3.5. Proceso para la conversión de una RGB a una imagen escala de grises.

Red Green Blue

Escala de grises de la componente roja.

Escala de grises de la componente Verde.

Escala de grises de la componente Azul.

Imagen final en escala de grises=0.299*GRed+0.587*GGreen+0.117*GBlue

GRed GGreen GBlue

29.9% de GRed. 11.7% de GBlue.

58.7% de GGreen.

Page 47: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL III. MÉTODO PROPUESTO.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

34

Un punto es de borde, según la magnitud del gradiente supere o no un determinado umbral, solo es cuestión de ajustar dicho umbral para que el resultado de la extracción de bordes sea el mismo si se calcula la magnitud del gradiente mediante (3.3) o (3.4).

Para calcular la derivada en (3.2) se pueden utilizar las diferencias de primer orden entre dos píxeles adyacentes; esto es,

( ) ( )x

xxfxxfGx ∆∆−−∆+

=2

( ) ( )y

yyfyyfGy ∆∆−−∆+

=2

. (3.5)

Esta es la forma más elemental de obtener el gradiente en un punto. La magnitud del

gradiente puede tener cualquier valor real y el ángulo cualquier valor entre 0° y 360°. No obstante, el operador Sobel y otros operadores ampliamente difundidos que implementan el concepto de derivada en un punto (Prewitt, Roberts, Kirsch, Robinson o Frei_Chen), consideran una vecindad de dimensión 3x3 [3]. En cualquier caso, y siguiendo con el concepto de derivada definido en (3.5), la Figura 3.6, muestra el gradiente de una imagen. En (b) se muestra la magnitud del gradiente, es decir G ; en (c) se muestra una imagen binaria utilizando la siguiente relación,

( )( )[ ]( )[ ]⎪⎩

⎪⎨⎧

>= TyxfGsi

TyxfGsiyxg ,0

,1, (3.6)

donde T es un valor de umbral (para esta imagen se tomo T = 80, aunque se pudo haber tomado cualquier otro valor). Sólo los píxeles de borde cuyo gradiente exceda el valor T se consideran importantes. Así la ecuación (3.6) se puede ver como un procedimiento que extrae sólo aquellos píxeles caracterizados por transiciones de intensidad significativas (dependiendo de T). Finalmente en la figura 3.6 (d) se muestra el ángulo del gradiente φ .

Los valores de xG y yG de (3.2) pueden implementarse por convolución de la imagen con las máscaras 3x3 dadas en la Figura 3.7 (b) y (c), conocidas como operadores de Sobel,

( ) ( )( ) ( )321987

741963

2222

zzzzzzGzzzzzzG

y

x

++−++=++−++=

(3.7)

Los valores de z de la Figura 3.7(a) son los niveles de gris de los pixeles solapados por

las máscaras en cualquier localización de la imagen. Para obtener los valores de los componentes del vector gradiente en el punto definido por el píxel central de la región se utiliza (3.7), y la magnitud y el ángulo se pueden obtener a partir de (3.3) y (3.4). Una vez obtenida la magnitud se puede decidir si un punto es de borde aplicando (3.6), obteniéndose una imagen binaria como resultado.

Page 48: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL III. MÉTODO PROPUESTO.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

35

Figura 3.6. a)Imagen original; b) Imagen de la magnitud del gradiente; c) Imagen binarizada considerando un umbral T de 80

para la magnitud del gradiente; d) Imagen del ángulo del gradiente.

Figura 3.7. a) Región de la imagen de dimensión 3x3; b) Máscara usada para obtener xG en el punto central de la región 3x3; c)

Máscara usada para obtener yG en el mismo punto. Estas máscaras se denominan operadores de Sobel.

Suponga la imagen elemental dada en la Figura 3.8. Para calcular el gradiente en el píxel marcado con el punto negro, la región de la imagen que interviene está marcada con los puntos en blanco.

Figura 3.8. Imagen Elemental.

⎥⎥⎥

⎢⎢⎢

987

654

321

zzzzzzzzz

⎥⎥⎥

⎢⎢⎢

−−−

101202101

⎥⎥⎥

⎢⎢⎢

⎡ −−−

121000121

(a) (b) (c)

a)

c)

b)

d)

⎥⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢⎢

⎡•

882222888222888432867981888880

ooo

oo

ooo

Page 49: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL III. MÉTODO PROPUESTO.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

36

Para calcular el gradiente aplicamos (3.7) obteniendo 26430 =−=xG y 122412 −=−=yG . Utilizando (3.4) se obtiene 48=G . Si se fija un valor de umbral

T=30, el píxel marcado con el punto negro seria un punto de borde y si por el contrario, el umbral es mayor que 48, dicho punto no sería considerado borde. A continuación se desplazan las máscaras a la siguiente posición, en este caso al píxel con valor 9 situado a la derecha del que se acaba de procesar y así sucesivamente hasta llegar al píxel con valor 6, con lo que se completaría la fila, ya que no se puede llegar hasta el final por el tamaño 3x3 de la máscara. Tras lo anterior el siguiente píxel a procesar es el marcado con el valor 3 en la siguiente fila y así sucesivamente.

La Figura 3.9(a) muestra una imagen original; (b) muestra el resultado de obtener xG con la mascara de la Figura 3.4 (b), recordando la convención de ejes establecida en la Figura 2.1, las respuestas de mayor intensidad generadas por xG se producen en la dirección perpendicular al eje x. Este resultado es obvio en la figura 3.9 (b) que muestra respuestas con valores del gradiente altos a lo largo de los ejes verticales, tales como los bordes de los libros que aparecen en la imagen original. Obsérvese la ausencia práctica de respuesta a lo largo de los bordes horizontales. La situación inversa se produce con la respuesta de yG , como se muestra en (c). Combinando esos dos resultados por medio de la ecuación (3.4) se obtiene la imagen gradiente de la Figura 3.9 (d). En (e) y (f) se muestran imágenes binarizadas utilizando la ecuación (3.6) y considerando que un punto es de borde si la magnitud del gradiente es mayor que T=10 y 20, respectivamente. 3.4.3 Dilatación.

La dilatación es una expansión en píxeles de las estructuras u objetos de la imagen binaria y se utiliza para aumentar los detalles de éstas. La transformación morfológica de la dilatación ⊕ combina dos conjuntos utilizando la adición de vectores (o adición de elementos estructurales). La dilatación BX ⊕ es el conjunto de puntos de todas las posibles adiciones vectoriales de pares de elementos, uno de cada conjunto X y B [4].

⎭⎬⎫

⎩⎨⎧ ∈∈+=∈=⊕ BbyXxcadaparabxdEdBX :2 (3.8)

La Figura 3.10 ilustra el siguiente ejemplo de dilatación,

( ) ( ) ( ) ( ) ( ) ( ){ }1,3,0,3,1,2,0,2,2,1,1,0=X , ( ) ( ){ }1,0,0,0=B ,

( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ){ }2,3,2,2,3,1,2,0,1,3,0,3,1,2,0,2,2,1,1,0=⊕ BX .

Page 50: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL III. MÉTODO PROPUESTO.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

37

Figura 3.9. a) Imagen Original; b) Resultado de aplicar la máscara de la Figura 3.7(b) para obtener xG ; c)Resultado de aplicar

la máscara de la Figura 3.7(c) para obtener yG ; d) Imagen de Gradiente completa obtenida utilizando la ecuación (3.4); e) y f)

Imagen binarizada utilizando la ecuación (3.6). T=10 y T=20 respectivamente.

[ ]

⎥⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢⎢

⎡•

=•⊕

⎥⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢⎢

⎡•

0000000111001110110000110

11

0000000011000110010000010

Figura 3.10. Ejemplo de dilatación.

La Figura 3.11 ilustra la dilatación con el elemento estructural 3x3 de cruz, la cual puede interpretarse como una transformación que cambia todos los píxeles del fondo que son sus vecinos; para una mejor comprensión la transformación se realiza fila por fila. La Figura 3.12 (b) muestra la imagen binaria mientras que en (c) se muestra el resultado de su dilatación por el elemento estructural de la Figura 3.11. Esta dilatación engruesa el objeto un píxel en 0° y 90° del píxel actual. 3.4.4 Rellenado de regiones.

El rellenado de regiones es usado para introducir píxeles blancos dentro de las estructuras formadas a partir de una conectividad de píxeles, es decir, rellenar un objeto completamente para su posterior segmentación. Es posible el rellenado de regiones

a) b) c)

d) e) f )

Page 51: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL III. MÉTODO PROPUESTO.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

38

mediante la dilatación, complementación e intersección. Suponga un conjunto A y un subconjunto dentro de él cuyos elementos son puntos de borde con una conectividad de 8 (se utilizo una conectividad de 8 por que se forman estructuras más grandes) pertenecientes a una región. Comenzando con un punto p dentro del borde, el objetivo consiste en rellenar la región entera con 1´s. Se asume por defecto que todos los puntos que no son de borde toman el valor 0. Se asigna un valor de 1 a p para comenzar el procedimiento de acuerdo a, ( ) C

kk ABXX ∩⊕= −1 k=1,2,3,… (3.9)

donde ,0 pX = y ⎥⎥⎥

⎢⎢⎢

⎡=

010111010

B es el elemento estructural simétrico.

Figura 3.11. Dilatación fila por fila.

Imagen original

1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 1 0 1 0 1 0 0 0 0 0 0 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0

Imagen dilatada

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 0 1 0 1 0 1 0 1 1 1 1 1 1 1 1 1 1 1 0 1 0 1 1 1 1 1 1 0 0 0 0 0 1 1 1 1 1

1ª Fila dilatada

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 1 0 1 0 1 0 1 0 1 0 0 0 0 0 0 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0

2ª Fila dilatada

1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 1 0 1 0 1 0 0 0 0 0 0 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0

3ª Fila dilatada

1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 1 0 1 0 1 0 0 0 0 0 0 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0

4ª Fila dilatada

1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 1 0 1 0 1 0 1 0 1 0 1 1 1 1 1 1 1 1 1 1 1 0 1 0 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0

5ª Fila dilatada

1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 1 1 1 1 1 1 0 0 0 0 1 1 1 1 1 1 0 0 0 0 0 1 1 1 1 1

6ª Fila dilatada

1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 1 0 1 0 1 0 0 0 0 0 0 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0

La unión de las imágenes producidas por la dilatación de cada fila nos da como resultado la dilatación total de la imagen.

0 0 0 0

1 1

1 1 1

Elemento estructural de cruz

Page 52: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL III. MÉTODO PROPUESTO.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

39

El algoritmo termina en la iteración k si 1−= kk XX . El conjunto unión de kX y A

contiene el conjunto relleno y su borde. El proceso de (3.9) rellenará toda la imagen si no se impone algún tipo de restricción, por ello se añade la intersección con CA para limitar el resultado al interior de la región de interés (este tipo de limitación se denomina dilatación condicional).

La Figura 3.13 muestra en (a) un conjunto A conteniendo un subconjunto cuyos elementos son puntos de borde de una región de 8-conectados; (b) complementario de ( )CAA = ; (c) elemento de estructural B con el origen en el píxel central; (d) punto inicial

elegido dentro del borde 0Xp = , el objetivo es rellenar la región entera con unos. El proceso de rellenado mediante (3.9) al estar gobernado por la intersección con CA limita el resultado al interior de la región de interés, se trata de la dilatación condicional. La Figura 3.13 (e) muestra la generación del conjunto 1X ; (f) recoge varios pasos de la ecuación (3.9): los píxeles de colores naranja, verde, rojo, azul, amarillo y rosa se generan con

65432 ,,,, XXXXX y 7X respectivamente. Al resultado obtenido se le aplica la unión con el conjunto A . Aunque este ejemplo sólo tiene un subconjunto, el concepto se aplica a cualquier número finito de subconjuntos, en la medida que se proporcione un punto dentro de cada borde.

La Figura 3.14(b) muestra un ejemplo de rellenado de una región con la imagen

dilatada del paso anterior (ver Figura 3.12(c)). 3.4.5 Supresión de estructuras en la frontera.

Se pueden eliminar la mayor parte de las estructuras unidas al marco por medio de la conectividad de un píxel con otro. La conectividad define cuáles píxeles están conectados a otros pixeles. De tal forma que un conjunto de píxeles en una imagen binaria unidos entre sí por conectividad es llamado objeto o estructura. Por ejemplo, la Figura 3.15(c) muestra las estructuras u objetos de una imagen binaria a partir de una conectividad de 4 píxeles (ver

a) b) c) Figura 3.12. a) Imagen original; b) Imagen original binaria; c) Dilatación como una expansión en cruz.

Page 53: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL III. MÉTODO PROPUESTO.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

40

figura 3.15(a) y la Figura 3.15(d) muestra las estructuras a partir de una conectividad de 8 (ver figura 3.15(b)), observe que la conectividad determina si un píxel pertenece o no a una estructura, tal es el caso, en la Figura 3.15(c) hay 3 estructuras y en la figura 3.15(d) tiene solo dos.

Figura 3.13. Proceso de rellenado de una región.

Figura 3.14. a) Imagen dilatada; b) Imagen rellenada.

a) b)

Page 54: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL III. MÉTODO PROPUESTO.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

41

Figura 3.15. a) Conectividad de 4; b) Conectividad de 8; c) Estructuras formadas a partir de una conectividad de 4;

d) Estructuras formadas a partir de una conectividad de 8.

Una vez identificadas las estructuras, la idea es eliminar aquellas que estén unidas al marco y que no pertenecen a nuestro objeto. La Figura 3.16(b) muestra los resultados de eliminar las estructuras de la imagen rellena de la Figura 3.16(a) a partir de una conectividad de 8. a) b)

Figura 3.16. a) Imagen rellenada; b) Imagen sin estructuras en el marco.

0 0 0 0 0 0 0 0 0

0 1 0 0 0 0 0 0 0

1 0 1 0 1 1 1 0 0

1 1 1 0 1 1 1 0 0

0 0 0 0 1 1 1 0 0

0 0 0 0 0 0 0 0 0

a)

c)

0 0 0 0 0 0 0 0 0

0 1 0 0 0 0 0 0 0

1 0 1 0 1 1 1 0 0

1 1 1 0 1 1 1 0 0

0 0 0 0 1 1 1 0 0

0 0 0 0 0 0 0 0 0

b)

d)

Page 55: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL III. MÉTODO PROPUESTO.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

42

3.4.6 Erosión.

La erosión se utiliza para eliminar todas aquellas estructuras que no pertenecen al objeto en estudio. La transformación morfológica de la erosión ⊗ combina dos conjuntos utilizando la sustracción de vectores [4],

⎭⎬⎫

⎩⎨⎧ ∈∈+∈=⊗ BbcadaparaXbdEdBX :2 (3.10)

La expresión (3.10) muestra que cada punto d del conjunto X (datos de la imagen), es

testeado; el resultado de la erosión está dado por los puntos d para los cuales todos los posibles d + b están en X. La Figura 3.17 presenta un ejemplo del conjunto de puntos X erosionados por el elemento estructural B, de donde se aprecian los siguientes resultados:

( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ){ }2,4,2,3,3,2,2,2,1,2,0,2,2,1,2,0=X , ( ) ( ){ }1,0,0,0=B

( ) ( ) ( ){ }2,2,1,2,0,2=⊗ BX

[ ]

⎥⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢⎢

⎡•

=•⊗

⎥⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢⎢

⎡•

0000000000001110000000000

11

0010000100011110010000100

Figura 3.17. Erosión.

Gráficamente la erosión se realiza recorriendo la imagen, por ejemplo, de izquierda a derecha y de arriba abajo y donde exista un 1 situamos el origen del elemento estructural, si todos los unos del elemento estructural coinciden con unos de la imagen, entonces marcamos el píxel de la imagen donde está el origen del elemento estructural con valor 1.

Aunque otro tipo de erosión gráfica menos agresiva es recorrer la imagen de izquierda a derecha y de arriba abajo buscando un 0 y si algún uno del elemento estructural coincide con los unos de la imagen, entonces se marca el elemento estructural pero de ceros, la Figura 3.18 muestra este proceso, pero con una doble erosión sobre segmentos de una imagen. La Figura 3.19 muestra los resultados del proceso de erosión por el elemento estructural simétrico. En ésta se puede apreciar la desaparición de muchos contornos que no pudieron desaparecer en el paso anterior.

Page 56: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL III. MÉTODO PROPUESTO.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

43

Figura 3.18. Erosión gráfica con un elemento estructural simétrico.

Figura 3.19. Erosión de una imagen.

3.5 Construcción de la superficie.

En esta etapa se utiliza el algoritmo “Marching Cubes”. La finalidad de este algoritmo es crear una superficie de densidad constante a partir de un vector de datos 3D, donde las dimensiones vienen dadas por el largo, ancho y número de capas del volumen [5]. La idea es crear una malla poligonal (generalmente triángulos) que se aproxime a la imagen volumétrica. Para determinar qué partes del volumen formarán la isosuperficie, se crea un

0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 1 1 0 0 1 1 1 1 1 0 1 0 0 1 1 1 1 1 0 0 0 1 1 1 1 1 1 0 0 0 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0

11

1

1

0 00

0

0

0

0 0 0 0 0 0 0 0 00 0 0 0 0 0 0 0 00 0 0 0 0 0 0 0 00 0 0 0 0 1 1 1 10 0 0 0 1 1 1 1 10 0 0 0 0 0 0 0 00 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

1ª Erosión 2ª Erosión Segmentos de Imagen

1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1

1 1 1 1 0 1 1 1 11 1 1 0 0 0 1 1 11 1 1 1 0 1 1 1 1

1 1 1 0 0 0 1 1 1 1 1 0 0 0 0 0 1 1 1 1 1 0 0 0 1 1 1

• •

Page 57: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL III. MÉTODO PROPUESTO.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

44

cubo lógico a partir de dos capas contiguas. La Figura 3.20 muestra la formación de un cubo lógico a partir de 2 capas contiguas:

Figura 3.20. Cubo lógico.

3.5.1 Creación de isosuperficie.

Las capas son las imágenes de rebanas, los vértices de este cubo lógico están dados por los píxeles de éstas, cuatro vértices son de los píxeles de una capa y otros 4 vértices son de la capa contigua, es obvio que cada imagen tiene más de 4 píxeles, por lo cual el cubo se va recorriendo por las dos capas, para posteriormente desplazarse a la siguiente capa. Cada uno de los vértices representa un punto en el espacio tridimensional donde se encuentra el objeto, solo que no todos pertenecen a éste, para saber qué vértices pertenecen al objeto bastará con saber qué vértices fueron sacados de un píxel con valor uno, ya que las imágenes son binarias y por tanto, si es uno es parte del objeto y si es cero no.

El objetivo principal es determinar qué cubo lógico pertenece a la superficie del objeto, para saber esto, se propone un umbral, el cual está en relación al valor de cada píxel, esto es, las imágenes son binarias, por tanto los píxeles solamente pueden tomar dos valores, por tanto, el umbral sólo puede estar dentro de estos valores por lo cual se eligió el valor de 0.5 aunque por obvias razones se pudo haber elegido cualquier otro valor dentro de ese rango.

Posteriormente se comparan los ocho vértices del cubo lógico formado con el valor del umbral introducido. Un cubo pertenece a la isosuperficie si al menos hay un vértice que está por debajo del umbral y otro que está por encima, si cumple esto indica que el cubo formará parte de la isosuperficie final. Cuando todos los vértices del cubo están por debajo o por encima del umbral no se procesan ya que no formarán parte de la isosuperficie final. La Figura 3.21 muestra un cubo lógico que pertenece a la superficie de un supuesto objeto ya que sus vértices siguen esta regla.

Capa k

Capa k+1

( )1,1, ++ kji ( )1,1,1 +++ kji

( )1,,1 ++ kji( )1,, +kji

( )kji ,1, + ( )kji ,1,1 ++

( )kji ,, ( )kji ,,1+

Pixel

k j

i

Page 58: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL III. MÉTODO PROPUESTO.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

45

Al determinar los lugares del cubo por donde pasa la superficie en relación de sus vértices y aristas (ver Figura 3.22) se pueden generar triángulos que unan los puntos de intersección. Al unir todos los triángulos generados se obtiene la superficie buscada.

Figura 3.21. Cubo lógico con 7 vértices por encima del umbral y uno por debajo.

Figura 3.22. Numeración de vértices y aristas de un cubo lógico.

Pixel= 0

Pixeles= 1

Pixeles= 1 Pixeles= 1

V6

V1 V2

V4 V3

V8 V7

V5

a1

a2

a3

a4

a5

a7

a6a8

a11 a12

a9 a10 yz

x

V1 Vértices V2 V3 V4 V5 V6 V7 V8

Page 59: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL III. MÉTODO PROPUESTO.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

46

Al marcar un cubo, hay 25628 = posibilidades diferentes en las que la superficie podría interseccionarlo. Cuantos más vértices estén por debajo del umbral, mas posibilidades habrá y por tanto habrá que realizar más triangulaciones. Las 256 posibilidades se reducen a 128 por complemento (se invierten los puntos marcados y luego las normales de los triángulos), en la Figura 3.23(a) se muestra una de estas posibilidades y su complemento. La Figura 3.23 (b) muestra uno de 15 casos y su rotación. Finalmente, los 15 casos son mostrados en la Figura 3.24 y son los que reconstruyen la superficie:

a)

b)

Figura 3.23. a) Cubo lógico y su complemento, y b) Cubo lógico y su rotación.

Creando un índice para cada caso posible basado en el estado del vértice, podemos determinar qué arista del cubo intersecta con un vértice y así hallar todas las posibles combinaciones. En la Figura 3.25 se muestra la construcción de una superficie a partir de cuatro capas con dimensiones de 3x5, también se señalan algunos de los casos con que ésta fue formada.

Page 60: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL III. MÉTODO PROPUESTO.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

47

Figura 3.24. Quince casos efectivos de un cubo lógico.

Figura 3.25. Construcción de una superficie.

1 2 3 4 5 7

8 9 10 11 12 13 14 15

6

Caso 1 Caso 9

Caso 3

Caso 6

Caso 9Caso 2

Page 61: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL III. MÉTODO PROPUESTO.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

48

3.5.2 Iluminación y sombreado.

La luz viaja en línea recta y cuando tropieza con un objeto se producen varios efectos dependiendo de las características del material del objeto [6]. El material del objeto juega un papel muy importante en el resultado final. El color que podemos ver es la suma de estos efectos para cada fuente de luz que haya en la escena. A partir de los efectos que provoca la luz al incidir con una superficie, como son la reflexión especular, reflexión difusa, absorción, transmisión, refracción, luz indirecta y muchos más acerca del comportamiento de la luz, se han creado algoritmos para simular la iluminación y sombreado en un objeto virtual, a saber:

• Algoritmo de Gouraud. • Algoritmo de Phong. • Ray tracing.

En esta tesis se utilizó el algoritmo de Phong debido a que presenta mejores resultados

en la visualización de la iluminación y sombreado que el algoritmo de Gouraud y no demanda tanto gasto computacional como el algoritmo de Ray tracing. 3.5.2.1 Algoritmo de Phong para la iluminación y sombreado.

El método Phong para iluminación local fue desarrollado por Bui Tuong Phong y es una manera extensamente usada y altamente efectiva de producir cierto grado de realismo en objetos tridimensionales [6]. Es considerado una aproximación o modelo empírico porque, aunque es consistente con algunos principios de la física, es en gran parte basado en la observación del fenómeno. Es también conocido como un modelo de iluminación local por que se enfoca principalmente en el impacto directo de la luz proveniente de una o más fuentes locales de luz. Por otro lado, un modelo de iluminación global intenta incluir efectos secundarios tales como la luz que atraviesa un material transparente y la luz reflejada de la superficie de un objeto a otro.

Considere un punto como fuente de luz (ver Figura 3.26), la cual es una luz ideal con toda su energía saliendo de un simple punto en el espacio. Nuestro ojo es el punto de visión mirando a un punto Q en la superficie de un objeto. ¿Cuál debería ser el color de Q? En otras palabras, cuál debería ser el color de la luz reflejada desde Q (en dirección del vector V).

Hay dos casos extremos de reflexión de luz. La primera es llamada reflexión difusa. En este caso la energía luminosa de la fuente de luz en dirección de –L se refleja igual en todas direcciones (ver las flechas que forman un semicírculo en la Figura 3.26). También queremos que el nivel de energía de reflexión sea una función del ángulo θ (entre L y la normal a la superficie N): entre más pequeño sea el ángulo más alta la reflexión, la herramienta matemática nos dice que la reflexión es proporcional al θcos .

Page 62: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL III. MÉTODO PROPUESTO.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

49

Figura 3.26. Diagrama de reflexión. Los vectores son N (normal de superficie), L (fuente de luz), R (reflexión) y V (dirección de

visión). El segundo caso es la reflexión especular, ésta captura las características del brillo. Si la

superficie de la Figura 3.27 fuera un espejo perfecto, la energía de la fuente de luz debería ser reflejada en una dirección (la dirección del vector R). A partir de que un espejo perfecto es inexistente, tenemos que distribuir la energía reflejada con un pequeño cono teniendo como centro R con la reflexión más fuerte a lo largo de R con 0=α y decrementa tan rápido como α incrementa (ver curva de campana en Figura 3.27(c)). Para modelar este efecto se usa αηcos , donde el parámetro η varía los grados de brillantez ( 1=η para una superficie opaca y 500=η para una superficie parecida a un espejo). Para una escena, la reflexión especular en dirección de V es dada mediante el ángulo α entre R y V.

Además de estas reflexiones, se necesita considerar la compleja reflexión interna del

objeto, ya que muchas superficies no son iluminadas por una fuente de luz. Por ello, Phong introdujo una fuente de luz más, la luz ambiente, que ilumina todas las superficies en la escena y da reflexión uniformemente en todas direcciones de cada superficie. De tal manera, las superficies del objeto son pensadas para producir una combinación de reflexión de luz ambiente y reflexión especular/difusa dependiente de una fuente de luz. La intensidad de energía total reflejada I es dada por [7]:

( )( )αθ ηcoscos Sdpaa kkIkII ++= (3.11) donde aI e pI son las intensidades de la luz ambiente y del punto de luz, respectivamente,

ak≤0 es el coeficiente de reflexión de la luz ambiente y 0.1, ≤sd kk son las reflexiones difusa y especular, respectivamente (p. e. 2.0=ak significa 20% de reflexión de aI ).

Page 63: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL III. MÉTODO PROPUESTO.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

50

Figura 3.27. Diagrama de reflexión en dos superficies.

Si L, N, R, y V, son vectores unitarios y siendo el producto punto de dos vectores,

θcos→→→→

⋅=• BABA (3.12)

tenemos que θθθ coscos11cos =⋅=⋅=•→→→→

LNLN y ααα coscos11cos =⋅=⋅=•→→→→

VRVR .

Por lo tanto, podemos escribir (3.11) como,

( )( )ηVRkLNkIkII Sdpaa •+•+= (3.13) cuando hay dos o más fuentes de luz en la escena, sus efectos son acumulativos,

( )( )∑=

•+•+=n

iiSidipaa VRkLNkIkII

1

η. (3.14)

Estas fórmulas son usadas con el modelo de color RGB. De tal manera, la intensidad de

luz tiene la forma de un vector de color RGB, ( )bgr IIII ,,= . Los coeficientes de reflexión

Page 64: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL III. MÉTODO PROPUESTO.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

51

son también tridimensionales. Por ejemplo, ( )3.0,7.0,7.0=dk define una superficie que se ve amarillenta cuando es iluminada con luz blanca. El coeficiente de reflexión ambiental

ak puede ser simplemente dk . Los tres componentes de sk son a menudo hechos a partir de que el color de reflexión de una fuente de luz es típicamente el mismo color de la fuente de luz. Cuando la luz es blanca, las intensidades están dadas por [8],

( )( )( )( )( )( )⎪

⎪⎩

⎪⎪⎨

•+•+=

•+•+=

•+•+=

η

η

VRkLNkIkII

VRkLNkIkII

VRkLNkIkII

I

Sdbpabab

Sdgpagag

Sdrparar

. (3.15)

Este modelo puede es presentado de forma gráfica en la Figura 3.28.

Figura 3.28. Explicación gráfica de la fórmula de Phong.

3.5.2.2 Iluminación de una superficie.

Puesto que la superficie tridimensional de un objeto está formada a partir de triángulos, suponga que el triangulo de la Figura 3.29 forma parte de ésta y que se desea darle iluminación, para esto se calcula la normal del plano. Un triángulo es un polígono definido por tres vértices (puntos), V1 ( )111 ,, zyx= , V2 ( )222 ,, zyx= , y V3 ( )333 ,, zyx= , no colineales, es decir, no se encuentran alineados sobre una línea recta. El vector unitario normal a la superficie del plano que contiene al triángulo, N ( )nznynx ,,= , se obtiene mediante el producto vectorial de dos vectores construidos con los vértices del polígono (ver Figura 3.29) [9]:

( ) ( )( ) ( )1312

1312

VVVVVVVV

N−×−−×−

=→

. (3.16)

Color y Ambiente Difusa Especular

= + +

Page 65: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL III. MÉTODO PROPUESTO.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

52

Figura 3.29. Normal de una superficie.

Recordando que

→→→

→→→

→→

⋅⎟⎟⎠

⎞⎜⎜⎝

⎛+⋅⎟⎟

⎞⎜⎜⎝

⎛−⋅⎟⎟

⎞⎜⎜⎝

⎛=

⎟⎟⎟⎟

⎜⎜⎜⎜

=× kvvuu

jvvuu

ivvuu

vvvuuukji

vuyx

yx

zx

zx

zy

zy

zyx

zyx detdetdetdet (3.17)

y sustituyendo los valores de los vértices ( )2,1,11 =V , ( )3,1,32 =V , y ( )2,2,33 =V , (mostrados en la Figura 3.29) tenemos,

⎟⎠⎞

⎜⎝⎛ ++=⎟

⎠⎞

⎜⎝⎛ ++−⎟

⎠⎞

⎜⎝⎛ ++=−=

→→→→→→→→→→

kjikjikjiVVu 0223312

⎟⎠⎞

⎜⎝⎛ ++=⎟

⎠⎞

⎜⎝⎛ ++−⎟

⎠⎞

⎜⎝⎛ ++=−=

→→→→→→→→→→

kjikjikjiVVv 02222313

( )( )( )2,2,3

3,1,32,1,1

3

2

1

===

VVV

1 2 3 4

1

2

3

1

2

3

4

z

x

y

1V

2V

3V

N

Page 66: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL III. MÉTODO PROPUESTO.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

53

( ) ( ) ( )→→→

→→→

→→

⋅−+⋅−−⋅−=⎟⎟⎟⎟

⎜⎜⎜⎜

=× kjikji

vu 022010012102det

→→→→→

++−=× kjivu 22

( ) ( ) ( ) 3221 222 =++−=×→→

vu

32

32

3

→→→

→→

→→→

++−=×

×=

kji

vu

vuN .

Para calcular L, se elige un punto en el espacio tridimensional, el cual representará la

ubicación de la fuente de luz y formará un vector llamado PLUZ (ver Figura 3.30), la resta de este con 1V entre la magnitud de la misma sustracción, nos dará como resultado el vector unitario L

1

1

VP

VPLLUZ

LUZ

−=

→→

(3.18)

⎟⎠⎞

⎜⎝⎛ ++=⎟

⎠⎞

⎜⎝⎛ ++−⎟

⎠⎞

⎜⎝⎛ ++=−

→→→→→→→→→→

kjikjikjiVP LUZ 855210661

( ) ( ) ( ) 114855 2221 =++=−

VP LUZ

1148

1145

1145

→→→→

++=kjiL

continuando con el cálculo

114316

114310

11435

1148

1145

1145

32

32

3cos ++−=

⎟⎟⎟

⎜⎜⎜

⎛++•

⎟⎟⎟

⎜⎜⎜

⎛++−==•

→→→→→→→→ kjikjiLN θ

0.651147

114321cos ≈===•

→→

θLN 49.03=∴ θ .

Page 67: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL III. MÉTODO PROPUESTO.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

54

Figura 3.30. Ubicación del vector L.

Para encontrar el vector R, el cual es la reflexión del vector L con respecto al vector normal N. Se introducen los vectores auxiliares e y m (ver Figura 3.31),

→→→

−= emR (3.19) y

→→→

+= emL . (3.20) Despejando e de (3.20) y sustituyendo en (3.19) obtenemos,

→→→→→→

−=⎟⎠⎞

⎜⎝⎛ −−= LmmLmR 2 (3.21)

z

x

y

9

6

1V

2V

3V

N

3

3

3

6

6 LUZPL

( )( )( )( )10,6,6

2,2,33,1,32,1,1

3

2

1

====

LUZPVVV

Fuente de Luz

Superficie

N

L

θ

Page 68: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL III. MÉTODO PROPUESTO.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

55

Figura 3.31. Diagrama para el calculo del vector R.

Observe que →

m es simplemente la proyección perpendicular de L en N (ver Figura 3.32) por lo tanto [10],

==L

m

hipotenusaadyacentecat.cosθ θcos

→→

= Lm

Si consideramos que L y N son vectores unitarios tenemos que 1=→

L y →→

•= LNθcos .

Por lo tanto, LNm •= . Definiendo al vector m por su vector unitario,

mUmm = .

Si m y N tienen la misma dirección, el vector unitario →→

= NU m , entonces →→→→

⎟⎠⎞

⎜⎝⎛ •= NLNm . Sustituyendo m en (3.21),

→→→→→

−⎟⎠⎞

⎜⎝⎛ •= LNLNR 2 . (3.22)

Sustituyendo los valores antes obtenidos tenemos que,

⎟⎟⎟

⎜⎜⎜

⎛++−

⎟⎟⎟

⎜⎜⎜

⎛++−⎟

⎠⎞

⎜⎝⎛=

→→→→→→→

1148

1145

1145

32

32

311472 kjikjiR

⎟⎟⎟

⎜⎜⎜

⎛++−=

→→→→

11434

114313

114329 kjiR .

Fuente de Luz Reflexión

especular

Superficie

N

R L

θθe e−

mm

Page 69: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL III. MÉTODO PROPUESTO.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

56

Figura 3.32. Proyección de m en L.

Como demostración de que el ángulo entre →

L y →

N es el mismo que hay entre →

R y →

N a

continuación calculamos el producto punto →→

• NR

⎟⎟⎟

⎜⎜⎜

⎛++−•

⎟⎟⎟

⎜⎜⎜

⎛++−==•

→→→→→→→→

32

32

311434

114313

114329cos kjikjiNR θ

65.0cos ≈=•→→

θNR 49.03=∴ θ .

Para calcular V se elige un punto en el espacio tridimensional, el cual representará la

posición de un observador (ver Figura 3.33), este punto forma un vector llamado PVISTA, la resta de éste con 1V entre la magnitud de la misma sustracción nos da como resultado V.

1

1

VP

VPVVISTA

VISTA

−=

→→

(3.23)

1 2 3

1

2

1

2

4

z

x

y

1V

2V

3V

N

m L

( )( )( )2,2,3

3,1,32,1,1

3

2

1

===

VVV

θ

Page 70: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL III. MÉTODO PROPUESTO.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

57

( ) ( ) ( ) 93

852

852

852

852

852

21063

21063

222

⎟⎠⎞

⎜⎝⎛ ++

=++

⎟⎠⎞

⎜⎝⎛ ++

=

⎟⎠⎞

⎜⎝⎛ ++

⎟⎠⎞

⎜⎝⎛ ++

=

⎟⎠⎞

⎜⎝⎛ ++−⎟

⎠⎞

⎜⎝⎛ ++

⎟⎠⎞

⎜⎝⎛ ++−⎟

⎠⎞

⎜⎝⎛ ++

=

→→→→→→

→→→

→→→

→→→→→→

→→→→→→

→kjikji

kji

kji

kjikji

kjikjiV

⎟⎟⎟

⎜⎜⎜

⎛++=

→→→→

938

935

932 kjiV .

Figura 3.33. Ubicación del observador V.

z

x

y

9

6

1V

2V

3V

N

3

3

3

6

6 LUZPL

VISTAP

V

R

Superficie

Fuente de Luz

Reflexión especular

N

R

V

L

θθ

Vista

( )( )( )( )( )10,6,3

10,6,62,2,33,1,32,1,1

3

2

1

==

===

VISTA

LUZ

PPVVV

Page 71: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL III. MÉTODO PROPUESTO.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

58

Teniendo V, podemos calcular el producto →→

•VR

10602339

938

935

932

11434

114313

114329

=⎟⎟⎟

⎜⎜⎜

⎛++•

⎟⎟⎟

⎜⎜⎜

⎛++−=•

→→→→→→→→ kjikjiVR

1262.01060213

≈=•→→

VR 74.82=∴ α .

Finalmente, sustituyendo cada uno de los valores obtenidos en la fórmula de Phong y

con sus respectivos coeficientes se obtienen las intensidades y se ilumina la superficie. La Figura 3.34(a) muestra el triángulo iluminado con luz blanca ( )1,1,1=pI , con coeficientes

( )08.0,9.0,08.0=ak , ( )0.1,9.0,8.0=dk y ( )0.1,9.0,8.0=sk . Observe que la componente de reflexión especular es obscura debido a que el ángulo entre R y V es grande (ver figura. 3.34(d)) y que la mayor iluminación la aporta la reflexión ambiente seguida de la reflexión difusa (figura 3.34(b) y (c)).

Figura 3.34. Iluminación de una superficie.

a) Combinación de las 3 reflexiones b) Ambiente

c) Difusa d) Especular

Page 72: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL III. MÉTODO PROPUESTO.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

59

3.6 Conclusiones

En este capítulo se presentó el método propuesto para la reconstrucción de objetos en 3D. Se detalla cada uno de los algoritmos que conforman al método propuesto y de manera ilustrativa se provee de ejemplos para la mejor comprensión de cada uno de éstos.

3.7 Bibliografía

[1] http://www.allposters.es/-st/Fotografias-en-color-de-paisajes-naturales-

Posters_c52126_.htm. [2] G. Pajares, J. M. de la Cruz, Visión por Computador, Alfaomega, 2002. [3] J. Canny, A Computational Approach to Edge Detection. In Fischler, M.A. and

Firschein, O. Readings in Computers Vision, 1987. [4] J. Serra, Image Analysis and Mathematical Morphology, Academic Press, London,

1982. [5] Max K. Agoston. Computers Graphics and Geometric Modeling, Implementation and

Algorithms. Springer, 2005. [6] James D. Foley, Andries van Dam, Steven K. Feiner, John F. Hughes, Computer

Graphics. Principes and Practice, Addison-Wesley Publishing Company, 1987. [7] John C. Russ, The Image Processing, Springer, 1999. [8] Zhigang Xiang, Roy A. Plastock, Theory and Problems of Computer Graphics.

Schaum´s outline series, McGraw-Hill, 2000. [9] Francisco Montes de Oca Puzio, Resolución Total de Análisis Vectorial,

U.P.I.I.C.S.A.-I.P.N., [10] Murray R. Spiegel, Análisis Vectorial. Teoría y 480 Problemas Resueltos, Schaum-

McGraw-Hill, 1970.

Page 73: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL IV. RESULTADOS EXPERIMENTALES.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

60

IV. Resultados Experimentales.

4.1. Introducción.

En este capítulo se presentan los resultados experimentales de aplicar el método propuesto a imágenes de 2D para realizar la reconstrucción del objeto en 3D. Se realizaron diferentes pruebas con diferentes números de muestras para simular la reconstrucción de los objetos. Finalmente, se muestra la discusión de resultados acerca del método propuesto. 4.2. Reconstrucción de objetos a partir de muestras reales. 4.2.1. Prueba 1.

Esta prueba se realizó en una papa, la cual se muestra en la Figura 4.1. Algunas imágenes de las rebanadas de esta papa se presentan en la Figura 4.2.

Figura 4 .1. Objeto usado para la prueba 1 (papa).

Figura 4 .2. Muestra de imágenes de rebanadas (papa).

Page 74: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL IV. RESULTADOS EXPERIMENTALES.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

61

La Tabla 4.1 presenta los datos técnicos de los parámetros usados en el método propuesto en el caso de la prueba 1.

Tabla 4.1. Parámetros usados en la prueba 1. Parámetro Valor Rebanadas 65, 33, 17 Grosor de la rebanada 1.5, 3.0, 4.5 mm Umbral Sobel 100-130 Elemento Estructural Cruz Conectividad 4

( )08.0,9.0,08.0=ak

( )0.1,9.0,8.0=dk Coeficientes de Reflexión

( )0.1,9.0,8.0=sk Fuente de luz: Blanca (1,1,1) Luz ambiente: Café (0.8,0.5,0.1)

La Figura 4.3 muestra el objeto reconstruido con diferentes gruesos de rebanada,

observe como al aumentar el grueso de las rebanadas disminuye el número de éstas y por lo que al tener menos muestras el objeto pierde definición. Esto es, debido al muestreo (número de muestras o imágenes de rebanadas) el objeto pierde sus características de forma. (a) (b) (c)

Figura 4.3. Reconstrucción con a) 17 rebanadas, b) 33 rebanadas y c) 65 rebanadas.

Page 75: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL IV. RESULTADOS EXPERIMENTALES.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

62

4.2.2. Prueba 2.

La prueba 2 se realizó en una manzana. La Figura 4.4 muestra el objeto de prueba (manzana) y la Figura 4.5 presenta algunas imágenes de las rebanadas de la manzana usada en esta prueba.

Figura 4 .4. Objeto usado para la prueba 2 (manzana).

Figura 4 .5. Muestra de imágenes de rebanadas (manzana).

La Tabla 4.2 presenta los datos técnicos de los parámetros usados en el método propuesto en el caso de la prueba 2. La Figura 4.6 muestra la reconstrucción del objeto en 3D de acuerdo a los valores proporcionados en la Tabla 4.2.

Page 76: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL IV. RESULTADOS EXPERIMENTALES.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

63

Tabla 4.2. Parámetros usados en la prueba 2. Parámetro Valor Rebanadas 43, 21, 10 Grosor de la rebanada 1.5, 3.0, 4.5mm Umbral Sobel 100-160 Elemento Estructural Cruz Conectividad 8

( )08.0,9.0,08.0=ak

( )0.1,9.0,8.0=dk Coeficientes de Reflexión

( )0.1,9.0,8.0=sk Fuente de luz: Blanca (1,1,1) Luz ambiente: Rojo (1,0,0)

Figura 4.6. Reconstrucción con a) 12 rebanadas, b) 21 rebanadas y c) 43 rebanadas.

a) b)

c)

Page 77: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL IV. RESULTADOS EXPERIMENTALES.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

64

4.3. Reconstrucción de objetos a partir de imágenes de Tomografía. 4.3.1. Prueba 1.

Para la realización de esta prueba se utilizaron varias imágenes de Tomografía, la diferencia de esta prueba a las anteriores es que aquí se desconoce el grosor de la rebanada, esto es, se desconoce la distancia en la cual fueron tomadas cada una de las imágenes de Tomografía.

La Figura 4.7 muestra algunas de las imágenes de Tomografía usadas en la prueba de reconstrucción.

Figura 4 .7. Muestra de imágenes de Tomografía. La Tabla 4.3 muestra los valores de los parámetros usados en la prueba de reconstrucción de objetos en 3D usando imágenes de Tomografía

Tabla 4.3. Parámetros usados en la prueba de Tomografía. Parámetro Valor Rebanadas 30 Grosor de la rebanada ----------- Umbral Sobel 100-160 Elemento Estructural Cruz Conectividad 4

( )08.0,9.0,08.0=ak

( )0.1,9.0,8.0=dk Coeficientes de Reflexión

( )0.1,9.0,8.0=sk Fuente de luz: Blanca (1,1,1) Luz ambiente: Rosa (1,0.75,0.65)

Page 78: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL IV. RESULTADOS EXPERIMENTALES.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

65

La Figura 4.8 presenta la reconstrucción realizada a partir de las imágenes de Tomografía de la Figura 4.7 para 10, 14 y 30 muestras (imágenes o rebanadas). De esta figura podemos ver que mientras mayor sea el número de muestras, mejor es la reconstrucción pues el objeto conserva mejor sus características de forma.

Figura 4.8. Reconstrucción con a) 30 rebanadas; b) 14 rebanadas y c) 10 rebanadas. Finalmente, en la Figura 4.9 se muestran diferentes vistas de la reconstrucción de imágenes de Tomografía en el caso de uso de 30 rebanadas (ver Figura 4.8a).

a) b)

c)

Page 79: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL IV. RESULTADOS EXPERIMENTALES.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

66

Figura 4.9. Diferentes vistas de la cabeza reconstruida.

4.4. Discusión de resultados.

De las Figuras 4.3, 4.6, 4.8 y 4.9 podemos observar que el método propuesto es capaz de realizar la reconstrucción de objetos en 3D. El número de muestras usadas es crítico pues mientras más muestras tengamos mejor resulta la reconstrucción.

El umbral de Sobel óptimo para diferentes imágenes varió entre 100 a 160 permitiendo una aceptable delimitación de los contornos y bordes de los objetos.

El elemento estructural de cruz y la conectividad de 4 y 8 permitieron la extracción de la muestra o imagen para su posterior reconstrucción en 3D mediante el uso de isosuperficies.

La fuente de luz siempre se mantuvo como luz blanca y la luz ambiente cambió dependiendo del color de los objetos reales para que en la visualización de los objetos en 3D, ésta fuera lo más real posible con respecto al objeto real. Finalmente, los coeficientes de reflexión se mantuvieron constantes en todas las simulaciones.

La resolución de la reconstrucción en 3D depende del número y tamaño de muestras usadas para la reconstrucción.

Page 80: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL IV. RESULTADOS EXPERIMENTALES.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

67

Al efectuar la reconstrucción de objetos reales no es posible estimar un error entre el objeto real y el objeto reconstruido en la PC. El error solo puede ser obtenido si las muestras son adquiridas de un objeto simulado en la PC. 4.5. Conclusiones. El método propuesto en esta tesis es capaz de realizar la reconstrucción de objetos en 3D a partir de imágenes en 2D. El problema fundamental es el de tener el número mínimo de muestras requerido para realizar la reconstrucción pues el objeto reconstruido perderá sus características de forma. 4.6. Bibliografía. [1] Matlab, The Language of Technical Computing, versión 7.1, Mathworks Inc., 2005.

Page 81: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL V. CONCLUSIONES.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

68

V. Conclusiones.

5.1. Conclusiones. De los resultados experimentales realizados en imágenes reales podemos observar que

el método propuesto es capaz de realizar la reconstrucción de objetos en 3D. El número de muestras usadas es crítico pues mientras más muestras tengamos mejor resulta la reconstrucción.

En el caso de las imágenes de Tomografía, la visualización en tres dimensiones de

dichas imágenes es la aplicación más interesante del método propuesto, ya que su bajo coste computacional y suficiente resolución lo hacen un método idóneo en estas circunstancias. Sin embargo con la alineación de la cámara y la iluminación adecuada, también se pueden obtener buenos resultados, al reconstruir objetos rebanados. Por otra parte se observo que los algoritmos utilizados en la visualización 3D son muy rápidos, pues solo bastan algunos segundos para generar la imagen 3D a partir de la matriz volumétrica de datos.

En el caso del operador de primera derivada, el umbral óptimo para diferentes imágenes

varió entre 100 a 160 permitiendo una aceptable delimitación de los contornos y bordes de los objetos.

Las operaciones morfológicas sirvieron para eliminar estructuras u objetos ajenos a los

objetos bajo estudio. También permitieron acentuar los bordes de los objetos, pues los algoritmos de primera derivada no obtienen los contornos completamente, es decir, al 100%.

El elemento estructural de cruz y la conectividad de 4 y 8 permitieron la extracción de

la muestra o imagen para su posterior reconstrucción en 3D. El algoritmo de isosuperficies es uno de los métodos más usados en la reconstrucción

de los objetos pues sus requerimientos son fácilmente calculados, además de que provee una resolución aceptable de los objetos reconstruidos.

Los algoritmos iluminación y de sombreado son importantes, ya que dan mayor realismo

a las imágenes que pretendemos representar en la PC. Puesto que la representación con realismo es uno de los objetivos de la computación gráfica. Es por esto, que es importante su uso en industrias como la cinematográfica, arquitectónica, de entretenimiento y sobre todo en la ingeniería.

Existen múltiples algoritmos iluminación y de sombreado con distintos consumos (de

procesador y de memoria), y de distintas dificultad para su implementación. Algunos de estos algoritmos están implementados en hardware, directamente en las tarjetas de video,

Page 82: INSTITUTO POLITÉCNICO NACIONALtesis.ipn.mx/jspui/bitstream/123456789/3908/1/RECONSTRUCCIONOBJ.pdf · El problema de pasar de dos dimensiones a tres dimensiones es tanto teórico

INSTITUTO POLITÉCNICO NACIONAL V. CONCLUSIONES.

RECONSTRUCCIÓN DE OBJETOS TRIDIMENSIONALES A PARTIR

DE INFORMACIÓN BIDIMENSIONAL

69

para acelerar los procesos de imágenes. Los algoritmos más usados dependen de la necesidad que se tenga de un resultado final (si se requiere mejorar la calidad), y también de los recursos computacionales disponibles.

5.2. Trabajo a futuro.

Mejorar la iluminación en la captura de las imágenes para disminuir el valor del umbral Sobel. Adicionalmente, se deberá probar con otros operadores de primera derivada.

Mejorar la adquisición de datos, utilizando una técnica de luz estructurada o visión estereoscópica.

Utilizar un algoritmo de iluminación global, con el que se pueda realizar un sombreado más realista que el presentado en este trabajo, por ejemplo, el algoritmo conocido como ray tracing.

Mejorar la visualización de los objetos mediante algoritmos de interpretación (renderización), los cuales son usados en la reconstrucción de objetos en 3D para proporcionar una mejor representación (forma) del objeto.

Aumentar el número de imágenes que nos permita obtener una mejor reconstrucción de los objetos deseados.

Mejorar el algoritmo propuesto para que sea capaz de efectuar la reconstrucción interna de los objetos bajo estudio.