Reporte Final - SAPPI - Sistema de Administración de ...

29
1 Reporte Final SIMILITUD SEMÁNTICA ENTRE SISTEMAS DE OBJETOS GEOGRÁFICOS APLICADA A LA GENERALIZACIÓN DE DATOS GEO-ESPACIALES 20060965 Director del Proyecto. M. en C. Marco Antonio Moreno Ibarra Centro de Investigación en Compitación Contenido 1. Metodología Desarrollada 1 2. Diseño del prototipo 18 3. Resultados 27 4. Conclusiones 28 RESUMEN La presente investigación esta enfocada en desarrollar un método para evaluar la similitud semántica entre sistemas de objetos geográficos por medio de descripciones semánticas. Actualmente, los modelos de datos geográficos generalmente son representados explícitamente por un conjunto de objetos básicos y sus propiedades (como su geometría y su topología entre otros). En gran parte del mundo geográfico la semántica aparece en las relaciones que poseen grupos de objetos geo-espaciales [Worboys 96] [Papadias et al 97] [Ruas 99] [Mark 99]. Sin embargo, las relaciones no representan fielmente la semántica de los objetos geográficos, existen otros componentes (como la geometría) que deben ser considerados para lograr capturar de mejor forma la semántica de los datos. En el contexto de esta investigación, las descripciones semánticas están orientadas a encapsular el conjunto de propiedades y relaciones que implícitamente poseen conjuntos de datos geográficos. La organización de los datos geográficos se realiza por medio de capas temáticas, donde cada capa temática posee propiedades particulares y en algunos casos las relaciones con otras temáticas son muy peculiares. Por lo que se pretende aprovechar las descripciones semánticas para representar dichas peculiaridades de forma muy concreta, con el fin de evitar ambigüedades. 1. Metodología Desarrollada La metodología propuesta esta basada fundamentalmente en 3 etapas funcionales: Análisis, Síntesis e Interpretación.

Transcript of Reporte Final - SAPPI - Sistema de Administración de ...

Page 1: Reporte Final - SAPPI - Sistema de Administración de ...

1

Reporte Final SIMILITUD SEMÁNTICA ENTRE SISTEMAS DE OBJETOS GEOGRÁFICOS APLICADA A LA GENERALIZACIÓN DE

DATOS GEO-ESPACIALES

20060965

Director del Proyecto. M. en C. Marco Antonio Moreno Ibarra Centro de Investigación en Compitación

Contenido 1. Metodología Desarrollada 1 2. Diseño del prototipo 18 3. Resultados 27 4. Conclusiones 28

RESUMEN

La presente investigación esta enfocada en desarrollar un método para evaluar la similitud semántica entre sistemas de objetos geográficos por medio de descripciones semánticas. Actualmente, los modelos de datos geográficos generalmente son representados explícitamente por un conjunto de objetos básicos y sus propiedades (como su geometría y su topología entre otros). En gran parte del mundo geográfico la semántica aparece en las relaciones que poseen grupos de objetos geo-espaciales [Worboys 96] [Papadias et al 97] [Ruas 99] [Mark 99]. Sin embargo, las relaciones no representan fielmente la semántica de los objetos geográficos, existen otros componentes (como la geometría) que deben ser considerados para lograr capturar de mejor forma la semántica de los datos. En el contexto de esta investigación, las descripciones semánticas están orientadas a encapsular el conjunto de propiedades y relaciones que implícitamente poseen conjuntos de datos geográficos. La organización de los datos geográficos se realiza por medio de capas temáticas, donde cada capa temática posee propiedades particulares y en algunos casos las relaciones con otras temáticas son muy peculiares. Por lo que se pretende aprovechar las descripciones semánticas para representar dichas peculiaridades de forma muy concreta, con el fin de evitar ambigüedades.

1. Metodología Desarrollada

La metodología propuesta esta basada fundamentalmente en 3 etapas funcionales: Análisis, Síntesis e Interpretación.

Page 2: Reporte Final - SAPPI - Sistema de Administración de ...

2

La etapa de Análisis tiene como objetivo extraer las propiedades que proseen los objetos geográficos. Los objetos geográficos son analizados en diversos aspectos con el fin de obtener mediciones que describan de la mejor forma posible dichas propiedades. A su vez, las medidas se utilizarán para realizar una representación conceptual de las propiedades, basada en cuantificación de dichas propiedades con el propósito de conceptualizarlas. Los correspondientes conceptos serán encapsulados en una estructura que represente de forma cuantitativa las propiedades de cada objeto. El proceso de descripción se basa en una ontología que representará las posibles relaciones entre objetos. La descripción en si misma representa una síntesis1 de la base de datos. Una vez realizada la descripción se aplicará a la generalización cartográfica, esto consistirá en evaluar si los datos obtenidos de la generalización son consistentes. Dicha evaluación consistirá en comparar las descripciones de los datos espaciales antes y después de generalizar. Esto permitirá evaluar si la semántica de los datos es preservada después de generalizar. En resumen, el procedimiento para generar descripciones semánticas de datos espaciales, esta compuesto básicamente de tres etapas: Análisis, Descripción e Interpretación (ver Figura 1).

Figura 2. Etapas del proceso de descripción. A continuación se describirán cada una de las etapas propuestas: 1.1 Características de los datos geográficos almacenados en la base de datos espacial Las bases de datos espaciales almacenan datos descriptivos y espaciales. Los descriptivos están orientados a las características atributivas de los datos, tales como área de los objetos, identificadores, entre otros. Por otra parte, los datos espaciales o datos geográficos son instancias de los objetos geográficos. Históricamente, los datos geográficos de han dividido en dos tipos fundamentales: Vectoriales y Raster. Los datos Vectoriales, se ocupan generalmente de los fenómenos discretos. Las características de un fenómeno en el mundo real se representan por un conjunto de primitivas geométricas (puntos, líneas, superficies o 1 En este caso se refiere a realizar una composición o poner juntos a diferentes objetos que están relacionados

Page 3: Reporte Final - SAPPI - Sistema de Administración de ...

3

sólidos) agrupados en capas temáticas2. Otras características, se pueden almacenar como atributos. Los datos raster, generalmente se ocupan de los fenómenos geográficos continuos sobre el espacio, almacenan un conjunto de valores asociados con uno de los elementos en un arreglo regular de puntos o celdas. En general, los datos espaciales poseen muy diversas propiedades que cubren diversos aspectos. En el contexto de este trabajo, nos enfocaremos a describir algunas de estas propiedades, entre las que se encuentran las propiedades topológicas, geométricas, temáticas, cartométricas y lógicas. Dichas propiedades son descritas de forma general en la siguientes subsecciones. 1.1.1 Propiedades Topológicas La topología se refiere a las características de las figuras geométricas que permanecen invariantes si el espacio es deformado elásticamente y continuamente [OGC 1999a] (i.e. cuando los datos geográficos son transformados de un sistema de coordenadas a otro). En el contexto de la información geográfica, la topología es usada para describir la conectividad de un grafo n-dimensional, una propiedad que permanece invariante después de una transformación continúa del grafo. La topología computacional proporciona información sobre la conectividad de primitivas geométricas que se derivan de la geometría subyacente.

En México el organismo encargado de definir las reglas para la elaboración de cartografía es el Instituto Nacional de Geografía Estadística e Informática (INEGI). Dicho instituto propone únicamente las relaciones “comparte” y “conecta” para describir la topología (en mapas topográficos). Estas relaciones no captan en su totalidad la riqueza en semántica de las posibles situaciones .Por dicha razón, es necesario utilizar métodos adicionales para describir la topología.

Un enfoque para describir la topología es el desarrollado por [Egenhofer 1991], denominado modelo de intersección. En dicho modelo se analiza el interior, borde y exterior de los objetos geográficos, representados por Ao, δB y –A respectivamente. Particularmente, utilizaremos el modelo de 9-intersección, en el cual intersección se evalúa analizando el conjunto de intersecciones para cada uno de los 9 elementos en una matriz de relación 3x3 entre los objetos O1 y O2 . Cada componente de la matriz es una intersección entre un componente borde, interior o exterior, de O1 y un componente de O2. Esta matriz es llamada matriz de intersección (ver Figura 9).

Figura 9. Matriz de intersección del modelo de 9-Intersección

2 Para el caso de este documento se usarán indistintamente los términos capa temática, temática y cobertura

Page 4: Reporte Final - SAPPI - Sistema de Administración de ...

4

Cada elemento de la matriz es evaluado como vacío, denotado por Ø, o no vacío, denotado por ¬Ø. Esto nos da un total de 29 = 512 relaciones topológicas binarias candidatas entre dos objetos arbitrarios. Sin embargo, no todas las relaciones candidatas son topológicamente posibles.

El procedimiento para definir las relaciones se basa en la evaluación de cada uno de los elementos de la Matriz de intersección. El resultado de las evaluaciones se representa por un código binario, que puede ser convertido en un número decimal. Para obtener códigos binarios de tuplas, los cuales se definen como sigue:

21 OO δδ ∩ 21 OO °∩°

21 OO δ∩° 21 OO °∩δ

21 OO −− ∩ 21 OO −∩δ

21 OO −∩° 21 OO δδ ∩

21 OO °∩− . Si el valor de la intersección es no-vacía se coloca un 1, en caso contrario se coloca un 0. De esta forma la relación r5113 (111111111) representa una tupla donde las 9 intersecciones son no-vacías y r000 (000000000) representa la relación donde las 9 intersecciones son vacías. De acuerdo al modelo, se tienen 6 grupos de relaciones candidatas: Área/Área, Área/Línea, Área/Punto, Línea/Línea, Línea/Punto y Punto/Punto. Las relaciones topológicas serán la base para construir la ontología. Esto se debe a que dichas relaciones definen las invariantes que deben conservarse para la consistencia de la representación cartográfica.

1.1.2 Propiedades Geométricas La geometría se encarga de analizar las relaciones, propiedades y mediciones de sólidos, superficies, líneas y ángulos. En el contexto de este trabajo la geometría proporciona un medio para describir cuantitativamente, por medio de coordenadas y funciones matemáticas de las características espaciales de los datos, incluyendo dimensión, posición, forma, tamaño y orientación. Las funciones matemáticas usadas para describir la geometría de un objeto dependen del tipo de sistema de coordenadas que se use para definir la posición espacial. La geometría es el único aspecto de la información geográfica que cambia cuando la información es transformada de un sistema de coordenadas a otro.

En lo que respecta al INEGI, describe el tipo de primitiva de representación que debe emplearse para cada temática, las dimensiones mínimas de los objetos que pertenecen a una temática en ciertas escalas. Adicionalmente, se describe si la forma del objeto se representa virtual4, aproximado5 o definido6.

En la literatura, existen muy diversos artículos relacionados con la identificación de propiedades geométricas, por esta razón se ha considerado utilizar algunas propiedades 3 Representa la codificación decimal de la relación, así 511d es equivalente a 111111111b 4 Virtual, significa que el fenómeno geográfico no puede percibirse sobre la superficie, por ejemplo: un canal subterráneo. 5 Aproximado, significa que su posición es calculada con base en otros procedimientos, por ejemplo: una curva de nivel. 6 Definido, significa que el fenómeno geográfico este bien definido para la escala del mapa, por ejemplo: una carretera a una escala grande. representado suponiendo que existe.

Page 5: Reporte Final - SAPPI - Sistema de Administración de ...

5

como las propuestas por [McMaster 1992] que evalúa las propiedades geométricas midiendo densidad, distribución, longitud, forma y sinuosidad de los objetos geográficos. Adicionalmente, se ha considerado emplear el análisis de medidas del proyecto AGENT [AGENT 1999], en el cual se describen y analizan diversas propiedades geométricas de los datos espaciales.

1.1.3 Propiedades Temáticas

Las propiedades temáticas representan las características de cada cobertura de datos espaciales. En este grupo de propiedades se ha considerado incluir aquellos atributos que den una idea de la jerarquía de los objetos. Por ejemplo el orden7 en el caso de los ríos o el nivel administrativo8 en el caso de poblados. Adicionalmente, es necesario incluir aquellas propiedades relacionadas con la representación cartográfica, para representar adecuadamente los datos, i.e. por ejemplo los ríos de color azul, con cierto tipo de línea y con determinado ancho. La Figura 1, muestra los diversos tipos de línea que son empleados para representar diversos componentes de la red hidrológica (corriente de agua intermitente, corriente de agua perenne, corriente que desaparece y cuerpo de agua intermitente), cada uno de ellos utiliza una representación particular, para el caso de México el INEGI establece los criterios de representación de cada objeto geográfico.

7 Orden, es un método para clasificar jerárquicamente los elementos que componen una red de hidrológica. También se conoce como ordenamiento de los cauces de una cuenca; Existen diversos métodos, entre los que podemos mencionar: Horton (1945), Strahler (1957), CLAJER (2001). 8 Se refiere a la importancia administrativa que tiene cada población, por ejemplo para el caso de México, existen capitales estatales y cabeceras municipales, que son representadas de diferente forma.

Page 6: Reporte Final - SAPPI - Sistema de Administración de ...

6

Figura 1. Características de representación de objetos espaciales.

Estas características de representación cartográfica ayudan a percibir en gran parte la semántica de ciertos objetos, ya que en representaciones visuales dicha simbología permite identificar a los objetos y saber ciertas peculiaridades inherentes a los datos.

De acuerdo al INEGI, dichas propiedades están especificadas en los Diccionarios de Datos [INEGI 1995], ahí se especifican los atributos que deben tener cada una de las temáticas que son descritas para mapas topográficos. Hay ciertas temáticas en donde existen atributos que representan la jerarquía de los objetos, por ejemplo para el caso de curvas de nivel se clasifican en curvas maestras, ordinarias, auxiliares y aproximadas. Para los propósitos de este trabajo, se requieren de propiedades que permitan representar explícitamente atributos en forma jerárquica que no se consideran en las normas del INEGI (i.e. orden de un río).

Page 7: Reporte Final - SAPPI - Sistema de Administración de ...

7

1.1.4 Propiedades Lógicas Estas propiedades pretenden describir ciertas propiedades que dependen de la experiencia y se basan en la experiencia que existe en la elaboración de cartografía. Por ejemplo, las carreteras no pueden estar sobre cuerpos de agua, la altura donde comienza un río debe ser mayor que la altura donde termina, etc. En el contexto de este trabajo, dichas propiedades representan un conjunto de restricciones (constraints) que dan consistencia a los datos. Y deberán ser claramente definidas y especificadas. 1.1.5 Propiedades Cartométricas Las propiedades cartométricas, están relacionadas con las características de la representación cartográfica. Estas propiedades cartométricas, se refieren a datos sobre la proyección, el sistema de referencia, la escala entre otros. Es considerada, debido a que en ciertas ocasiones es indispensable conocer dichas características para poder realizar ciertas interpretaciones sobre la cartografía. En ciertos casos ayudan a definir el contexto del mapa en general, por ejemplo la escala define el tipo de representación que debe emplearse, pude indicar el uso de ciertos símbolos o una transformación. 1.1.6 Documentos analizados Durante el desarrollo de este proyecto se realizó un análisis exhaustivo de las propiedades que poseen las representaciones cartográficas. En particular se analizarán las temáticas relacionadas con mapas topográficos, los cuales representan las generalidades de cualquier zona, los documentos a analizados fueron: Instituto Nacional de Geografía Estadística e Informática (INEGI): Elabora

documentos en los cuales se describen las especificaciones sobre contenido que deben presentar los mapas (en este caso topográficos). Los documentos a analizar son Modelo de Datos Vectoriales [INEGI 1995], Diccionario de Datos Topográficos (Vectorial) Escalas 1:50,000 [INEGI 1996], 1:250,000 [INEGI 1995b] y 1:1,000,000 [INEGI 1997], los Catálogos de símbolos y especificaciones para las cartas topográficas y como el caso de estudio de este trabajo es la hidrología se analizará también el diccionario de datos de hidrología superficial[INEGI 1998]. La información obtenida de la documentación del INEGI, es muy importante para el desarrollo de esta investigación, ya que, se busca que este proyecto tenga aplicación directa a la elaboración de cartografía digital de México.

Open Geospatial Consortium (OGC), Es una asociación encargada de establecer los

lineamientos estándares geo-espaciales y de servicios basados en localización. (http://www.opengeospatial.org/). Esta asociación, ha desarrollado diversos documentos denominados especificaciones, en donde se detallan aspectos como: la geometría topología, tipos de relaciones, etc. Se consideraron estos documentos, ya que están encaminados a la interoperabilidad de datos espaciales. Los documentos a analizar son:

Page 8: Reporte Final - SAPPI - Sistema de Administración de ...

8

OpenGIS Reference Model [OGC 2003], Abstract Specification Overview [OGC 1999a], Feature Geometry [OGC 2001], Spatial Referencing by Coordinates [OGC 2004], Locational Geometry Structures [OGC 1999c], Features [OGC 1999d], Relationships Between Features [OGC 1999e], Semantics and Information Communities [OGC 1999f] y Feature Collections [OGC 1999b].

Proyecto AGENT, como resultado del proyecto europeo AGENT, se generaron algunos

documentos, de los cuales algunos son de utilidad en esta etapa del proyecto. Los documentos a analizar son: Selection of Basic Measures [AGENT 1999] y Constraint Analysis [AGENT 1998].

Otros Documentos, Como parte importante del desarrollo de este trabajo se han considerado algunos documentos que consideran propiedades de datos espaciales como: [Lanza 2002] Se realizará un análisis multiescala considerando las series de escalas que realiza el INEGI. Estas escalas son 1:50,000, 1:250,000 y 1:100,000 [INEGI 1996], [INEGI 1995], [INEGI 1997]. Además, que se complementará por mediciones hechas directamente sobre mapas en formato analógico. Este análisis se realizara buscando que propiedades, relaciones y características son preservadas en diferentes escalas. Tomando como base, los documentos de INEGI, se deben considerar diversos contextos. 1.2 Análisis y Conceptualización En esta sección se describirá el procedimiento de análisis de la base de datos espacial. Este procedimiento, esta orientado al análisis cualitativo de las propiedades de los datos espaciales, que se encuentran representados cuantitativamente. En otras palabras se pretende extraer automáticamente las propiedades de los datos, conceptualizarlas y almacenar los conceptos en la base de datos. Una vez realizado el análisis es necesario definir los mecanismos para la clasificación, medición, cuantificación y jerarquización del conjunto de propiedades que poseen las capas de datos espaciales. El mecanismo que se utiliza para conceptualizar esta basado en medidas9. Una medida es un método que no cambia el estado de los objetos geográficos, pero se utiliza para caracterizarlo [Bader et al 1999]. El concepto de medida tradicionalmente se ha aplicado a generalización, por su naturaleza se ha considerado emplearse para las descripciones del mapa. En la descripción y generalización del mapa las medidas se utilizan frecuentemente para diversos propósitos, tales como:

9 Una medida es un procedimiento computacional de medir, el cual representa las bases para la evaluación de características de fenómenos geográficos , para así , auxiliar las necesidades de la descripción de mapas

Page 9: Reporte Final - SAPPI - Sistema de Administración de ...

9

• Ayudar a detectar estructuras significativas en mapas, tales como, grupos de los objetos del mapa (e.g. alineaciones) o características espaciales (e.g. las formas de objetos y distribución de objetos), que se deben preservar o al menos considerar durante el proceso de generalización.

• Conceptualizar, aquellas estructuras, representadas por grupos de objetos, pueden conceptualizarse, es decir, agrupar situaciones semejantes bajo un mismo concepto.

• Detectar conflictos, es decir, definen la necesidad de la generalización. En una aplicación basada en restricciones para generalización, corresponde a la evaluación de las restricciones definidas para los objetos del mapa

• Seleccionar un operador de generalización apropiado, en relación a la estructura semántica y espacial de los datos, se realiza por medio de medidas. Por ejemplo, polígonos aislados de la misma categoría pueden ser agregados, mientras que los polígonos aislados de otras categorías se pueden desplazar en caso de un conflicto de proximidad.

• Definir los parámetros de los algoritmos de generalización, se derivan considerando la severidad de un conflicto basándose en medidas.

• Evaluar la calidad de un resultado de la generalización comparando con el estado anterior, para decidir si el algoritmo seleccionado solucionó un conflicto. Con respecto a restricciones, este paso examina el cambio (mejora o empeora) del cumplimiento de la restricción.

En el contexto de esta investigación las medidas son utilizadas para cuantificar las propiedades de los objetos espaciales. Mientras tanto, los resultados de las mediciones serán utilizadas para extraer características que posteriormente se clasificarán en intervalos, de manera que cada intervalo represente un concepto. Este concepto pretende representar de forma clara la semántica que posee cada objeto o grupos de objetos, ya que por definición los conceptos no deben generar ambigüedades. En [AGENT 1999], se presenta una descripción de algunas de las medidas comunes que son utilizadas para generalización. Además se presenta una evaluación de los algoritmos existentes para realizar mediciones sobre los datos. El procedimiento de conceptualización consta de tres pasos:

1. las medidas para cuantificar los datos por medio de algoritmos, 2. clasificación de intervalos de acuerdo a las mediciones obtenidas, 3. asignación de los conceptos de acuerdo con la clasificación de los intervalos de las

mediciones.

La conceptualización se realiza efectuando mediciones sobre los datos. La Tabla 1, presenta algunas de las medidas orientadas para la conceptualización de datos espaciales. Con el fin de obtener la representación de la geometría explícitamente, utilizando conceptos que no dependen de la escala y evitando la redundancia en los datos, por lo que se puede emplear para identificar inconsistencias.

Page 10: Reporte Final - SAPPI - Sistema de Administración de ...

10

Tabla 1. Medidas sobre la geometría

MEDIDAS

GEOMETRÍA

POSICION & GEOMETRIA FORMA

Posición Tamaño Posición Longitud Área Perímetro

Altura de la curva

Altura de inclinación máxima Ancho mínimo del polígono Rectángulo de limites mínimo

Unión de una línea Detección de un conflicto en la unión Banda Epsilon

Orientación Sinuosidad / Complejidad Medidas de angulosidad Orientación total de un objeto Medidas de Curvas Orientación de una curva Altura max de la curva

Función de densidad de la pendiente Entropía Sinuosidad Descripción de Fourier Densidad de coordenadas

Proporción del acorde máximo Dimensión de fractal Numero de curvas

Alargamiento / excentricidad Excentricidad

Alargamiento Expansión Circularidad Elipticidad Momentos

Compactibilidad Deficiencias convexas Compactibilidad - medidas Cuadratura Cuadratura de pared

Aspectos importantes Ancho mínimo de un edificio Forma de la curva Descripción de la curva Caracterización usando una matriz de dirección-

distancia Numero de puntos Bode mas pequeño

Una vez que se realizan las medidas, es necesario realizar una clasificación de manera que se obtengan intervalos de valores, dichos intervalos representarán un concepto. El concepto

Page 11: Reporte Final - SAPPI - Sistema de Administración de ...

11

tiene como propósito representar de forma cualitativa la geometría de los objetos (ver Figura 2).

Representación espacial Intervalos Concepto

0 - 0.3

Línea poco sinuosa

0.31 – 0.6

Línea medio sinuosa

0 - 0.4

Baja concentración de puntos

0.41 – 0.7

Media concentración de puntos

0.71 - 1

Alta concentración de puntos

1-10

Áreas pequeñas

11-20

Áreas medianas

21-30

Áreas grandes

Figura 2. Clasificación y conceptualización de medidas El proceso de conceptualización será llevado a cabo por un mapeo entre el valor obtenido de una medición y el concepto. En este caso, el rango de los valores representa un concepto. Los intervalos representativos son definidos en la clasificación (por ejemplo, la sinuosidad de una línea puede ser poco, medio, o muy sinuosa). Los valores y los conceptos son diferentes de acuerdo con el caso de estudio. En otras palabras, cada temática deber ser representada por diferentes intervalos o conceptos. Por los que no es lo mismo conceptualizar curvas de nivel que carreteras. Es importante mencionar que se puede tener una misma medida para dos objetos que pertenecen a diferentes temáticas, por lo tanto deben representarse por diferentes conceptos. En la Figura 2 se muestra el mapeo entre el valor de una medición y el concepto. Esto es definido por medio de intervalos (rangos). Posiblemente para definir el concepto que mejor defina un intervalo se realizaran encuestas, las cuales tienen como fin encontrar cual es el concepto que es mejor aceptado por una comunidad para describir una determinada situación. Entonces, para cada situación, se le asigna un concepto que se almacena en la base de datos, con esto, se logra que ciertas propiedades geométricas queden explícitamente representadas en la base de datos. Y dicha conceptualización puede emplearse

Page 12: Reporte Final - SAPPI - Sistema de Administración de ...

12

posteriormente para diversos propósitos, ya que solo se necesita realizar una vez, para cada temática, siempre y cuando no se realicen modificaciones. 1.3 Encapsular, restricciones, propiedades y atributos Una vez que fueron conceptualizadas las propiedades, es necesario generar una estructura de datos que agrupe las propiedades y atributos que posee cada objeto o grupos de objetos espaciales. Adicionalmente, se considera añadir restricciones para cada uno de los objetos, de tal manera que se facilite la interpretación de los datos. Dicha estructura será denominada como Encapsulado de restricciones, propiedades y atributos (ENREPA). En este caso, se ha considerado jerarquizar la importancia de los componentes de ENREPA. Esto se debe a que esta investigación está enfocada a la verificación de la consistencia en la base de datos. Por dicha razón, se evalúan primeramente las restricciones (en caso de no cumplirse una restricción automáticamente se pierde la consistencia), seguidas de las propiedades (representan las características que fueron obtenidas de mediciones, por lo que en ciertos casos pueden aceptarse ciertos cambios en las mediciones, es decir, al modificar una línea puede aceptarse que pase de extremadamente sinuosa a muy sinuosa). Utilizando ENREPA es posible obtener una aproximación de lo que realiza un usuario experto al analizar la cartografía, ya que dicho usuario realiza su propia encapsulación de propiedades para cada objeto. 1.4 Descripción Como se ha mencionado, el proceso de descripción estará basado en una ontología. Para ser más especifico se generará una ontología espacial base. Se ha considerado utilizar una ontología debido a que dichas estructuras pretende describir una situación, en este contexto las relaciones entre primitivas de representación. Las relaciones empleadas, se obtienen a partir del análisis de diversas fuentes, son presentadas en la Tabla 2. Aquí se presentan algunas relaciones espaciales que son intuitivas y son de uso común por los usuarios de cartografía digital.

Page 13: Reporte Final - SAPPI - Sistema de Administración de ...

13

Tabla 2. Posibles relaciones entre objetos

Punto Línea Área Punto Pertenece Pertenece Pertenece Línea Pasa por Pasa por Conecta Área Pertenece Pertenece Pertenece

A partir de las relaciones representadas en la tabla anterior se desarrolla la ontología que pretende describir las relaciones topológicas (ver Figura 3). Cabe señalar que posiblemente sean añadidas mas relaciones para enriquecer la ontología.

Figura 3. Ontología de Relaciones entre Primitivas de objetos

Para comenzar la descripción debe seleccionarse que objeto será descrito. Con el propósito evitar describir relaciones innecesarias se propone la generación de un buffer a una cierta distancia, de manera que sea utilizado para identificar que objetos tienen una relación relevante en el entorno del objeto de interés. El buffer generado permitirá además seleccionar los objetos relacionados. Las relaciones relevantes (R), serán descritas explícitamente en la descripción generada. Para encontrar el tipo de relación que existe entre los objetos se utilizará la ontología, que como se ha mencionado describe la topología del mapa. Dichas relaciones serán parametrizadas representando explícitamente el objeto que se relaciona. La parametrización será de la forma R(On), de manera que cada relación representa un operador semántico. Se denomina operador semántico debido a que la representación explicita de la relación espacial y el objeto geográfico define la semántica que existe en la realidad entre ambos objetos. La descripción, tiene como fin generar descripciones de la forma:

OX {R (O1); R (O2); R (O3); … R (On)} donde:

Primitivas Geométricas

Puntos Áreas Líneas

Pertenece Pertenece

Pertenece

Pasa porPertenece

Pasa por

Conecta

Pertenece

Es un Es un

Page 14: Reporte Final - SAPPI - Sistema de Administración de ...

14

OX – Representa el objeto de cual se quiere describir su entorno, R – Representa la relación entre objetos, O1, O2, O3,...,On – Representan los objetos que tienen relación con Ox. El pseudo-código del proceso de descripción se compone de las siguientes etapas:

1. Seleccionar el objeto, del cual se requiere describir su entorno (Ox).

2. Generar la sentencia “OX {”

3. Identificar las R y almacenarlas en R[n]

4. Seleccionar los objetos que tengan R con OX .

5. Almacenar los identificadores de cada objeto en un arreglo A[].

6. Seleccionar un elemento del A[n]. Comenzando con n = 0

7. Utilizar la ontología para identificar el tipo de relación que existe entre A[n] y R[n].

8. Generar la sentencia “relación10 (A[n])”

9. Si n < Card (A[]), n = n+1 y regresar a 6

10. Si n = Card (A[]), generar la sentencia “}” Utilizando este mecanismo de descripción, se hace posible relacionar diversas temáticas que en los enfoques tradicionales de bases de datos espaciales no se consideran, ya que tradicionalmente la organización de los datos en sistemas de información geoespaciales esta basada en capas temáticas separadas. Este método relaciona conceptos de diversas temáticas, por lo que se pueden analizar la relaciones entre dos o más temáticas. Esto representa una ventaja si consideramos que el entorno de los objetos cartográficos intervienen otros objetos relacionados entre sí, y la representación de dichas relaciones definen la semántica que se debe transmitir al usuario de los datos geográficos. 1.5 Interpretación Con el fin de probar la utilidad del método presentado, se ha decidido utilizar como caso de estudio la generalización automática de datos espaciales. Específicamente, se empleará para evaluar si los datos obtenidos por generalización automática son consistentes. Dicho de otra forma, la interpretación en este caso consiste en verificar si la semántica es preservada después la generalización.

10 relación puede ser conecta, pasa por, según sea el caso.

Page 15: Reporte Final - SAPPI - Sistema de Administración de ...

15

El proceso de interpretación se presenta en la Figura 4, en donde se pueden observar 3 componentes funcionales: (1) Descriptor geo-espacial, (2) Verificación y (3) Generalización Automática.

Figura 4. El proceso de interpretación

El Descriptor geo-espacial, es el encargado de generar las descripciones de datos (En el caso de la Figura genera DS y DG que representan las descripciones del datos fuente y generalizadas respectivamente). Verificación, es el componente encargado de comparar DS y DG para realizar la interpretación de la generalización. Dicho de otra forma, este proceso esta orientado a identificar invariantes que deben preservarse. Generalización Automática, esta relacionada con un módulo orientado a generalizar datos espaciales (como resultado se obtiene los datos generalizados GM, el cual también deberá ser conceptualizado, ya que en la mayor parte de los casos algunas propiedades pueden cambiarse).

El proceso de Verificación, básicamente comparará las descripciones que se generaron mediante la ontología. Como primer paso se compararán los operadores de descripción para DS y DG (las relaciones), en caso de que sean iguales, se continuará evaluando restricciones, para después comparar propiedades y atributos (resolver ambigüedades). De manera de no hacer muy restrictivo este procedimiento (y añadir una dosis semántica al sistema) algunas propiedades serán aceptadas como válidas en ciertos contextos11. La Tabla 3, presenta los resultados de las evaluaciones entre operadores. Donde S y T son las relaciones entre los objetos y A y B son dos objetos geográficos. De la evaluación de las relaciones existen tres posibles resultados igual, diferente, semejante. Cada uno de los casos se detalla a continuación (en este caso solo se detalla el primer nivel de semejanza que consiste en evaluar relaciones topológicas):

11 En este caso el contexto se define por el propósito del mapa

Page 16: Reporte Final - SAPPI - Sistema de Administración de ...

16

Tabla 3. Resultados de la interpretación del mapa

Evaluación Representa Significado SA = TB Igual- La relación es

preservada. Se preservo la invariante después de la generalización

La semántica se conserva

SA ≠ TB Diferente- La relación no es preservada. La invariante no es respetada ya que se genero una inconsistencia

No se preserva la semántica

SA ≅ TB Semejante- La relación no es preservada. Sin embargo, no representa una inconsistencia

La semántica se conserva, en este contexto

Igual.- La relación que existe entre los objetos es exactamente igual en cada una de las

descripciones. Esto significa que la invariante semántica 12es preservada. La Figura 4 presenta el caso donde el rió esta al NE de la ciudad. Después de generalizar esta relación se preserva. Aunque la geometría de la línea que representa al rió haya cambiado su forma. Para identificar esto se utilizarán el conjunto de propiedades y restricciones

Figura 4. Resultado de evaluación con resultado Igual

Diferente.- Esto significa, que la relación existente entre los diferentes objetos no preserva la semántica de una situación determinada. La Figura 5, presenta el caso donde

12 Relación o propiedad que debe preservarse después de una transformación, en este caso después de generalizar

Page 17: Reporte Final - SAPPI - Sistema de Administración de ...

17

el rió estaba originalmente al NE de la ciudad y después de generalizar esta relación cambia a SW, entonces esta relación no puede aceptarse como válida. Ya que la semántica no se preserva.

Figura 5. Resultado de evaluación con resultado Diferente (Caso 1)

Semejante.- En este caso la relación puede ser aceptada como válida para un contexto

en específico. Esto significa que para ciertas aplicaciones esta relación puede representar que la semántica es preservada. La Figura 6, presenta el ejemplo donde la relación cambia de NE a NNE, por lo que son conceptos no muy alejados (significan algo muy parecido), por lo que bajo ciertos contextos se pueden considerar que son “semejantes”.

Figura 6. Resultado de evaluación con resultado Semejante

Por otro lado la Figura 7, muestra el caso donde el rió estaba originalmente al NE de la ciudad y después de generalizar esta relación cambia a NW, entonces esta relación tampoco puede aceptarse como válida, como en el caso anterior. Ya que estos conceptos representan cosas muy diferentes.

Figura 7. Resultado de evaluación con resultado Diferente (caso 2)

Page 18: Reporte Final - SAPPI - Sistema de Administración de ...

18

La evaluación de las propiedades y restricciones es el siguiente paso, y puede realizarse utilizando técnicas de medición de similitud, como las presentadas en [Levachkine 2005]. En donde se utilizan jerarquías de conceptos para medir similitud entre ellos. Para los fines de este trabajo habrá que detallar como se realizarán las medidas de similitud mencionadas. En esta sección se ha presentado la metodología general para medir la similitud entre diferentes representaciones de objetos geográficos. Para realizar esto se utilizan conceptualizaciones de los datos geográficos, con el fin de añadir una dosis semántica en el procesamiento. Esta dosis semántica es incluida considerando aspectos sobre como los usuarios de los datos perciben las propiedades de los objetos geográficos. Adicionalmente, se pretende emplear las mediciones como mecanismo para obtener la conceptualización ya que han sido bien estudiados y desarrollados, por lo que se considera que son una buena base para este trabajo. La conceptualización que se usará será obtenida por medio de un análisis de las propiedades de objetos geográficos y contemplada en una ontología. La conceptualización será elaborada considerando diversos aspectos de los datos, tales como geometría, cartometría, topología y temática. En conjunto, las propiedades se utilizarán para describir e interpretar los datos geo-espaciales.

2. Diseño del Prototipo

El diseño del descriptor topológico consta de cinco partes principales, las cuales se describen a continuación:

Origen de datos. El sistema está diseñado para admitir dos fuentes de datos como entrada. Estos datos espaciales son los que componen la base de datos espacial. Estos datos pueden estar en formato shapefile (ver Anexo B) o en formato geofile (ver Anexo A), este último es el formato nativo del descriptor. El formato geofile fue desarrollado tanto para facilitar el manejo y análisis de objetos espaciales, como para almacenarlos en disco duro.

Conversión a formato geofile; en esta etapa, si originalmente los datos espaciales están formato shapefile, el sistema debe de realizar un proceso de conversión a formato geofile para que puedan ser manipulados por el descriptor y poder obtener las descripciones topológicas. Si los datos espaciales están en formato geofile, el sistema únicamente copia el contenido de los archivos a la memoria del sistema.

Análisis de relaciones, en esta etapa del sistema se realizan dos niveles de análisis: el análisis de las relaciones intrínsecas y el análisis de las relaciones extrínsecas, los cuales se realizan de forma independiente.

Descripciones topológicas, son el resultado del análisis de las relaciones entre los objetos geo-espaciales que componen la base de datos espacial. Las descripciones se almacenan en

Page 19: Reporte Final - SAPPI - Sistema de Administración de ...

19

archivos de formato dBASE (.dbf), con eso las descripciones topológicas se representan de forma explícita en la base de datos espacial.

Base de datos espacial, se encarga de almacenar las descripciones topológicas, creando una tabla para cada descripción topológica que es obtenida del análisis intrínseco y extrínseco de los objetos espaciales. Estas tablas contienen las relaciones topológicas y los objetos espaciales son almacenados en formato geofile. Adicionalmente, es posible exportar las descripciones topológicas para emplearlas en otros sistemas. El diseño se muestra en la Figura 8.

Figura 8. Esquema global de funcionamiento del Descriptor Topológico.

En el diseño del Descriptor Topológico para las etapas de conversión del formato geofile y los análisis intrínseco y extrínseco, es necesario modelar una serie de clases las cuales tienen la función de manipular los elementos geométricos de los objetos espaciales, además de adecuarlos al formato geofile que es el formato nativo del Descriptor Topológico. Por lo que las clases se adecuaron de acuerdo con la especificación de este formato de archivo

shapefiles

geofiles

Origen de datos

Conversión a formato geofile

Análisis de relaciones

Análisis de Relaciones Intrínsecas

Análisis de Relaciones Extrínsecas

Descripciones topológicas

geofiles +

Descripciones topológicas

Base de Datos Espacial

Topología explícita

Exportar

shapefiles

Descripciones topológicas

Page 20: Reporte Final - SAPPI - Sistema de Administración de ...

20

2.1 Modelado de clases

El modelado de las clases consiste en el Modelo Topológico de Datos. Se modelaron objetos espaciales básicos (puntos, nodos, arcos y polígonos). También se modeló una clase diseñada para organizar los objetos espaciales en capas de datos de forma independiente. En esta sección, el término “clase” es usado en el sentido de Programación Orientada a Objetos, el cual se refiere a un nuevo tipo de dato con atributos y métodos.

2.1.1 Modelo de clases para manejo de objetos espaciales

De acuerdo con el modelo topológico de datos, se definieron a las siguientes clases de objetos, las cuales se muestran en la Tabla 5.

Tabla 5. Clases para el manejo de objetos espaciales.

Nombre de de la Clase Objeto espacial

Punto Esta clase almacena las coordenadas de cada vértice.

Nodo Esta clase maneja objetos punto.

Arco Esta clase maneja objetos línea.

Polígono Esta clase maneja objetos área.

La clase que organiza los objetos espaciales en capas de datos es llamada DataLayer.

La Figura 9 muestra el diagrama de clases para el manejo de los objetos espaciales dentro del sistema para obtener las relaciones topológicas entre estos.

Page 21: Reporte Final - SAPPI - Sistema de Administración de ...

21

DataLayer Poligono

Punto

Nodo Arco

n

1

Instancia

n

1

Instancia

2 1

n

1

Instancia

2

1

Referencia

n1Instancia

1

1

Instancia

n

1

Instancia

Figura 9. Diagrama de clases.

2.2.1.1. Clase Punto

Esta clase almacena cada par de coordenadas de los vértices en que está compuesto cada objeto espacial; es decir, las clases para representar nodos, arcos y polígonos están compuestas por listas derivadas de esta clase. Por tal razón esta clase provee de métodos propios que analizan la posición de un punto con respecto a otros objetos espaciales. Tales métodos se describen en la Tabla 6.

Tabla 6. Métodos de la Clase Punto.

Método Descripción

inPoly() Regresa Verdadero si un objeto puntual está dentro de un objeto areal. Falso en caso contrario.

OutPoly() Regresa Verdadero si un objeto puntual está fuera de un objeto areal. Falso en caso contrario.

bPoly() Regresa Verdadero si un objeto puntual está en la frontera de un objeto areal. Falso en caso contrario.

inArc() Regresa Verdadero si un objeto puntual está dentro de un objeto lineal. Falso en caso contrario.

Page 22: Reporte Final - SAPPI - Sistema de Administración de ...

22

outArc() Regresa Verdadero si un objeto puntual está fuera de un objeto lineal. Falso en caso contrario.

bArc() Regresa Verdadero si un objeto puntual está en la frontera de un objeto lineal. Falso en caso contrario.

OutNode() Regresa Verdadero si las coordenadas de un objeto puntual coinciden con las de otro objeto puntual. Falso en caso contrario.

bNode() Regresa Verdadero si las coordenadas de un objeto puntual no coinciden con las de otro objeto puntual. Falso en caso contrario.

2.2.1.2 Clase Nodo

Esta clase se utiliza para almacenar la estructura geométrica de objetos punto. Esta clase tiene como uno de sus atributos un objeto de la clase Punto y por lo tanto utiliza los métodos provistos por esta clase para analizar la topología de objetos punto con respecto a otros objetos geográficos.

En la Tabla 6 se describen únicamente los atributos que la componen la clase Nodo, pues ésta no cuenta con métodos propios.

Tabla 6. Atributos de la Clase Nodo.

Atributo Descripción

Punto Es de tipo Punto y se utiliza para almacenar la localización del objeto puntual.

*arcos Es una lista dinámica de instancias de la clase Arco. Cada elemento de la lista se utiliza para hacer referencia a un objeto lineal al cual el nodo pertenece.

Narcos Atributo de tipo int que almacena el número de arcos a los que el nodo pertenece.

n_id De tipo int. Almacena el identificador del objeto puntual.

2.1.1.3 Clase Arco

Esta clase se utiliza para almacenar la estructura geométrica de objetos línea. Esta clase, al igual que en el caso de la clase Nodo, utiliza los métodos provistos por la clase Punto. Adicionalmente a esto, también provee métodos propios que sirven para analizar la topología de objetos línea con respecto a otros objetos espaciales.

En la Tabla 7 se describen los atributos que componen la clase Arco.

Page 23: Reporte Final - SAPPI - Sistema de Administración de ...

23

Tabla 7. Atributos de la Clase Arco.

Atributo Descripción

nodo_inicio De tipo Nodo. Almacena un objeto puntual que es el nodo inicio del objeto lineal.

nodo_final De tipo Nodo. Almacena un objeto puntual que es el nodo final del objeto lineal.

poly_izq De tipo int. Almacena el identificador del objeto areal que está a la izquierda del objeto lineal.

poly_der De tipo int. Almacena el identificador del objeto areal que está a la derecha del objeto lineal.

*p_i Apuntador de tipo Poligono. Hace referencia al objeto areal que está a la izquierda del objeto lineal.

*p_d Apuntador de tipo Poligono. Hace referencia al objeto areal que está a la derecha del objeto lineal.

*punto De tipo Punto. Es una lista de vértices que conforman el objeto lineal.

longitud De tipo double. Almacena la longitud del objeto lineal.

npuntos De tipo int. Almacena el número de vértices que conforman el Arco.

a_id De tipo int. Almacena el identificador del objeto lineal.

En la Tabla 8 se describen los métodos de la clase Arco.

Tabla 8. Métodos de la Clase Arco.

Método Descripción

arcDisjNode() Regresa Verdadero si el objeto lineal es disjunto a un objeto puntual. Falso en caso contrario.

pointInArc() Regresa Verdadero si un objeto puntual está dentro de un objeto lineal. Falso en caso contrario.

pointInB() Regresa Verdadero si un objeto puntual está en el límite de un objeto lineal. Falso en caso contrario.

arcDisjPoly() Regresa Verdadero si el objeto lineal está fuera de un objeto areal. Falso en caso contrario.

arcInPoly() Regresa Verdadero si el objeto lineal está dentro de un objeto areal. Falso en caso contrario.

arcMeetPoly() Regresa Verdadero si el nodo inicial o nodo final del objeto lineal está en el límite de un objeto areal. Falso en caso contrario.

arcCrossPoly() Regresa Verdadero si el interior del objeto lineal está dentro de un objeto areal y sus nodos inicial y final están fuera de un objeto areal. Falso en caso contrario.

arcInterPoly() Regresa Verdadero si el nodo inicial o final del objeto lineal está dentro del objeto areal y el otro está fuera de un objeto areal. Falso en caso contrario.

arcDisjArc() Regresa Verdadero si el objeto lineal es disjunto a otro objeto lineal. Falso en caso contrario.

Page 24: Reporte Final - SAPPI - Sistema de Administración de ...

24

arcMeetArc() Regresa Verdadero si dos objetos línea están conectados por sus límites. Falso en caso contrario.

arcInArc() Regresa Verdadero si todos los vértices de un objeto lineal están dentro de otro objeto lineal. Falso en caso contrario.

arcCrossArc() Regresa Verdadero si el objeto lineal cruza a otro objeto lineal. Falso en caso contrario.

arcMeetInArc() Regresa Verdadero si el objeto lineal conecta con el interior de otro objeto lineal. Falso en caso contrario.

2.1.1.4 Clase Poligono

Esta clase se utiliza para almacenar la estructura geométrica de objetos área. Esta clase además de proveer métodos propios para analizar las relaciones con otros objetos espaciales, también utiliza los métodos provistos por las clases Punto y Arco.

La clase Poligono es una de las clases más completas, puesto que debido al diseño de ésta es posible descomponer en partes un objeto polígono; es decir, en sus elementos geométricos (arcos y nodos). Por lo que es posible analizar cada parte de un objeto areal de forma independiente.

En la Tabla 9 se describen los atributos que la componen.

Tabla 9. Atributos de la Clase Poligono. Atributo Descripción

*arcos De tipo Arco. Es la lista de objetos línea que conforman un objeto área

area De tipo double. Almacena el área de un objeto areal.

perimetro De tipo double. Almacena el perímetro de un objeto areal.

narcos De tipo int. Almacena el número de objetos línea que conforman el objeto areal.

a_id De tipo int. Almacena el identificador del objeto areal.

En la Tabla 10 se describen los métodos de la clase Poligono que ayudan a analizar la topología con otros objetos espaciales.

Tabla 10. Métodos de la Clase Poligono. Método Descripción

polyDisjPoly() Regresa Verdadero si el objeto areal es disjunto de otro objeto areal. Falso en caso contrario.

polyMeetPoly() Regresa Verdadero si las coordenadas de un vértice del límite del objeto areal coinciden con las coordenadas de un vértice del límite de otro objeto areal. Falso en caso contrario.

polyInPoly() Regresa Verdadero si el objeto areal está dentro de otro objeto areal. Falso en caso contrario.

polyEqualPoly() Regresa Verdadero si todos los vértices del objeto areal coinciden exactamente con todos los vértices de otro objeto areal. Falso en caso contrario.

Page 25: Reporte Final - SAPPI - Sistema de Administración de ...

25

polyInterPoly() Regresa Verdadero si el objeto areal intersecta a otro objeto areal. Falso en caso contrario.

polyAdjPoly() Regresa Verdadero si el objeto lineal tiene un límite común con otro objeto areal. Falso en caso contrario.

pointInPoly() Regresa Verdadero si un objeto puntual está en el interior del objeto areal. Falso en caso contrario.

pointOutPoly() Regresa Verdadero si un objeto puntual está fuera del objeto areal. Falso en caso contrario.

pointBPoly() Regresa Verdadero si un objeto puntual está en el límite del objeto areal, Falso en caso contrario.

arcDisjPoly() Regresa Verdadero si un objeto lineal está fuera del objeto areal. Falso en caso contrario.

arcInPoly() Regresa Verdadero si un objeto areal está en el interior del objeto areal. Falso en caso contrario.

arcMeetPoly() Regresa Verdadero si el límite del objeto lineal conecta con el límite del objeto areal. Falso en caso contrario.

arcCrossPoly() Regresa Verdadero si el interior de un objeto lineal está dentro de un objeto areal y sus nodos inicial y final están fuera del objeto areal. Falso en caso contrario.

arcInterPoly() Regresa Verdadero si el nodo inicial o final de un objeto lineal está dentro del objeto areal y el otro está fuera del objeto areal. Falso en caso contrario.

2.1.1.5 Clase DataLayer

Esta clase está diseñada para almacenar un conjunto de objetos espaciales del mismo tipo (objetos punto, línea o área). Por ejemplo, una capa de datos que contenga únicamente cuerpos de agua, entonces un conjunto de objetos de este tipo compone una capa de datos, y un conjunto de instancias de esta clase, conforma una base de datos espacial.

En la Tabla 11 se describen los atributos que la componen.

Tabla 11. Atributos de la Clase DataLayer.

Atributo Descripción

*n De tipo Nodo. Lista de objetos punto, donde cada elemento de la lista almacena un objeto puntual.

*a De tipo Arco. Lista de objetos línea, donde cada elemento de la lista almacena un objeto lineal.

*p De tipo Poligono. Lista de objetos área, donde cada elemento de la lista almacena un objeto areal.

Nnodes De tipo int. Almacena el número de objetos punto que conforman la capa de datos.

Narcos De tipo int. Almacena el número de objetos línea que conforman la capa de datos.

Page 26: Reporte Final - SAPPI - Sistema de Administración de ...

26

Npolys De tipo int. Almacena el número de objetos área que conforman la capa de datos.

Tipo De tipo int. Almacena el tipo de objeto espacial que maneja una instancia de esta clase (objeto puntual, lineal o areal).

La Tabla 12 describe los métodos de la clase.

Tabla 12. Métodos de la Clase DataLayer.

Método Descripción

getTop() Extrae del formato shapefile los objetos espaciales y los transforma al formato geofile (ver Anexo A), además de obtener la topología básica (conectividad de arcos y adyacencia de polígono).

setBDE() Genera la tabla de atributos asociados a los objetos espaciales en formato dBASE.

2.2 Obtención de relaciones topológicas. Clase Relaciones

Para obtener las relaciones topológicas (intrínsecas y extrínsecas) se diseño la clase Relaciones, en la cual cada uno de sus métodos analiza un par de objetos espaciales de cualquier temática y verifica si éstos cumplen con las propiedades de la relación y de ser así retorna Verdadero, indicando de esta forma que entre ese par de objetos existe una relación. En caso contrario retornará Falso.

En la Tabla 13 se describe cada uno de los métodos encargados de obtener las relaciones entre pares de objetos espaciales.

Tabla 13. Métodos de la Clase Relaciones.

Atributo Descripción

Conecta() Analiza si entre dos objetos espaciales existe la relación Conecta, de acuerdo con la definición de está relación.

Comparte() Analiza si entre dos objetos espaciales existe la relación Comparte, de acuerdo con la definición de está relación.

Page 27: Reporte Final - SAPPI - Sistema de Administración de ...

27

ComparteLimite() Analiza si entre dos objetos espaciales existe la relación Comparte Límite, de acuerdo con la definición de está relación.

Dentro() Analiza si entre dos objetos espaciales existe la relación Dentro, de acuerdo con la definición de está relación.

Cruza() Analiza si entre dos objetos espaciales existe la relación Cruza, de acuerdo con la definición de está relación.

Intersecta() Analiza si entre dos objetos espaciales existe la relación Intersecta, de acuerdo con la definición de está relación.

Cada uno de los métodos definidos en esta clase fueron implementados utilizando polimorfismo para diferenciar los distintos casos de los que puede ocurrir una relación entre los distintos objetos espaciales.

Con el análisis de los objetos geo-espaciales que componen una capa temática se definieron un conjunto de seis relaciones, con las cuales, de acuerdo al modelo propuesto se realiza el análisis de las relaciones topológicas en dos niveles: intrínseco y extrínseco. Una vez identificadas las relaciones se representan en la base de datos por medio de un concepto que se almacena en la base de datos espacial, de esta forma se genera una descripción explícita de las relaciones topológicas.

Las relaciones que se definieron se consideran para casos generales que pueden ocurrir entre entidades en el mundo real. Se definieron clases como tipos de datos para el manejo de datos espaciales, así como sus métodos para la obtención de las descripciones topológicas.

3. Resultados Se desarrollo el marco para evaluar la similitud semántica y se trabajo en 2 direcciones el aspecto topológico y el aspecto geométrico, los cuales vienen reportados en los artículos denominados: • K. Verastegui, M. Martinez, M. Moreno, S. Levachkine and M. Torres, “Incorporating

Semantics into GIS Applications”, in B. Gabrys, R.J. Howlett and L.C. Jain, Lecture Notes in Artificial Intelligence, Vol. 4251, Springer-Verlag, Berlin Heidelberg, 2006, ISSN: 0302-9743, pp. 698-705.

• K. Verástegui, M. Moreno-Ibarra and M. Torres, “Spatial analysis to generate a

conceptualization of geometric properties” , in S. Levachkine and M. Moreno-Ibarra (Eds.), Special Issue: Semantics in Geoinformatics Application, Research on Computing Science, Vol. 25, pp. 121-133, ISSN: 1870-4069.

Page 28: Reporte Final - SAPPI - Sistema de Administración de ...

28

• V. Villegas, R. Quintero, K. Verástegui, M. Moreno and M. Torres, “Conceptualización de Modelos Digitales de Elevación basada en Propiedades Geométricas”, XII Simposio Internacional de Sistemas de Información Geográfica y Percepción Remota, Cartagena de Indias, Colombia, 2006. E-proceedings.

• V. Montes de Oca, M. Torres, M. Moreno and S. Levachkine, “Descripción de datos

espaciales por medio de un sistema basado en conocimiento”, XII Simposio Internacional de Sistemas de Información Geográfica y Percepción Remota, Cartagena de Indias, Colombia, 2006. E-proceedings.

Además de finalizó una tesis de Maestría denominada: • Descriptor topológico para mapas topográficos, Miguel Alejandro Martínez Rosales,

CIC. Y esta por concluirse la tesis de Maestría denominada: • Conceptualización de aspectos geométricos en el contexto de datos Geo-espaciales,

Karina Verastegui Barranco, CIC Adicionalmente con este proyecto se graduaron 2 estudiantes de licenciatura con la tesis: • Biblioteca para la Simplificación de Cartografía Digital en la Web, Rafael Bucio

Martínez y Luis Antonio Flores Jiménez de la UPIITA. Se desarrollaron 2 prototipos, el primero es Descriptor Topológico y el segundo es Descriptor Geométrico que será presentado en la tesis de Karina Verastegui. 01/09/2005 07/06/2006

4. Conclusiones El trabajo esta principalmente orientado a incorporar semántica al procesamiento de datos

geo-espaciales y está basado en una conceptualización. El contenido semántico se incorpora

por medio de conceptos y sus relaciones. Dichos conceptos son generados analizando los

datos geográficos en diversos aspectos (topológico, geométrico, temático, cartométrico y

lógico). La idea fundamental de la conceptualización es representar la semántica que esta

implícitamente representada en las bases de datos espaciales.

Adicionalmente, la conceptualización propuesta no depende la escala, por lo que puede

aplicarse para identificar inconsistencias en los datos. Se pretende generar ontologías de

mediciones en los dominios geométrico y topológico, con el fin de identificar la similitud

Page 29: Reporte Final - SAPPI - Sistema de Administración de ...

29

semántica entre diversos sistemas de objetos espaciales. Para el caso de la presente

propuesta se considera emplear como caso de estudio la generalización cartográfica de

redes hidrológicas. Que resulta muy útil ya que la generalización por si misma es una tarea

muy semántica que tiene como fin no perder el significado de los datos y sus relaciones

después de un cambio en el nivel de detalle. En el contexto de este trabajo la similitud

semántica se evalúa interpretando datos generados por generalización automática. En donde

se emplea la conceptualización para evaluar las distancias que existen entre los conceptos,

aprovechando que se encuentran almacenados en una estructura jerárquica.