1noviembre 2009 Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica (IGN +UPM).España
VI Jornadas técnicas de la IDE de EspañaJIDEE’09 - Murcia
Comparación de algoritmos para la conflación geométrica de
información vectorial
Carlos López-Vázquez(*) y Carlos H. González
2Grupo de Investigación Mercator. Laboratorio de Tecnologías de la Información Geográfica
(IGN +UPM).Españanoviembre 2009
ConflaciónUsar conjuntamente cartografía A con B
DiscrepanciasSemánticasTopológicasGeométricas
El problema…
3
Procedimiento estándar
1) Detectar objetos homólogosTípicamente puntosAutomático, semiautomático, manual, etc.
2) Efectuar transformación matemática[X,Y]=[x+g(x,y),y+h(x,y)]= f(x,y) Problema: estimar f(x,y)
Basada en homólogos disponiblesOpciones: Interpolar/Aproximar
4
Estimar f(x,y)... ¿cómo?
Problema estándarMuchos métodos bien establecidos
Si ignoramos restricciones cartográficas…
Trabajos comparativosPocosMetodológicamente endeblesUn único juego de datos de pruebaAnálisis estadístico débil
Típico EMCSin nivel de confianza
5
Procedimiento propuesto
Varios pasos:1) Detectar objetos homólogos2) Efectuar transformación
matemática3) Evaluar éxito
Selección de una métrica adecuadaValidación cruzadaSimulación de Monte Carlo
6
Algún detalle…
Para cada k se obtiene un ordenM3>M5>M2>M4>M1
Hay K tuplas, con K grandeTest de Friedman
Usado para evaluar K jueces catando P vinos, o K pacientes tratados con P medicinasSeñala diferencias sistemáticasRequiere especificar nivel de confianzaAplicable si K>15; P>4
7
Resultados preliminares
KO es el típicamente el mejorTINTERP_QUAD es casi siempre el segundoKO es paramétrico; el otro noLos demás están más o menos cerca¿Qué tan buenos son?
8
¿Qué tan buenos son?
La reducción típica es del 75%Muy lejos del 0%
30 40 50 60 70 80 90 1000
5
10
15
20
25
30
35
40NSSDA optimo como porcentaje del valor original siendo N=35
9
Conclusiones
Se han considerado varios métodosEnsayo estadísticamente válidoResultados aún lejos del deseado
¿Poca densidad de puntos homólogos?¿Métodos inadecuados?¿Caso patológico?
Métrica quizá no representativa
10
Trabajos futuros
Agregar otros métodos¿Desarrollar alguno nuevo?
Ensayar en otras regionesForzar nuevos puntos homólogosConsiderar restricciones cartográficas
Para imponerlasPara ignorarlas
Desarrollar otras métricas
12
Métricas tradicionales
Heredadas de la cartografía tradicionalError Medio CuadráticoError MáximoPercentiles
Recogidas en estándares (ej.: NSSDA)Ventaja: Miden discrepancias del dato puroDesventaja: Ignoran ámbito de aplicación
13
El experimento
Incluye Monte Carlo y Validación Cruzada Repetir para k=1,2,…,K:
Seleccionar M homólogos de un subconjuntoPara cada método:
Estimar f, y realizar la transformaciónEvaluar el NSSDA, y guardar
Analizar estadísticamenteOrdenar los métodos según desempeño
14
Validación Cruzada
Si hay N pares de homólogos…Usar M para estimar f(x,y) y g(x,y)Calcular X e Y en los (N-M) restantesAnalizar discrepancias
NSSDA requiere (N-M)≥20Si los M pueden elegirse al azar
Monte Carlo
15
Métricas no tradicionales
Tendrían en cuentaEl dispositivo de despliegueIluminación ambienteLimitaciones del sistema visual humanoVistazo vs. Análisis parsimonioso
Poco estudiadasTema a investigar
16
Varias clasificaciones posibles
Métodos no paramétricosIDWTransformación afín a trozosGRIDDATA®TINTERP
Métodos paramétricosKrigeado OrdinarioKrigeado ResidualGRIDFIT
17
Varias clasificaciones posibles
Basados en triangulaciónTransformación afín a trozosTINTERP
Basados en grillas regularesGRIDDATA®
Sin grillas ni triangulaciónIDWKrigeado OrdinarioKrigeado Residual
18
Varias clasificaciones posibles
C0: La superficie es continuaTransformación afín a trozosGRIDDATA con opción DEFAULTTINTERP con opción QUAD
C1: La superficie es diferenciableGRIDDATA con opción CUBIC
Cp: La superficie es diferenciable p vecesIDWKrigeado OrdinarioKrigeado Residual…