Post on 29-Jan-2018
Conduciendo la información estadística georreferenciada del
DANE a otra dimensión
Luis M. Vilches-BlázquezJulián Mauricio Alvarado Torres
Departamento Administrativo Nacional de Estadística (DANE) Dirección de Geoestadística
lmvilches.blazquez@gmail.com
…
Datasets
¿¿Quieren llevar sus datos a otra dimensión??
¿¿Quieren ofrecer sus datos para que sean…
reutilizables
interoperables
comprensibles
enriquecidos ??
Statistical Linked Data
…Geoportal DIVIPOLAPortal DANE
Open Data
http://www.datos.gov.co/
Las 5 Estrellas• Tim Berners Lee (2010)
– “This year, in order to encourage people - especially government dataowners - along the road to good linked data, I have developed this starrating system”
– Details @ http://www.w3.org/DesignIssues/LinkedData.html
Las 5 Estrellas
1 Estrella• Ponga sus datos disponibles en la web
(en cualquier formato) con una licencia abierta.
2 Estrellas• Ofrezca datos estructurados.
– Excel mejor que PNG/JPEG/PDF
3 Estrellas• No utilice formatos propietarios.
– CSV en lugar de Microsoft Excel
– WKT en lugar de Shapefile
3 estrellas…
…Geoportal DIVIPOLAPortal DANE
…Geoportal DIVIPOLAPortal DANE
Datos semi-estructurados Modelo de datos Procesable por máquina Irregularidad y ambigüedad
Baja Interoperabilidad Servicios Interoperabilidad sintáctica Comunicaciones
Formatos “propietarios” Servicios …. pero también abundan Excels
Datos estructuradosInteroperabilidad
Formatos estándares
Geoportal
Geoportal DIVIPOLAPortal DANE
Portal DANE
Datos semi-estructuradosBaja Interoperabilidad
Formatos “propietarios”
4 y 5 Estrellas• Utilice URI y RDF para identificar y describir sus
datos, así la gente podrá apuntar a ellos.
• Relacione sus datos con otros datos.
¿Dónde queremos llegar?
Statistical Linked Data
¿Qué es Linked Data?
• Linked Data es un término utilizado paradescribir las mejores prácticas recomendadaspara exponer, compartir e integrar conjuntosde datos en la Web Semántica.
Linked Data: ¿Porqué es importante?• Facilita la integración de datos
– De fuentes heterogéneas
– En diferentes formatos
– Diferente granularidad
– En diferentes idiomas
– De diferentes países
© Slide adapted from “5min Introduction to Linked Data”- Olaf Hartig
Workflow del proyecto
Luis M. Vilches-Blázquez et al., (2014) Integrating geographical information in the
Linked Digital Earth. In Digital Earth Applications: Technological design and OrganisationalStrategies - International Journal of Digital Earth. Volume 7, Issue 7, pages 554-575
The Generic Statistical Business Process Model
Datos de partida
Datos de partida
Geoportal DIVIPOLAPortal DANE
DIVIPOLA
Datos de partida
Información estadística
Modelado
Modelado
Modelado
• División político-administrativa– FAO geopolitical
– DBpedia
• Información estadística– RDF Data Cube
– Statistical Data and MetadataeXchange (SDMX)
• Información espacial– GeoSPARQL
• Información temporal– W3C Time ontology
• Metadatos y Organización– Dublin Core
– FOAF
– The Organization ontology
Generación de RDF
Generación de RDF• Utilice URI y RDF para identificar y describir sus
datos, así la gente podrá apuntar a ellos.
dane:/recurso/Departamento/25
rdf:type
divipola:Departamento
dane: http://geoportal.dane.gov.co/linkedstat
divipola: http://geoportal.dane.gov.co/linkedstat/voc/DIVIPOLA#
geosparql: http://www.opengis.net/ont/geosparql/
sf: http://www.opengis.net/ont/sf#
gml: http://www.opengis.net/ont/gml#
dbpedia: http://es.dbpedia.org/
Cundinamarca
rdfs:label
-74,6695456055 4,37585313348
http://www.opengis.net/def/crs/OGC/1.3/CRS84
geosparql:asGML
geosparql:asWKT
sf:Point
rdf:type
srsName=EPSG:4258
-74,6695456055, 4,37585313348
dane: resource/
-74,6695456055_4,37585313348
gml:Pointrdf:type
geosparql:hasGeometry
dane: Municipio/25326Guatavita
rdfs:label
dane: CentroPoblado/25326002
divipola:esParteDe
Montecillo
divipola:Municipio
rdf:type
divipola:CentroPoblado
rdf:type
Generación de enlaces
• Relacione sus datos con otros datos.
Generación de enlaces
dane:/recurso/Departamento/25
rdf:type
divipola:Departamento
dane: http://geoportal.dane.gov.co/linkedstat
divipola: http://geoportal.dane.gov.co/linkedstat/voc/DIVIPOLA#
geosparql: http://www.opengis.net/ont/geosparql/
sf: http://www.opengis.net/ont/sf#
gml: http://www.opengis.net/ont/gml#
dbpedia: http://es.dbpedia.org/
owl: http://www.w3.org/2002/07/owl#
Cundinamarca
rdfs:label
-74,6695456055 4,37585313348
http://www.opengis.net/def/crs/OGC/1.3/CRS84
geosparql:asGML
geosparql:asWKT
sf:Point
rdf:type
srsName=EPSG:4258
-74,6695456055, 4,37585313348
dane: resource/
-74,6695456055_4,37585313348
gml:Pointrdf:type
dbpedia:
/resource/Cundinamarca_Department
geosparql:hasGeometry
dane: Municipio/25326Guatavita
rdfs:label
dane: CentroPoblado/25326002
divipola:esParteDe
Montecillo
divipola:Municipio
rdf:typedivipola:CentroPoblado
rdf:type
Datos de partida
DIVIPOLA
Datos enriquecidos
Publicación y explotación
Publicación
Publicación
Publicación
Explotación
Conclusiones
DIVIPOLA
Geoportal
Geoportal DIVIPOLAPortal DANE
Portal DANE
Datos semi-estructuradosBaja Interoperabilidad
Formatos “propietarios”
Datos estructuradosInteroperabilidad
Formatos estándares
Datos estructuradosInteroperabilidad
Formatos estándares
DIVIPOLA
GeoportalPortal DANE
Datos estructuradosInteroperabilidad
Formatos estándaresDatos enriquecidos
Conduciendo la información estadística georreferenciada del
DANE a otra dimensión
Luis M. Vilches-BlázquezJulián Mauricio Alvarado Torres
Departamento Administrativo Nacional de Estadística (DANE) Dirección de Geoestadística
lmvilches.blazquez@gmail.com