"AGRIS 2.0: datos bibliográficos enlazados en el contexto de la información agrícola"

Post on 12-Nov-2014

402 views 0 download

Tags:

description

El objetivo de este seminario es introducir el nuevo web de AGRIS (inagurado el 2 de Deciembre 2013) y sus funcionalidades. El web fusiona el sístema tradicional de AGRIS con OpenAGRIS, y, a su vez, proporciona un punto de acceso para buscar datos bibliográficos en la base de datos de AGRIS más fácilmente. El seminario web está orientado a investigadores agrícolas, bibliotecarios, especialistas en la gestión de la información, desarrolladores de software, editores de revistas, proveedores de datos agrícolas y otras personas interesadas.

Transcript of "AGRIS 2.0: datos bibliográficos enlazados en el contexto de la información agrícola"

AGRIS 2.0 : datos bibliográficos enlazados en el contexto de la información agrícolahttp://agris.fao.org

Imma Subirats-Coll

Oficial en la gestión del conocimiento y la informaciónOrganización de las Naciones Unidas para la Alimentación y la Agricultura

imma.subirats@fao.org

Seminario Web

7 febrero 2014

¿Qué es AGRIS?El camino a los datos vinculadosEl flujo de datos y la interoperabilidadEl consumo de datos AGRIS

Centralización Interconexión

ProcedenciaAlgunos númerosIndexación de AGRIS en Google

Sumario

AGRISRecursos en Ciencias Agrícolas y Tecnología de la

Información

• Sistema cooperativo internacional• Da acceso libre a recursos bibliográficos y

datos abiertos • Abarca casi cuarenta años de investigación

agrícola• Sus metadatos se estructuran e indexan

usando el tesauro AGROVOC, usado para enriquecer la indexación de datos en los sistemas de información agrícola

• Mantenido por la FAO

Qué es AGRIS

• Colección de más de 7,7 millones de registros bibliográficos

• Sistema RDF, una aplicación mashup que permite a los usuarios consultar el contenido AGRIS-RDF, e interconectar todos los registros a fuentes externas de información

• 7,000,000 registros bibliográficos se convierten en 7,000,000 páginas

mashup!

Qué más sabemos sobre AGRIS

Flujo de datos

• Aplicación web enteramente basada en estándares de la Web Semántica

• Crea páginas de mashup y interconecta los registros a fuentes externas de información

• Utiliza AGROVOC como columna vertebral para la interconexión con otros conjuntos de datos existentes (DBPedia, worldbank, Ontología geopolítica ...)

AGRIS 2.0

El consumo de datos en AGRIS (1)

• Centralización: referencias bibliográficas en el dominio AGRIS (la agricultura, la silvicultura, la ganadería, ciencias acuáticas y la pesca, y la alimentación humana)

• Interconexión: otro tipo de información relacionada con el dominio AGRIS (estadísticas, mapas, perfiles de países, etc)

El consumo de datos en AGRIS (2)

• AGRIS consume metadatos proporcionados por la comunidad y los publica como datos abiertos

• Los metadatos se obtienen• (1) A través de la recolección da datos (por

ejemplo, agregadores, repositorios institucionales, a través de protocolos como OAI-PMH)

• (2) A recibiendo datos a través de proveedores interesados (por ejemplo bibliotecas nacionales o editoriales de revistas)

Interoperabilidad

Flujo de Datos

Centralización: Centro de proceso de datos

• Los nuevos metadatos se verifican manualmente y aleatoriamente en busca de inconsistencias o errores semánticos recurrentes

• El formato de entrada se asigna a AGRIS RDF• Los metadatos se convierten en AGRIS RDF,

usando AgroTagger cuando las palabras clave de AGROVOC no están disponibles

• Antes de añadir metadatos al triplestore e indexar en el índice Solr, se detectan y gestionan los duplicados, ya que el mismo registro puede ser indexado en varias colecciones o ser duplicado en el mismo repositorio

Agrotagger

13

Todavía no se ha implementado

Maui es el nombre del héroe mitológico y semidiós polinesio, que se transform en diferentes tipos de

ave para realizar hazañas

“RDF-ization”

bibo:Articlebibo:abstractbibo:doibibo:isbnbibo:languagebibo:presentedAt -> bibo:Conference -> dct:titlebibo:uridct:alternativedct:creator -> foaf:organization -> foaf:namedct:creator -> foaf:Person -> foaf:name

dct:dateSubmitteddct:descriptiondct:extentdct:identifierdct:isPartOfdct:issueddct:publisher -> foaf:Organization -> foaf:namedct:sourcedct:subjectdct:titledct:typedct:rights

Elección de vocabularios y equivalencias!

RDF-XML

Procedencia

• Cada registro tiene un identificador AGRIS (ARN), que tiene una estructura predefinida y contiene información sobre la fuente de datos junto con el año de registro bibliográfico de creación

• "IT 2008 0 00091" se refiere a un registro creado en 2008 a partir de un proveedor específico de datos AGRIS en Italia, cuyo número progresivo es 91

• Datos de proveedores de información se almacenan en CIARD RING y son “triplificados” en el centros de datos AGRIS (cada proveedor de datos tiene su propio URI único)

Enlaces: ¿cómo funcionan?

• AGROVOC es la columna vertebral• AGROVOC está enlazado con otros

tesauros mediante un procedimiento semi-automático (skos: exactMatch, skos: closeMatch)

• SPARQL endpoints publicados en la Web• Webservices y APIs

18

El Caso IFPRI

Un usuario consulta el

sistema

Registro AGRIS con palabras clave Agrovoc

Por lo menos una palabra clave Agrovoc es un

nombre de país

El sistema de consultas SPARQL endpoint IFPRI (http://data.ifpri.org/sparql/) recupera el Índice Global del Hambre (GHI) y la tasa de mortalidad infantil relacionada con el País

Algunos números• 7.632.842 registros bibliográficos generados por

248 proveedores de contenido ubicados en 153 países, en 52 idiomas en más de 20.000 revistas científicas.

• 187.238.716 triples en el conjunto de datos AGRIS http://202.45.142.113:10035/repositories/agris

• 372.462 triples en la series de datos AGRIS http://202.45.142.113:10035/repositories/jad

• 11.414 triples en los centros de datos AGRIS http://202.45.142.113:10035/repositories/centers

AGRIS RDF RECORD

AGROVOC

GraciasTurno de Preguntas

Imma.Subirats@fao.org

http://agris.fao.org