Perspectivas europeas en el desarrollo funcional de los sistemas de información: la agregación de...

Post on 11-Jun-2015

1.832 views 2 download

Transcript of Perspectivas europeas en el desarrollo funcional de los sistemas de información: la agregación de...

Perspectivas europeas en el desarrollo funcional de los

sistemas de información: la agregación de datos del

Europeana Data Model

Xavier Agenjo BullónDirector de Proyectos, Fundación Ignacio Larramendi

xavier.agenjo@larramendi.es

Francisca Hernández CarrascalConsultora, DIGIBÍS Producciones Digitales

francisca.hernandez@digibis.com

Antecedentes legales• Agenda Digital Europea (26-08-2011)

• Council of Content Provider and Aggregator (CCPA)

• Europeana Data Exchange Agreement DEA (5 mayo 2011)– EuropeanaLocal finaliza en junio de 2011– Nuevo acuerdo entre Europeana Foundation, los Proveedores de

Contenido y los Agregadores.– Borrador firmado antes del 7-8 de julio para su discusión en el CCPA

(Legal Committee) en Birmingham.– Especial atención al artículo 18

• http://version1.europeana.eu/web/europeana-project/newagreement

Antecedentes técnicos

• Europeana Semantic Elements (v. 3.3, 28-06-2011)

• Europeana Data Model (v. 5.2, 30-07-2011)

• Functional Specifications for the Danube Release (31-08-2010)

• Actualizaciones– EDM 5.2.1 (7-03-2011)– ESE 3.4 (31-03-2011)

Definición del proyecto

• The New Renaissance: Report of the Comité des Sages (10-01-2011)

• Europeana's Strategic Plan 2011-2015 (14-01-2011)

• Europeana Bussiness Plan (13-05-2011)

Gestión del proyecto

• CCPA Core Group Meeting (7 junio Birmingham)

• Open Culture 2011 (8 junio)

• CCPA Conference, (6 diciembre 2011) White Paper

• Groups: User engagement, Financial/Sustainability, Ethical, Technical, Legal

• Reflection group (acceso libre) y Core Group (Cooptación)

Objetivo estratégico de Europeana

• Europeana y Linked Open Data– El más relevante concentrador de datos para el patrimonio

cultural y científico de Europa

– Requiere el uso del DEA para ofrecer a sus datos abiertos y vinculados a través de las API de Europeana.

– DEA, EDM, las especificaciones funcionales, el plan estratégico, el informe del Comité de Sabios y el Business Model apuntan todos ellos explícitamente a Linked Open Data.

EDM: un mecanismo para un fin• Los fines de Europeana están claramente establecidos en

el plan estratégico, en el informe del Comité de Sabios y en el Business Model – Nuevo renacimiento de la cultura europea gracias a los medios

digitales– Revolución similar a la de la imprenta

• ESE 3.4 ha hecho lo mismo de forma explícita, ya no importa la cantidad, sino la calidad

• EDM se ha adaptado plenamente en su versión 5.2.1 a estos nuevos objetivos

Fases de Europeana

• Inauguración 2008

• Fase Rín 2010 - 10 millones de objetos digitales. Europeana Semantic Elements– 14 millones de objetos digitales en noviembre de 2010– 18 millones de objetos digitales en 2011

• Fase Danubio 2011 - Functional Specifications for the Danube Release: – Búsqueda Semántica

Evolución de Europeana

• 2008: Ingesta de datos procedentes de determinados proveedores. Sin normativa

• 2009-2010 Recolección de repositorios OAI-PMH

• Reestructuración del proceso de agregación:– Agregadores nacionales (Culture Grid, Hispana, etc.)– Agregadores transversales (EuropeanaLocal, ATHENA,

APENET)– Europeana Semantic Elements, 3.1

Evolución de Europeana Semantic Elements

• Mejora de la interfaz de búsqueda: ESE 3.3– Miniaturas– Datos del proveedor– Derechos de las copias digitales

• Mejora de la calidad de los datos: ESE 3.4 (mayo 2011)

Declaración explícita

• The Europeana Operations Team (4 mayo 2011)

– En los últimos dos años el trabajo de integración de datos se ha centrado en la cantidad. Ahora que hemos alcanzado los 18 millones de items y que hemos sobrepasado nuestros objetivos vamos a aprovechar la oportunidad de centrarnos en mejorar la calidad de los datos. Los usuarios nos dicen que quieren unas búsquedas más precisas para lo que pueden ayudar nuevos desarrollos técnicos, pero estas mejoras no podrán hacerse sin trabajar estrechamente con los proveedores de datos y agregadores.

Excurso técnico: cambios del ESE 3.4

• europeana:rights– Changed to Mandatory. Clarification of use of this element and dc:rights

• europeana:dataProvider– Changed to Mandatory.

• dc:language– Changed to Mandatory for objects with type TEXT, strongly recommended for

other types where appropriate.• dc:title and dc:description

– Mandatory to provide one of these two• dc:subject, dc:type, dc:coverage; dcterms:spatial

– Mandatory to provide one of these four• europeana:hasObject

– removed, now redundant• europeana:country

– revision of note to reflect current practice• europeana:language

– revision of note to reflect current practice.

Los Proveedores• Europeana es uná línea estratégica, económica y

política de toda Europa.

• Actualización tecnológica coincidiendo con el Strategic Plan y el Business Model (2011-2015)

• No es una cuestión de prestigio: Incremento de la visibilidad y disponibilidad de las colecciones

• Un gran esfuerzo en la normalización de las colecciones digitales sólo comparable con la aplicación del formato MARC

Europeana Data Model

• Gradmann, Stefan. Knowledge = Information in Context: on the Importance of Semantic Contextualisation in Europeana. Europeana White Paper #1

• EDM ontología de alto nivel para las especificaciones funcionales de la fase Danubio

Componentes de EDM

• EDM 5.2.1 reutiliza 4 namespaces– RDF– OAI-ORE– SKOS– Dublin Core

• La versión 5.2 incluía también VRA, pero se ha considerado que quedaba perfectamente englobada en la nueva definición de ESE.

• En cualquier caso VRA (estándar para recursos visuales) que ha estado promovida por la asociación del mismo nombre y que ha pasado a ser un estándar mantenido, como tantos otros, por The Network Development and MARC Standards Office

RDF: Resource Description Framework

• The Resource Description Framework (RDF) and the RDF Schema (RDFS) – namespaces (http://www.w3.org/TR/rdf-concepts/)

• Estándar del W3C para la Web semántica• Supone una concreción considerable en relación a

XML• Es posible que muchos repositorios diseñados

para soportar XML y en concreto Dublin Core tengan problemas para adaptarse a él.

OAI-ORE Open Archives Initiative Object Reuse and Exchange

• Define un conjunto de normas para la descripción e intercambio de agregaciones de recursos Web.– http://www.openarchives.org/ore/

• Un set de recursos relacionados (Aggregated Resources) agrupados de tal manera que puedan ser tratadas como un recurso unitario.

• Con posterioridad a la fecha de la redacción 25 de febrero de 2011, se han concretado las clases y propiedades de OAI-ORE en EDM.

SKOS: Simple Knowledge Organization System

• Modelo de datos común para compartir y enlazar sistemas de organización del conocimiento en la Web.– http://www.w3.org/TR/skos-reference/

– Tesauros, taxonomias, clasificaciones y encabezamientos de materias comparten una estructura similar y se usan en aplicaciones similares. SKOS define esta similitud para permitir la reutilización y el intercambio de datos entre aplicaciones

– Con posterioridad a la fecha de la redacción 25 de febrero de 2011, se ha concretado las clases y propiedades de SKOS en EDM.

– Es posible que muchos repositorios diseñados sin funciones de control de autoridades tengan problemas para adaptarse a él.

Dublin Core namespaces

• Elementos Dublin Core básicos– http://purl.org/dc/elements/1.1/

• Elementos Dublin Core cualificados– http://purl.org/dc/terms/

• Tipos Dublin Core– http://purl.org/dc/dcmitype/

EDM y Linked Open Data

• Vínculos (Linked) entre los datos (Data) abiertos (Open)

• EDM vinculado a través de SKOS– RAMEAU, LCSH y SWD– 20000 enlazados con SWD– 60000 enlazados con LCSH

27

Wirtschaftstheorie en DNB (SKOS)

EDM y Linked Open Data

• Agentes: VIAF y Dbpedia– Gemeinsame Normdatei (GND)– 123,569 links to Wikipedia

• http://ckan.net/package/dnb-gemeinsame-normdatei

• Lugares geográficos: GeoNames y GeoLinked Data

Cambio de paradigma

• 1985-1990– AACR2 + ISBD + MARC

• 1990-2000– GARE + GSARE + GARR

• 1998-2010– FRBR + FRAD + FRSAD

• 2010– RDA + MARC 21– SKOS, VIAF, MADS/RDF– EDM (LOD)– HTML5, CSS3, JavaScript

• Principios de Catalogación de París, 1961

• Principios internacionales de Catalogación 2009

• Agenda Digital Europea (2010)– Plan Estratégico– Comité de Sabios– Modelo de negocio

Cambio de paradigma• NEDA (Normas Españolas de

Descripción Archivística)• ISAD (G)• EAD• ISAAR (CPF)• EAC• ISDF• MoReq2010• EAD RDF

• CIDOC CRM

• XML Spectrum

• LIDO (Lightweight Information Describing Objects)

ISO 21127:2006 Information and documentation -- A reference ontology for the interchange of

cultural heritage information