Open Archives Initiative y Open Archival Information System

16
El profesional de la información, v. 14, n. 5, septiembre-octubre 2005 365 Fundamentos tecnológicos del acceso abierto: Open Archives Initiative y Open Archival Information System Por Teresa Silió Resumen: El propósito de este artículo es estudiar las tecnologías que hacen posible el acceso abierto y la preservación de los documentos digitales. Por un lado, se analiza la Open Archives Initiative (OAI) — que se ha desarrollado para posibilitar el acceso al contenido de archivos distribuidos—, y sus compo- nentes: los Proveedores de Datos, los Proveedores de Servicios y el protocolo OAI-PMH. Éste se creó para la extracción normalizada de metadatos de los archi- vos electrónicos, asegurando con ello la infraestruc- tura para la preservación y la interoperabilidad entre archivos, independientemente de las organizaciones a las que pertenezcan o de donde se encuentren. Tam- bién se analiza el papel de los enlaces y los metadatos en el acceso abierto, en concreto CrossRef, DOI y OpenURL Por otro lado, se analiza el estándar del modelo de refe- rencia Open Archival Information System (OAIS) para un sistema abierto de información en archivos, cuya doble finali- dad es la preservación y el acceso a largo plazo de la información en formato digital, obviando los previsibles cambios tecnológicos. Estas dos iniciativas, OAI y OAIS, tienen un interés generalizado para las distintas instituciones académi- cas y para la información científica de las diferentes áreas del conocimiento. Palabras clave: Acceso abierto, OAI, OAIS, OAI-PMH, E-prints, Archivos, Repositorios, Metadatos, Interoperabilidad, Preservación, Difusión. Title: Technological foundations of open access: Open Archives Initiative and Open Archival Information System Abstract: The aim of this paper is to analyse the technological foundations of both open access and digital archives preservation. First, a discussion is offered of the Open Archives Initiative, which was developed to facilitate the discov- ery of content stored in distributed archives. The main components of this initiative are also described: Data Providers, Service Providers, and the OAI-PMH protocol, which was created for the standardised metadata harvesting of the archives. By this means the infrastructure for preservation and interoperability of archives is assured, regardless of their physical location or their parent organisations. Links and metadata related to open access are also analysed, specifical- ly CrossRef, DOI, and OpenURL. Subsequently the article explores the Reference Model for an Open Archival Informa- tion System (OAIS), which was created to assure long term access and preservation of information, regardless of future technological changes. These two initiatives, OAI and OAIS are extremely important for academic institutions and for sci- entific information. Keywords: Open access, OAI, OAIS, OAI-PMH, E-prints, Archives, Repositories, Metadata, Interoperability, Preserva- tion, Dissemination, Information. Silió, Teresa. “Los fundamentos tecnológicos del acceso abierto: Open Archives Initiative y Open Archival Information System”. En: El profesional de la información, 2005, septiembre-octubre, v. 14, n. 5, pp. 365-380. Teresa Silió es licenciada y doctora por la UAM. Actualmente está en el Laboratorio de Internet Cindoc-CSIC y es profesora de cur- sos de la CAM de biblioteconomía y docu- mentación. Desde 2000 ha dado clases de documentación en ciencias de la salud en la UAX. Ha trabajado como Jefe del Servicio de Biblioteca y Documentación del CNIC (IS- CIII). Durante cinco años ha trabajado en el CIB (CSIC). Además, ha coordinado el dise- ño y los contenidos de la Biblioteca Virtual de la Red Temática Cardiovascular (Recava) del ISCIII.

Transcript of Open Archives Initiative y Open Archival Information System

Page 1: Open Archives Initiative y Open Archival Information System

El profesional de la información, v. 14, n. 5, septiembre-octubre 2005 365

Fundamentos tecnológicos del acceso abierto: OpenArchives Initiative y Open Archival Information System

Por Teresa Silió

Resumen: El propósito de este artículo es estudiarlas tecnologías que hacen posible el acceso abierto yla preservación de los documentos digitales. Por unlado, se analiza la Open Archives Initiative (OAI) —que se ha desarrollado para posibilitar el acceso alcontenido de archivos distribuidos—, y sus compo-nentes: los Proveedores de Datos, los Proveedores deServicios y el protocolo OAI-PMH. Éste se creó parala extracción normalizada de metadatos de los archi-vos electrónicos, asegurando con ello la infraestruc-tura para la preservación y la interoperabilidad entrearchivos, independientemente de las organizacionesa las que pertenezcan o de donde se encuentren. Tam-bién se analiza el papel de los enlaces y los metadatosen el acceso abierto, en concreto CrossRef, DOI y OpenURL Por otro lado, se analiza el estándar del modelo de refe-rencia Open Archival Information System (OAIS) para un sistema abierto de información en archivos, cuya doble finali-dad es la preservación y el acceso a largo plazo de la información en formato digital, obviando los previsibles cambiostecnológicos. Estas dos iniciativas, OAI y OAIS, tienen un interés generalizado para las distintas instituciones académi-cas y para la información científica de las diferentes áreas del conocimiento.

Palabras clave: Acceso abierto, OAI, OAIS, OAI-PMH, E-prints, Archivos, Repositorios, Metadatos, Interoperabilidad,Preservación, Difusión.

Title: Technological foundations of open access: Open Archives Initiative and OpenArchival Information System

Abstract: The aim of this paper is to analyse the technological foundations of both open access and digital archivespreservation. First, a discussion is offered of the Open Archives Initiative, which was developed to facilitate the discov-ery of content stored in distributed archives. The main components of this initiative are also described: Data Providers,Service Providers, and the OAI-PMH protocol, which was created for the standardised metadata harvesting of thearchives. By this means the infrastructure for preservation and interoperability of archives is assured, regardless of theirphysical location or their parent organisations. Links and metadata related to open access are also analysed, specifical-ly CrossRef, DOI, and OpenURL. Subsequently the article explores the Reference Model for an Open Archival Informa-tion System (OAIS), which was created to assure long term access and preservation of information, regardless of futuretechnological changes. These two initiatives, OAI and OAIS are extremely important for academic institutions and for sci-entific information.

Keywords: Open access, OAI, OAIS, OAI-PMH, E-prints, Archives, Repositories, Metadata, Interoperability, Preserva-tion, Dissemination, Information.

Silió, Teresa. “Los fundamentos tecnológicos del acceso abierto: Open Archives Initiative y Open Archival InformationSystem”. En: El profesional de la información, 2005, septiembre-octubre, v. 14, n. 5, pp. 365-380.

Teresa Silió es licenciada y doctora por laUAM. Actualmente está en el Laboratorio deInternet Cindoc-CSIC y es profesora de cur-sos de la CAM de biblioteconomía y docu-mentación. Desde 2000 ha dado clases dedocumentación en ciencias de la salud en laUAX. Ha trabajado como Jefe del Serviciode Biblioteca y Documentación del CNIC (IS-CIII). Durante cinco años ha trabajado en elCIB (CSIC). Además, ha coordinado el dise-ño y los contenidos de la Biblioteca Virtualde la Red Temática Cardiovascular (Recava)del ISCIII.

Page 2: Open Archives Initiative y Open Archival Information System

Teresa Silió

El profesional de la información, v. 14, n. 5, septiembre-octubre 2005366

EL ACCESO ABIERTO(OA) y la Open Archives Initiative(OAI) tienen como finalidad la in-teroperabilidad (o compatibili-dad) entre archivos, la preserva-ción a largo plazo y el acceso uni-versal a la información. Open ac-cess se refiere a la política de ac-ceso abierto de las publicacionescientíficas, mientras que OAI estáen relación con la tecnología ne-cesaria para llevarla a cabo gra-cias a la creación de repositorioscompatibles de publicacioneselectrónicas.

Los problemas de intercone-xión de archivos, al igual que el delas múltiples interfaces de búsque-da, las búsquedas distribuidas envarios archivos o las complicacio-nes con la sintaxis, han sido solu-cionados gracias a los metadatos,que son recopilados mediante elprotocolo OAI-PMH. Esto ha su-puesto la demostración de que esposible crear una biblioteca digitalbasada en la interoperabilidad y quees posible poner en común distintosdominios del conocimiento.

Open Archives Initiative(OAI)

Se lanzó con el objetivo de di-señar un sistema que posibilitase lainteroperabilidad entre archivosabiertos de e-prints, que son docu-mentos de investigación científicoso técnicos publicados electrónica-mente que sirven para facilitar elintercambio entre pares y el avancecientífico. http://www.eprints.org

Abarcan los siguientes tipos:

—Pre-prints: trabajos pendien-tes de la revisión por pares (peer re-view).

—Post-prints: ya han sido eva-luados.

—Reprints: separatas o copiasde los documentos ya evaluados ypublicados, que la editorial manda alos autores para su difusión.

Los archivos abiertos de e-prints son repositorios electrónicosdonde los autores depositan (auto-archivan) las versiones completasde sus artículos ya revisados o lasversiones preliminares que estánpendientes de la revisión por pares(Bailey, 2005). Se trata de que losmateriales almacenados estén dis-ponibles para su búsqueda y su des-carga, tanto en el caso de los artícu-los no publicados como en el de lostextos de investigación ya dados aconocer en revistas científicas. Laidea de que un preprint sea revisa-do antes de su publicación por algu-nas personas no es una novedad,pero sí lo es el nuevo alcance ac-tual, que sean enviados a un servi-dor desde donde pueden ser descar-gados y revisados por otros científi-cos antes de pasar el filtro definiti-vo de la revisión por pares por par-te de la revista (Franklin, 2002-2003).

Existen dos grandes métodos deOA a las publicaciones científicas:por un lado los repositorios de do-cumentos electrónicos y por otrolas revistas que proporcionan acce-so abierto a los lectores gracias a unsistema de cobro a los autores porla revisión y la publicación de susartículos. Según un informe delInist/CNRS, el triunfo del accesoabierto puede depender solamentede que se asegure la realización depeer review o evaluación por pares(Franklin, 2002-2003), por lo quecabe esperar que en el futuro se es-tablezcan servicios de revisión enlos repositorios de e-prints y en losarchivos institucionales.

Se han creado archivos abiertosde e-prints que permiten la rápidadifusión de los resultados de la in-vestigación (McKiernan, 2004). Elsistema de repositorios, aceptadopor gran parte de la comunidad aca-démica, fue utilizado por primeravez en Los Alamos National Labo-ratory en 1991, dando origen al ar-chivo de física y matemáticas ArXiv(Ginsparg et al., 1999). Posterior-

mente se han desarrollado otros ca-sos: tanto los ordenados por disci-plinas como los archivos académi-cos que pueden contener tanto pre-prints como e-prints (Hitchcock,2003).

Los archivos de e-prints no sig-nifican simplemente un crecimientoen la escala y en el número de losarchivos, sino la introducción delconcepto de “archivos distribui-dos”, que permite considerar variosarchivos como si fuera uno solo demanera que se puedan ofrecer ser-vicios como las búsquedas precisaso la medida del impacto de las pu-blicaciones (Hitchcock, 2003). Lainfraestructura para la creación dearchivos distribuidos se establecióen 1999 con la Open Access Initia-tive y al protocolo OAI-PMH parala recuperación de metadatos. OAIevolucionó a partir del prototipoUPS (Universal Preprint Service)(Ginsparg et al., 1999), cuyo ori-gen está en la reunión de Santa Fe(México), donde se trató el tema dela creación de un servicio universalpara el autoarchivo de e-prints porparte de los autores (Fox, 2000) pa-ra comunicar los resultados de unainvestigación antes de que fuese so-metida a la revisión por pares y an-tes de su publicación en una revistacientífica (OAForum.org). UPS es-tá pues en la base del protocoloOAI-PMH y de hecho, OAI-PMHha heredado la arquitectura básicade UPS con sus dos roles lógicos: elsuministrador de los datos y quienofrece los servicios.

Bastantes editores permiten elautoarchivo en depósitos (institu-cionales, temáticos, etc.) de copiasde los artículos ya publicados, co-mo por ejemplo la editorial Cam-bridge University Press, que ha lan-zado el repositorio DSpace@Cam-bridge. Es conveniente que los au-tores sepan qué editoriales permitenel archivo en repositorios, y paraello es necesario acudir a páginascomo Romeo (Rights Metadata forOpen archiving) donde aparece in-

Page 3: Open Archives Initiative y Open Archival Information System
Page 4: Open Archives Initiative y Open Archival Information System

Teresa Silió

El profesional de la información, v. 14, n. 5, septiembre-octubre 2005368

—ARC (A Cross Archive Search Service)http://arc.cs.odu.edu/—Archonhttp://archon.cs.odu.edu/—ARNO Academic Publications Onlinehttp://arno.uvt.nl/~arno/site/index.html—ArXivhttp://www.arxiv.org—BioMed Centralhttp://www.biomedcentral.com/—CERN Document Server Software (CDSware)http://cdsware.cern.ch/ —ChemWeb.comhttp://www.chemweb.com/preprint—Citebasehttp://citebase.eprints.org/cgi-bin/search—Citeseer Scientific Literature Digital Libraryhttp://citeseer.ist.psu.edu/—CogPrintshttp://cogprints.soton.ac.uk/—CompSciPrePrintshttp://www.sciencedirect.com/preprintarchive—Computer Research Repository (CoRR)http://uk.arxiv.org/archive/cs/intro.html—Creative Commonshttp://creativecommons.org/license/?lang=es—CrossRef Multiple Resolutionhttp://www.crossref.org/mr/index.html—DigiLib: University of Groningen: a weblog onscholarly online publishing, open access and li-brary related technologyhttp://db.weblog.ub.rug.nl/archives/research/—Digital Commons Proquesthttp://www.proquest.com.br/espanhol/produtos/digital_commons.htm—Digital Library of MIT Theseshttp://theses.mit.edu/—Digital Library of the Commons (DLC)http://dlc.dlib.indiana.edu/view/subjects/—DList (Digital Library Information Science &Technology)http://dlist.sir.arizona.edu—Dspacehttp://www.dspace.org/—Dublin Core metadata element sethttp://es.dublincore.org/documents/dces—Dublin Core qualifiershttp://dublincore.org/documents/2000/07/11/dcmes-qualifiers/—E-LIS (Library and Information Sciences)http://eprints.rclis.org/—E-printshttp://www.eprints.org —E-PrintsUCM, Universidad Complutense deMadridhttp://www.ucm.es/eprints—European Patent Officehttp://www.european-patent-office.org/index.en.php—Fedora: an open-source digital repository man-agement Systemhttp://www.fedora.info—Greenstonehttp://www.greenstone.org—Google Print Google Projecthttp://print.google.com/googleprint/library.html—Highwirehttp://highwire.stanford.edu/—Ibiblio

http://www.ibiblio.org/collection—Infomine Scholarly Internet Resource Collectionhttp://infomine.ucr.edu/—Institute of Physicshttp://www.iop.org/EJ/—Institution Archives Registryhttp://archives.eprints.org/eprints.php—ISO Archiving Standards-Overviewhttp://ssdoo.gsfc.nasa.gov/nost/isoas/overview.html—i-Tor (NIWI)http://www.i-tor.org/en/—JISC Information Environment Service Registry(IESR)http://iesr.ac.uk/—JISC Open Access Briefing Paperhttp://www.jisc.ac.uk—Keplerhttp://kepler.cs.odu.edu/ —LinkFinderPlushttp://www.endinfosys.com/prods/linkfinderplus.htm—Locksshttp://lockss.stanford.edu/—Mathematics Preprint Serverhttp://www.ams.org/global-preprints/special-serv-er.html—Marcxmlhttp://www.loc.gov/standards/marcxml/—MIT Repositoryhttp://www.rlg.org/en/images/projects/MIT_Infra-structure+OAIS.jpg —MyCoRehttp://www.mycore.de/engl/index.html—My.OAIhttp://myoai.com—NASA Technical Report Serverhttp://ntrs.nasa.gov/?method=advanced—Ncstrl (Networked Computer Science Techni-cal Reference Library)http://www.ncstrl.org/—NetPrints: Clinical Medicine & Health Re-searchhttp://clinmed.netprints.org/home.dtl—NSDL National Science Digital Libraryhttp://nsdl.org—OAI Open Archives Initiativehttp://www.openarchives.org—OAI-PMH Open Archives Initiative Protocol forMetadata Harvestinghttp://www.openarchives.org/OAI/2.0/openar-chivesprotocol.htm—OAI Registered Data Providershttp://www.openarchives.org/Register/BrowseSites—OAI Repository Explorerhttp://re.cs.uct.ac.za/—OAI Service Providershttp://www.openarchives.org/service/listproviders.html—OAI Tutorialhttp://www.oaforum.org/tutorial/—OAICat OCLChttp://www.oclc.org/research/software/oai/cat.htm—OAIS Modeled Repositorieshttp://www.rlg.org/en/page.php?Page_ID=377—OAIsterhttp://oaister.umdl.umich.edu/o/oaister/—Oasis (Organization for the Advancement ofStructured Information Standards)http://www.oasis-open.org

—OCLC Digital Archivehttp://www.rlg.org/en/images/projects/OCLC_Digi-tal_Archive.gif—OpCithttp://arabica.ecs.soton.ac.uk/code/doc/ReadMe.html—OpCit Metalist of Open Access Eprint Archiveshttp://opcit.eprints.org/explorearchives.shtml—Open Archives Forumhttp://www.oaforum.org—Open Language Archives Communityhttp://www.language-archives.org—Opensourcehttp://www.opensource.org—OpenURLhttp://library.caltech.edu/openurl—OpenURL, a tutorialhttp://www.endinfosys.com/pdf/openurl4_02.pdf—Open Video Projecthttp://www.open-video.org/—OSTI Office of Scientific and Technical Infor-mationhttp://www.osti.gov/eprints/—PubMed Centralhttp://www.pubmedcentral.gov—Rapid Visual OAI Toolhttp://rvot.sourceforge.net/—Registering as a Data Provider OAI-PMH ver-sion 2.0http://www.openarchives.org/data/regis-terasprovider.html—RePEchttp://www.repec.org/—Repository Explorerhttp://oai.dlib.vt.edu/cgi-bin/Explorer/oai2.0/testoai—Romeohttp://romeo.eprints.org—SciELOhttp://scielo.isciii.es/scielo.php/lng_es—Science Commonshttp://science.creativecommons.org/—ScienceDirecthttp://www.sciencedirect.com—Scirushttp://www.scirus.com/srsapp/aboutus/#sources—Simple Dublin Core metadatahttp://dublincore.org/usage/terms/dc/current-ele-ments/—Sparc Open Access News Letterhttp://www.arl.org/sparc/index.html—Sparc Publishing Resourceshttp://www.arl.org/sparc/resources/pubres.html —Scopus Open Access Journals Listhttp://www.info.scopus.com/aboutscopus/docu-ments/oa_list.xls—Scopus Content Coveragehttp://www.info.scopus.com/aboutscopus/content-coverage/—Sherpahttp://www.sherpa.ac.uk/romeo.php?all=yes—Sourceforgehttp://sourceforge.net —Tesis Doctorales en Red de las Universidadesde Cataluñahttp://www.tdr.cesca.es/index_tdx_cs.html—Xmlhttp://www.xml.org—Zmarcohttp://zmarco.sourceforge.net/

Direcciones web y blogs de interés

Page 5: Open Archives Initiative y Open Archival Information System

Fundamentos tecnológicos del acceso abierto: Open Archives Initiative y Open Archival Information System

El profesional de la información, v. 14, n. 5, septiembre-octubre 2005 369

formación acerca de si la editoriallo permite, si es posible hacerlo an-tes o después de la publicación, siadmite los dos casos o no permiteen absoluto el archivo. En webs co-mo Sherpa se recoge informaciónsobre los repositorios, las editoria-les y las políticas detalladas que és-tas siguen. Así, por ej., la editorialKluwer, una división de Springer,permite que el autor archive el pre-print (pre-refereeing, antes de laevaluación) con la posibilidad, ade-más, de que el autor archive el post-print (post-evaluación).http://www.lboro.ac.uk/departments/dis/disresearch/romeo/index.htmlhttp://www.sherpa.ac.uk/

Para ilustrar la diferencia va-mos a comparar un artículo ya pu-blicado en la revista Serials review,de Elsevier, y su correspondiente e-print, que ha sido autoarchivadopor el autor en E-LIS, un repositorioabierto de documentos sobre biblio-teconomía y documentación.

Para ello accedemos a la publi-cación a través ScienceDirect, laplataforma electrónica de pago deElsevier que contiene centenares derevistas. El artículo aparece en lacitada publicación periódica, corre-lativamente con los otros artículosde ese número (figura 1):

Goodman, D., The criteria foropen access, Serials Review,Volume 30, Issue 4, 2004, Pages258-270.disponible en:

http://sciencedirect.com/science/journal/00987913

Después, utilizando un busca-dor como Google, que rastrea todaclase de contenidos, incluidos losopen access (Suber, 2005a), se lle-ga a E-LIS, donde el autor ha auto-archivado o depositado el e-print

correspondiente al artículo anterior,como se ve en la figura 2:

Deposited By: Goodman, David

Deposited On: 02 April 2005

Al efectuar su descarga aparecemás información sobre él:

This is the author’s version of thispaper, as published in Serialsreview, volume 30, no. 4: SpecialFocus on Open Access: Issues,Ideas, and Impact.doi:10l1016/j.serrev.2004.09.009,copyright: Elsevier, Inc 2004.

Existen redes electrónicas de e-prints (e-print networks) creadaspor científicos para ser usadas porotros profesionales y estudiantesavanzados. En realidad se trata deportales que integran sitios web ybases de datos, y están provistos deherramientas especializadas quepermiten:

—Hacer búsquedas deep web,combinado consultas a texto com-pleto en documentos pdf en sitiosweb con la búsqueda distribuida enbases de datos.

—Servicio de alertas automáti-cas sobre nuevos e-prints de interés.

—Información sobre socieda-des y autores.

Figura 2. E-print correspondiente al artículo

Figura 1. Artículo revisado y publicado por una editorial

Page 6: Open Archives Initiative y Open Archival Information System

Teresa Silió

El profesional de la información, v. 14, n. 5, septiembre-octubre 2005370

te la multiplicidad de archivos y deinterfaces de búsqueda se ha recu-rrido a los metadatos y al lenguajede marcado xml de cara a conseguirla interoperabilidad entre archivos(así como, a largo plazo, la preser-vación de la información).

«OpenURL es unadirección web que

contiene losmetadatos del

artículo»

El carácter “abierto” de esta ini-ciativa se refiere al hecho de permi-tir el metadata harvesting, es decir,la localización (eventualmente au-tomática) y la recopilación de losmetadatos que describen los regis-tros contenidos en los repositoriosmediante el protocolo OAI-PMH.Además OAI promueve los están-dares necesarios para crear los re-gistros de información en sistemaselectrónicos distribuidos y descen-tralizados para ofrecer servicios,gracias a la interoperabilidad entresistemas de metadatos. Debido a laextracción de estos metadatos, losproveedores de servicios OAI ofre-cen servicios complejos de búsque-da.http://www.openarchives.org

OAI promueve el acceso abiertoa publicaciones digitales académi-cas, mediante el desarrollo de unosestándares de interoperatividad.Funciona según el esquema si-guiente: los proveedores de datos(OAI data providers) ponen su in-formación a disposición de los pro-veedores de servicios (OAI serviceproviders), que localizan los meta-datos por medio de OAI-PMH yconstruyen servicios de búsqueda.Según esto, tres son los elementosprincipales de OAI:

1. Proveedores de datos

Les corresponde crear, conser-var y depositar los recursos en unrepositorio y exponer sus metada-tos. De cara a la interoperabilidad,los repositorios deben tener la in-

E-LIS.

http://eprints.rclis.org

DList (Digital Library Information Science & Technology).

http://dlist.sir.arizona.edu

BioMed Central.

http://www.biomedcentral.com

PubMed Central.

http://www.pubmedcentral.gov

Highwire.

http://highwire.stanford.edu/

Scielo.

http://scielo.isciii.es/scielo.php/lng_es

NetPrints: Clinicl Medicine & Health Research.

http://clinmed.netprints.org/home.dtl

National Science Digital Library (NSDL).

http://nsdl.org/

Citebase.

http://citebase.eprints.org/cgi-bin/search

REPEC.

http://www.repec.org/

ArXiv.

http://es.arxiv.org/

Archon.

http://archon.cs.odu.edu/

Institute of Physics.

http://www.iop.org/EJ/

NASA Technical Report Server.

http://ntrs.nasa.gov/?method=advanced

CERN Document Server (CDS).

http://cdsweb.cern.ch/?ln=en

Ncstrl.

http://www.ncstrl.org/

Citeseer.

http://citeseer.ist.psu.edu/

Computer Research Repository (CoRR).

http://uk.arxiv.org/archive/cs/intro.html

CogPrints.

http://cogprints.soton.ac.uk/

Open Language Archives Community.

http://www.language-archives.org/

Mathematics Preprint Server.

http://www.ams.org/global-preprints/special-server.html

ChemWeb.com.

http://chemweb.com/

Digital Library of MIT Theses.

http://theses.mit.edu/

Tesis Doctorales en Red de las Universidades de Cataluña.

http://www.tdr.cesca.es/index_tdx_cs.html

D-Space, MIT.

https://dspace.mit.edu/index.jsp

E-PrintsUCM, Universidad Complutense de Madrid.

http://www.ucm.es/eprints

European Patent Office.

http://www.european-patent-office.org/index.en.php

Digital Library of the Commons (DLC).

http://dlc.dlib.indiana.edu/view/subjects/

Ibiblio Archivo Digital (por CDU).

http://www.ibiblio.org/collection

The Infomine Scholarly Internet Resource Collection.

http://infomine.ucr.edu/

JISC Information Environment Service Registry (IESR).

http://iesr.ac.uk/

Oaister.

http://oaister.umdl.umich.edu/o/oaister/

Open Video.

http://www.open-video.org/

Varios

Vídeo

Física

Informática

Lingüística y psicología

Matemáticas

Química

Tesis doctorales

Biblioteconomía y

documentación

Biomedicina

Ciencia y tecnología

Economía

Tabla 1. Algunos ejemplos de OAI data providers

La interfaz de búsqueda de estared permite seleccionar dónde y có-mo hacer la búsqueda: por autor,institución, disciplina, fecha, archi-vo, etc.

Componentes de la OAI

La OAI está encaminada a ofre-cer el acceso libre a la web científi-ca en forma de macro-archivos. An-

Page 7: Open Archives Initiative y Open Archival Information System
Page 8: Open Archives Initiative y Open Archival Information System

Teresa Silió

El profesional de la información, v. 14, n. 5, septiembre-octubre 2005372

ARC (A cross archive

search service)Permite buscar información en varios repositorios OAI desde un único interfaz de búsqueda.

ARNO

Herramienta flexible para la implementación y gestión de repositorios institucionales. Permite unir estos

repositorios con otros localizados en otras partes del mundo. Es capaz de funcionar como un gestor de

contenidos. Necesita software adicional de terceros.

CERN Document

Server Software

(CDSware)

Permite construir un servidor de pre-prints propio, un catálogo en línea o un sistema de gestión documental

en la web. Este sistema cumple con el protocolo OAI-PMH y usa Marc21 como estándar bibliográfico

subyacente. CDSware está diseñado para acomodarse a manejar grandes cantidades de información con

varios formatos distintos.

CiteBase

Este recurso supone una fuente de información y de navegación basada en el impacto de artículos y de

autores. Aparecen las referencias, las citaciones y las co-citaciones de un artículo. Además tiene la

funcionalidad “correlation generator”, que mide la correlación entre el impacto de sus citas y el impacto de

sus descargas.

Digital Commons

(ProQuest)

Herramienta compatible con OAI que permite construir repositorios institucionales personalizables y publicar

una extensa variedad de tipos de publicaciones, incluidos documentos de conferencias, impresiones previas

y posteriores, capítulos de libros, presentaciones, informes, monografías, archivos de vídeo, conjuntos de

datos y programas ejecutables, así como otros recursos de "literatura gris" de forma rápida y sencilla.

Managed services. Captura, almacena, indexa, recupera y preserva en formato digital todo el material de

investigación de grandes organizaciones como super-archivos. Es capaz de integrar contenidos distribuidos y

de preservarlos.End-user services. Está diseñado para que las comunidades de usuarios envíen información y para que

también accedan a ella.

Fue creado para capturar la producción intelectual de organismos de investigación multidisciplinares.

Eprints

Software que ha sido implementado muy frecuentemente. Es relativamente sencillo y además cuenta con una

red de apoyos. Se ha ido mejorando según las demandas locales hasta incorporar búsquedas avanzadas,

metadatos extendidos y otros.

Fedora

Sistema flexible de gestión de repositorios y de bibliotecas digitales, con capacidad de gestionar de forma

eficiente un millón de objetos. Tiene tres interfaces, una de administración del repositorio, otra para detectar y

distribuir objetos en el repositorio y otra de acceso web.

Greenstone

Paquete de software para construir bibliotecas digitales. Permite organizar y publicar la información en

internet independientemente de cuál sea el formato de los archivos o de dónde se encuentren ubicados.

Permite integrar tanto archivos web, como cd-rom o intranets, que pueden ser consultados a través de un

navegador

i-Tor (NIWI)

Puede presentar varios tipos de información a través de un solo interfaz web, independientemente de dónde

se encuentren los archivos almacenados o de cuál sea su formato. En este repositorio independiente de los

datos está separado el contenido de la interfaz de usuario. Funciona al tiempo como un Proveedor de

servicios OAI y como un Proveedores de datos OAI. Es capaz de publicar datos de bases de datos

relacionales, sistemas de archivos y sitios web. Permite a los usuarios añadir contenidos directamente a

través de un navegador.

Kepler

Es un software que sirve para convertirse en un proveedor de datos OAI. Contiene un “archivelet”

autoinstalable para autoarchivar publicaciones. Pretende integrar las bibliotecas digitales y los grupos de

investigación, que así pueden tener un control constante sobre su biblioteca digital. Contiene dos

posibilidades, una enfocada a grandes comunidades y otra para edición individual. En el caso de las

comunidades se distribuye un software a cada miembro, un archivelet; después el servidor reúne toda la

información distribuida en archivelets y realiza las búsquedas. En el caso de los editores individuales que

quieran instalar un repositorio que cumpla con OAI, existen unos archivelets genéricos.

Lockss

Permite a las bibliotecas elaborar colecciones digitales con acceso permanente a su contenido. Es un

software peer-to-peer que funciona como un sistema de preservación. La información se distribuye vía web y

se almacena con un sistema fácil de usar.

MarcXml

Conjunto de programas Java que permiten la conversión de otros formatos a formato Marc y la conversión

desde éste a otros formatos. Ha sido desarrollado por la Library of Congress y por Marc Standards Office;

constituye un marco para trabajar de forma flexible y extensible con Marc en un entorno xml. Contiene varios

componentes, como schemas, hojas de estilo, y herramientas de software. Requiere Java

MyCoRe

Conjunto de herramientas para construir bibliotecas y archivos digitales. Consta de una sola aplicación

basada en un núcleo funcional para implementar el repositorio; incluye búsquedas distribuidas en repositorios

dispersos, integra audio y vídeo, editores de metadatos y demás. Se puede adaptar localmente a las

necesidades de los usuarios y contiene instruciones sobre cómo construir aplicaciones.

My.OAI Interfaz muy completa de búsqueda de metadatos.

NCSTRL Versión modificada de Dienst.

OAICat OCLCAplicación en Java para dotar al repositorio de un marco modificable que se ajuste al protocolo OAI-PMH

v2.0.

OAIsterMotor de búsqueda. Permite crear colecciones de recursos electrónicos académicos que pertenezcan a

instituciones diferentes y que tengan formatos diferentes.

OpCit Open Citation Project es una herramienta de enlace y análisis de citaciones para archivos abiertos.

Rapid Visual OAI Tool

Sirve para construir gráficamente un repositorio OAI-PMH a partir de una serie de archivos que contengan

registros que estén en cualquier formato aceptable, como Marc. Permite pasar del formato nativo al formato

oai_dc y una vez que esto se ha llevado a cabo, puede responder a las solicitudes OAI-PMH. Viene con un

servidor http y un sistema de gestión de OAI-PMH. Está escrito en Java.

Repository ExplorerContiene un interfaz que permite comprobar si un archivo cumple con el OAI-PMH, el protocolo para la

extracción normalizada de metadatos.

Zmarco

Proveedor de datos que cumple OAI-PMH. La 'Z' significa Z39.50; 'Marc' significa MAchine-Readable

Cataloging; y la 'O' significa OAI, Open Archives Initiative, ya que Zmarco permite hacer que los registros

Marc que están disponibles para un servidor Z39.50 lo estén también para OAI-PMH.

DSpace (MIT)

Tabla 2. Principales sistemas de software relacionados con repositorios

Page 9: Open Archives Initiative y Open Archival Information System

Fundamentos tecnológicos del acceso abierto: Open Archives Initiative y Open Archival Information System

El profesional de la información, v. 14, n. 5, septiembre-octubre 2005 373

formación en formato UnqualifiedDublin Core. De esta manera, losproveedores de servicios pueden re-copilar los metadatos y ofrecer ser-vicios complementarios a partir deesa información (tabla 1).

http://www.dublincore.org

Las instituciones del entornoacadémico pueden convertirse enproveedores de datos OAI de unaforma relativamente sencilla, co-mo la que sugiere OAIster, queanima a las instituciones potencia-les de serlo.http://oaister.umdl.umich.edu

2. Proveedores de servicios

Su función es usar los metada-tos que han extraído por medio deOAI-PMH de los proveedores dedatos y construir servicios de bús-queda complejos con un interfazúnico:

—ARC (a cross archive searchservice): permite extraer metadatosy hacer búsquedas cruzadas entrearchivos diferentes.

—MyOAI: proporciona un in-terfaz de búsqueda entre las distin-tas bases de metadatos OAI y fun-ciones como SDIs o el historial debúsqueda.

—OAIster: posibilita las bús-quedas de metadatos entre reposito-rios utilizando operadores de proxi-midad y otros mecanismos (Mc-Kiernan, 2004).

En cuanto a los proveedores deservicios OAI cabe destacar por lapotencia de sus resultados Scopus,el buscador de la editorial Elsevier,que ha ampliado la cobertura deScirus, el cual por su parte ya era elmás potente buscador científico eninternet. Scirus indizaba la mayorparte de las principales revistas yeditores, bases de datos, más de 160millones de sites .edu, .org, .ac.uk,.com, .gov, de medicina, ciencia,tecnología, universidades, etc. Conello, Scopus, se ha convertido en lamayor base de datos de sumarios

del mundo abarcando tanto recur-sos que requieren suscripción comogratuitos, repositorios, bases de da-tos y revistas con acceso abierto:CogPrints, ArXiv.org, US Patentand Trademark Office, E-Print Ar-Xiv, Chemistry Preprint Server,BioMed Central, PubMed Central,Scitation y otros desde el año 1966,haciendo búsquedas simultáneas entodas las áreas de conocimiento,con herramientas de consulta bas-tante avanzadas.http://info.scopus.comhttp://scirus.com

«Es conveniente quelos autores sepan quéeditoriales permiten el

archivo enrepositorios, y para

ello se puede acudir awebs como Romeo»

En cuanto al software abierto,las tecnologías más habituales sonJava, PERL, APS, PHP, GNU, etc.Con relación a este tema es muyútil el informe detallado Digicultreport: core technologies for thecultural and scientific heritage sec-tor (2005), donde se explica la dife-rencia entre el free software, que serefiere al que es accesible pública-mente, y el open software (OSI) decódigo abierto, donde el códigofuente es mejorado de forma conti-nua de cara a una mayor calidad delas aplicaciones (Zurita, 2003). És-te sería el modelo “bazar”, frente alsistema “catedral” del software pro-pietario (Raymond, 1998). Lasprincipales fuentes de informaciónestán en Sourceforge.net y enOpensource.org (tabla 2).

3. OAI-PMH para la extrac-ción normalizada de metadatos

Un protocolo es un lenguajeutilizado para comunicar equiposentre sí. OAI-PMH por su parte es-tá basado en http y en xml, y fuecreado para la extracción de norma-lizada de los metadatos que estánaccesibles en los repositorios que

cumplen el estándar Dublin Core(Weibel, 2000). Por un lado, xmlproporciona una sintaxis para la es-tructuración de documentos; porotro, los metadatos proporcionan lainfraestructura para el proceso depreservación digital.

El proveedor de servicios llevaa cabo la extracción de los metada-tos en los registros del proveedor dedatos (figura 3) para construir ser-vicios de búsqueda complejos.

Figura 3. Varios proveedores de serviciospueden extraer información de varios

proveedores de datos

OAI-PMH soluciona el proble-ma inicial de los múltiples interfa-ces de búsqueda y el hecho de queno hubiera una manera automáticade poner en común los metadatoscorrespondientes. Por ello se pusoel énfasis en la compatibilidad. Deesta forma se ideó la recopilaciónpor parte de una máquina de losmetadatos de los archivos, para pro-porcionar servicios centralizados debúsqueda.http://oforum.org

El Universal Preprint Service(UPS), predecesor de OAI, como yase ha dicho, supuso la demostraciónde que era posible crear una biblio-teca digital que diera acceso a ser-vicios basados en colecciones demetadatos recopilados en múltiplesarchivos, es decir, se había avanza-do en la interoperabilidad y en lapreservación. Desde la reunión deSanta Fe se demostró que medianteel protocolo UPS era posible hacerbúsquedas cruzadas a partir de lacolección de metadatos recopiladosen múltiples archivos, lo que permi-tía determinar qué servidor utilizaren cada consulta y obviar proble-

Page 10: Open Archives Initiative y Open Archival Information System

Teresa Silió

El profesional de la información, v. 14, n. 5, septiembre-octubre 2005374

mas en los lenguajes de interroga-ción, en la sintaxis y los atributos.Se se había dado un paso más haciael desarrollo de marcos que permi-tiesen poner en común distintos do-minios del conocimiento.

La arquitectura básica de laOAI es: el Service provider haceuna petición al Data provider me-diante http, el cual le responde en-viándole los metadatos en xml gra-cias a OAI-PMH (figura 4).

Los archivos se pueden consul-tar directamente, pero podrán serindizados por los motores de bús-queda como OAIster en la medidaen que los datos cumplan el forma-to OAI (OAI-compliant), que es laespecificación del Dublin Core Me-tadata Initiative (DCMI) de quinceelementos (Unqualified Dublin Co-re), adoptado como norma ISO15836. Los metadatos proporciona-dos por los proveedores de datos noson obligatorios y todos son repeti-bles. Algunos de los metadatos queforman el Dublin Core MetadataElement Set son: Title, Creator,Subject, Description, Publisher,Contributor, Date, Type, Format,Identifier, Source, Language, Rela-tion, Coverage y Rights. Se suelenpresentar divididos en tres gruposque indican la clase o alcance de lainformación que incluyen, con la

capacidad de describir cualquierobjeto de información (Méndez,2002). Con el avance en materia dehomogeneidad por parte de OAI secumple la razón de ser del DublinCore: “definir marcos para la inte-roperabilidad de los conjuntos demetadatos” (Weibel, 2000).

Dublin Core era ya en 2000 elestándar de facto de metadatos en laweb (Weibel, 2000). Sin embargo,desde Los Alamos National Labo-ratory sugirieron el uso de otrosformatos como MPEG 21 DIDL,METS o Scorm, que tienen la capa-cidad de describir relaciones múlti-ples entre recursos.

La razón por la que es preferi-ble el uso de OAI-PMH es que selleva un registro de cada entrada demetadatos, pero no del recurso, demanera que al cambiar los metada-tos cambian los registros. Si se mo-difican los recursos, también lo ha-cen los metadatos y los registros delos metadatos, de manera que hayuna sincronización completa entretodos. Pero el protocolo no sólocontrola los metadatos, sino quetambién los propios recursos. Poresta razón introducen formatoscomplejos de objetos para describirrecursos digitales y expanden elámbito de los metadatos más allá deDublin Core o Marc a los llamados

complex object formats (21 DIDL,METS y Scorm), que en combina-ción con OAI-PMH proporcionanun marco para la recopilación de re-cursos digitales (Van de Sompel etal., 2004).

Enlaces y metadatos:OpenURL y CrossRef

Las urls no son enlaces persis-tentes. Por ello, OpenURL y Cross-Ref se complementan.

Los DOIs (digital object identi-fiers) constituyen la url permanentede un objeto digital, por ejemplouna imagen o un artículo. Sobre es-ta base se llevó a cabo el desarrollode CrossRef, una iniciativa para im-plementar identificadores únicospara los recursos digitales que per-mitiesen su localización, indepen-dientemente de dónde se encontraseel recurso en internet (Samuels,2001). La iniciativa CrossRef fuelanzada conjuntamente por los prin-cipales editores asociados expresa-mente en PILA (Publishers Interna-tional Linking Association, Inc.) enel año 2000 para enlazar directa-mente las citaciones con los respec-tivos artículos mediante DOI.

Los editores usan un procesoautomático para depositar los regis-tros de los metadatos en la base dedatos de CrossRef, donde cada re-gistro debe incluir un DOI y unaurl, así como los metadatos siguien-tes: Journal title, Issn, First author,Year, Volume, Issue, y Page num-ber. Después se deposita un registrocon los metadatos y se registra elpar [doi-url] en un directorio cen-tral (Brand, 2004). CrossRef incor-poró una mejora en sus hiperenla-ces llamada multiple resolution delos DOIs, por la que se pueden aso-ciar elementos múltiples a cadaDOI, de manera que al pinchar enun determinado enlace aparece unmenú de posibilidades: todos loswebs donde se encuentra el objeto oartículo buscado, otros formatos delmismo artículo, recursos relaciona-dos... El directorio DOI debe conte-Figura 4. Funcionamiento del protocolo OAI-PMH (Nelson)

Page 11: Open Archives Initiative y Open Archival Information System
Page 12: Open Archives Initiative y Open Archival Information System

Teresa Silió

El profesional de la información, v. 14, n. 5, septiembre-octubre 2005376

ner identificadores para todos los ti-pos de material (artículos, patentes,informes, imágenes) gracias al re-gistro de múltiples agencias de re-gistro de DOIs para que se produz-ca una red de enlaces del tipo com-prehensive linking network (Brand,2004).

«CrossRef fuelanzado por los

principales editoresagrupados en PILA en

el año 2000 paraenlazar directamentelas citaciones con losrespectivos artículos

usando DOI»

Por su parte, OpenURL se desa-rrolló a raíz del enorme crecimientode las colecciones de publicacioneselectrónicas. También influyó el he-cho de que los sistemas de informa-ción fuesen distribuidos, así comoque las bases de datos se encontra-sen tanto en un entorno local comoremoto. Por todo ello se vio la ne-cesidad de interrelacionar la infor-mación disponible para solventarlos problemas derivados de que loslinks proporcionados por los prove-edores no cubrían la totalidad de lascolecciones y no eran sensibles alcontexto del usuario. OpenURLconstituye la solución a estos in-convenientes por ser un link quetransporta los metadatos del regis-tro a un servidor de enlaces, queproporciona un link que es sensible

al contexto, de manera que Ope-nURL transforma los metadatos ylos identificadores en servicios(Nelson, 2003). Eso es precisamen-te OpenURL, una dirección webque contiene los metadatos del artí-culo con un formato determinado.

En los sistemas de enlaces ba-sados en OpenURL la informaciónsobre la citación de un recurso apa-rece codificada como una direcciónweb. Un servidor de enlaces puedeconstruir direcciones web a partirde los metadatos; pero debe sabercómo obtenerlos, en qué formatoaparecen en la url, y ése precisa-mente es el papel de OpenURL: serun estándar para transmitir metada-tos en una url, de manera que dossistemas se los puedan mandar en-tre sí con una sintaxis específica,con un formato determinado (Sa-muels, 2001). En la tabla 3 se pue-de ver un ejemplo de cómo se llevaa cabo esta distribución; el enlacepodría contener además el DOI delartículo. OpenURL puede funcionarde forma persistente mediante DOIsin tener que actualizar los metada-tos. Se convierte de esta forma enun mecanismo de transporte de me-tadatos y de identificadores quedescriben una publicación para ha-cer un context-sensitive linking, esdecir, enlaces sensibles al contextodel usuario.

OpenURL contiene, pues, tantouna url básica como metadatos;manda los metadatos a gestores de

enlaces (link resolvers) como SFX oLinkFinder Plus, que enlazan con elrecurso o con el texto completo delos artículos (Samuels, 2001), de-pendiendo del contexto de los usua-rios. Gracias a los gestores de enla-ces, se pueden relacionar las Ope-nURLs entrantes y los privilegioslocales de acceso de cada institu-ción y desplegar así los enlaces delos recursos apropiados como catá-logos, textos completos, motores debúsqueda, bases de datos, etc.(Brand, 2004), de tal manera quefiltran el acceso que cada institu-ción tiene a cada recurso.

Open ArchivalInformation System

(OAIS)1

Ha sido publicado como una re-comendación del Ccsds (Consulta-tive Committee for Space Data Sys-tems) y como norma ISO14721:2003. OAIS focaliza su acti-vidad en la preservación a largoplazo de la información científicaen formato digital, como garantíade que será accesible en el futuro(Hirtle, 2001). Este doble propósi-to, conservación y acceso, parte delhecho de que la información sobre-vive a su soporte y por ello es pre-ciso adelantarse a la obsolescenciade la tecnología (Holdsworth,1999).

Los rápidos cambios que seproducen en la industria informáti-ca y la naturaleza efímera del alma-cenamiento electrónico de datos ha-

La OpenURL siguiente:http://LinkFinderPlus.library.edu?genre=article&issn=12345678&volume=99&issue=1&date=20020101&spage=27&atitle=WhatIs An OpenURL&title=Harry's White Papers

Se descompone en los siguientes metadatos:

“genre=article" Género del objeto descrito, un artículo de revista.

"&"Sirve para separar los elementos de los metadatos entre sí. Aparecetantas veces como sea necesario.

"issn=12345678" Issn de la revista que contiene el artículo, el 12345678.

"volume=99" Volumen de la revista, el 99.

"issue=1" Número de la revista, el 1.

"date=20020101" Fecha de publicación del artículo, 20020101 ( 1 de enero de 2002).

"spage=27" Página en la que comienza el artículo, la 27.

"atitle=What is an openURL" Título del artículo, "What is an openURL".

"title=Harry's white papers" Título de la revista, "Harry's white papers".

Tabla 3. OpenURL formada por metadatos

Page 13: Open Archives Initiative y Open Archival Information System

Fundamentos tecnológicos del acceso abierto: Open Archives Initiative y Open Archival Information System

El profesional de la información, v. 14, n. 5, septiembre-octubre 2005 377

cen necesario planificar su preser-vación. Los registros pueden sermigrados (mediante refresco, repli-cación, re-empaquetamiento otransformación) hacia otros sopor-tes o hacia diferentes entornos desoftware para que continúen siendoaccesibles (Ccsds 650.0-B-1). Unsistema de información debe consi-derar el hardware, el software y losrecursos humanos necesarios parala adquisición, preservación y difu-sión de la información. OAIS con-siste en un modelo lógico que abar-ca todas las funciones de un reposi-torio digital, apuntando la forma enque los objetos digitales deben serpreparados, enviados a un archivo,almacenados durante largos perío-dos, conservados y recuperados. Elcontenido de la información está ín-timamente ligado al formato y de larepresentación del conocimiento,junto a los inconvenientes de la pre-servación de los equipos y de losprogramas necesarios para accedera los datos, que deben ser tambiénconservados (Abrams, 2003).

«OpenURL es un urlque contiene los

metadatos delartículo»

El modelo de referencia OAISlo desarrolló el Ccsds, un organis-mo internacional formado por lasprincipales agencias espaciales, apropuesta de la International Orga-nization for Standardization (ISO).Corresponde al borrador de la nor-ma ISO reference model for anopen archival information system(Hirtle, 2001) y su propósito inicialfue para la gestión de la informa-ción aeroespacial, convirtiéndoseluego en estándar para el archivo yacceso a la información en general.

El Ccsds estableció la termino-logía y los conceptos necesarios pa-ra describir los modelos de datos yla arquitectura, identificando lasprincipales entidades y las relacio-nes que se dan en el entorno de unarchivo. La parte del modelo de re-

ferencia que ha sido relevante parala preservación ha sido el OAIS in-formation model, que describe losrequerimientos de los metadatospara que un objeto digital perdure(Ccsds 650.0-B-1).

En OAIS “información” se defi-ne como: “cualquier clase de cono-cimiento que puede ser intercam-biado” y “es siempre expresada poralgún tipo de datos” (Ccsds 650.0-B-1). La información puede existirde dos maneras: como un objeto fí-sico en papel o como un objeto di-gital. En los dos casos se llama da-ta object (objeto de datos), y puedeser el propio material que debe pre-servarse, o los metadatos asociadosal mismo. El objeto de datos debeser interpretado (figura 5) usando lainformación sobre su representa-ción (representation information),lo que produce un objeto de infor-mación (information object).

Un “paquete de información”(information package) es un conte-nedor conceptual formado por doscomponentes: la información sobreel contenido (content information)y la información sobre la preserva-ción (preservation description in-formation, PDI). El paquete de in-formación tiene tres variantes: pa-quete de información de envío, dearchivo y de difusión.

“Archivo”, se refiere a “unagran variedad de sistemas de alma-cenamiento y preservación”. Pre-servan el contenido y la autentici-dad de la información, haciendo ac-cesibles a la comunidad los regis-tros y gestionando su propiedad, yaplicando criterios de aceptación dela información —que deben incluir,entre otros, la materia tratada, fuen-te, originalidad, técnicas utilizadas,formato, etc.—. Se deben tener en

cuenta varios aspectos, como lasimplicaciones de copyright y depropiedad intelectual, así como lacapacidad para modificar la repre-sentación de la información o losacuerdos con organizaciones exter-nas. El objeto de preservación es lainformación, que debe ser entendi-da de forma independiente de la co-munidad que la ha producido. Sedebe considerar de diferente mane-ra la posesión física del contenidoinformativo de un documento y losderechos de propiedad intelectualde esa información.

OAIS es un modelo de referen-cia más que un plan de implementa-ción: es un marco conceptual paraun sistema completo de archivosque describe la arquitectura de losrepositorios, pero no especifica có-mo deberían ser implementados porlas organizaciones, lo que le otorgagran flexibilidad. Por ello ha sidoutilizado por diversas institucionespara el diseño de repositorios dedistintos tipos: Cedars Project,Harvard University’s Digital Repo-sitory, Library of Congress, Massa-chusetts Institute of Technology(MIT) D-Space/Repository schema-tic, OCLC Digital Archive, etc.

Perspectivas del accesoabierto

La revolución digital conllevacambios en el modo en que se llevaa cabo la investigación científica yen como se genera el conocimiento.Se redefinen la difusión, puesta encomún y publicación de la informa-ción (Grivell, 2003), así como elciclo del conocimiento. Se estable-cen nuevas relaciones entre las ba-ses de datos, las hipótesis y los da-tos resultantes de la investigación(Grivell, 2003). La cadena docu-mental de la información científica

Figura 5. Obtención de la información a partir de los datos (CCSDS 650.0-B-1)

Page 14: Open Archives Initiative y Open Archival Information System

Teresa Silió

El profesional de la información, v. 14, n. 5, septiembre-octubre 2005378

ha sido ampliada, abarcando másallá de la entrada, tratamiento y sa-lida de la información, debido a quelas propias operaciones de “entra-da”, “tratamiento” y “salida” sonahora muchas y muy distintas; losprocesos de selección, análisis do-cumental y difusión quedan trasto-cados por el hecho de que la infor-mación sea accesible antes de supublicación, que la de varias disci-plinas sea accesible al mismo tiem-po, y que la recuperación se veamejorada por herramientas como labúsqueda por proximidad semánti-ca entre documentos, búsqueda endistintas lenguas, formatos, reposi-torios, bases de datos, etc. Se rede-fine incluso el “documento”, queabarca información complementa-ria. La propia arquitectura de la in-formación científica y técnica ha si-do replanteada a causa de internet,en concreto, en el caso de las bi-bliotecas digitales, donde “OAI-PMH está llamado a ser lo que httpes hoy al web” (Barrueco et al.,2003).

Se suele hablar de acceso abier-to principalmente en campos comola biomedicina o la física, pero en elcampo de las humanidades el acce-so abierto significará una revolu-ción sólo comparable a la apariciónde la imprenta. Mientras que en lasciencias los conocimientos se supe-ran y aparecen en forma de revisio-nes (reviews), en el campo de lashumanidades es preciso citar todaslas fuentes anteriores, ya que losconocimientos se acumulan, no sequedan obsoletos, e incluso puedenser más valiosos. Por ello, iniciati-vas como el proyecto de Google dedigitalizar quince millones de librosde bibliotecas, serán impactantes enel campo de las humanidades. Losautores nunca soñaron tener “todo,aquí y ahora”, algo que recuerdaaquella biblioteca de Babel de Bor-ges, “cuando se proclamó que la bi-blioteca abarcaba todos los libros,la primera impresión fue de extra-vagante felicidad...”.http://print.google.com

En la medida en que el OA pro-porcione más visibilidad, rapidez,facilidad de uso, interoperabilidad,número de descargas por artículo yanálisis de citaciones (Hubbard,2005), permitirá dar idea de cuál esel impacto real de un artículo.

«Que OA triunfe no essólo una cuestión demodelos económicos,

ya que el caráctergratuito de esta

iniciativa no serácapaz por sí mismo

de consolidarla»

Que el acceso abierto triunfe noes sólo una cuestión de modeloseconómicos, ya que el carácter gra-tuito de esta iniciativa no será capazpor sí mismo de consolidarlo. De-pende más bien de que tenga presti-gio entre la comunidad académica yentre los organismos que evalúan adicha comunidad, por lo que la ca-lidad es el componente decisivo. Denada sirven la interoperabilidad, losmetadatos, los buscadores en archi-vos distribuidos, los gestores de en-laces, la tecnología capaz de resu-mir, de indizar y de procesar len-guaje natural, si no hay calidad enla información.

Suponiendo que el modelo OAllegue a triunfar —que sería lo de-seable y, además, parece viable—se llegaría a otro gran problema: lasobreabundancia de información.No basta con que esté “todo” acce-sible, sino que es preciso que estéaccesible “todo lo que necesito ysólo eso” en un determinado mo-mento. Se puede decir que uno delos grandes impedimentos del OAva a ser la sobreabundancia de in-formación, a menos que gran partede la apuesta por las iniciativas deacceso abierto pase por las mejorasen técnicas de posicionamiento,procesamiento del lenguaje natural(NLP), contextualización, relevan-cia, análisis y refinamiento de lasbúsquedas. Procurar información

científica no sólo consiste en daracceso abierto, sino en dar accesoabierto pertinente (pertinent openaccess, POA): éste es el gran reto.

Conclusiones

OAI focaliza su atención en lainteroperabilidad y la rápida distri-bución de la información, en facili-tar el acceso a los repositorios de e-prints para aumentar la disponibili-dad de la información académica;mientras que OAIS centra su activi-dad en la preservación a largo plazode la información como garantía deque será accesible en el futuro. Apartir de iniciativas como OAI yOAIS es posible crear bibliotecas yarchivos digitales que garanticen unacceso integrado, universal y a lar-go plazo a la información.

Estos avances tecnológicosconstituyen un acontecimiento sinprecedentes que posibilita la inter-conexión de las publicaciones cien-tíficas en forma de una verdaderatela de araña, donde a través de unapublicación se pueden recorrer infi-nitamente todas las demás, como elaleph borgiano, uno de los puntosdel espacio que contiene todos lospuntos, algo propio de las ficcioneshasta no hace mucho tiempo. Cadavez parece más viable la declara-ción de la IFLA sobre el accesoabierto de que la red mundial de bi-bliotecas y servicios de informa-ción proporciona acceso a las publi-caciones académicas y de investi-gación pasadas, presentes y futurasy asegura su preservación.

http://www.ifla.org

Nota

1. No confundir OAIS Open Archival Informa-tion System con OASIS (Organization for theAdvancement of Structured Information Stan-dards), que es un consorcio internacional que seocupa del desarrollo y adopción de estándarespara el comercio electrónico y su seguridad. Enorigen se trataba de SGML Open, y estaba dedi-cado al intercambio de documentos sgml, mien-tras que en la actualidad está relacionado con elestándar xml.

http://oasis-open.org

http://xml.org

Page 15: Open Archives Initiative y Open Archival Information System

Fundamentos tecnológicos del acceso abierto: Open Archives Initiative y Open Archival Information System

El profesional de la información, v. 14, n. 5, septiembre-octubre 2005 379

Bibliografía

Abrams, Stephen; Seaman, David.“Information technology and preserva-tion and conservation workshop”. En:World library and information con-gress: 69th IFLA General conferenceand council, 2003. Consultado en:abril-2005.http://www.ifla.org/IV/ifla69/papers/128e-Abrams_Seaman.pdf

Association of College & Research Li-braries (ACRL). Principles and strate-gies for the reform of scholarly com-munication, 2003, agosto. Consultadoen: marzo-2005.http://www.ala.org/ala/acrl/acrlpubs/whitepapers/principlesstrategies.htm

Bailey, Charles. Open access bibliog-raphy: liberating scholarly literaturewith e-prints and open access journals.Association of Research Libraries(ARL), 2005. Consultado en:abril–2005.http://www.arl.org/pubscat/pubs/openaccess/OABweb.pdf

Barrueco Cruz, José Manuel; Subi-rats Coll, Imma; Open Archives Initia-tive Protocol for Metadata Harvesting(OAI-PMH): descripción, funciones yaplicación de un protocolo. En El Pro-fesional de la Información, 2003, v. 12,n.2,pp. 99-106http://www.elprofesionaldelainformacion.com

Brand, Amy. “Publishers joining for-ces through CrossRef”. En: Serial re-views, 2004, v. 30, n. 1, pp. 3-9. Con-sultado en: marzo-2005.http://www.sciencedirect.com/science/journal/00987913

Ccsds 650.0-B-1: reference model foran open archival information system(OAIS). Blue book (standard). Issue 1.January 2002. Consultado en: abril-2005.http://ssdoo.gsfc.nasa.gov/nost/wwwclassic/documents/pdf/CCSDS-650.0-B-1.pdf

Cedars guide to the distributed digitalarchiving prototype. Consultado en:abril-2005.http://www.leeds.ac.uk/cedars/guideto/cdap/guidetocdap.pdf

Crow, Raym. Guide to institutional repositorysoftware. Open Society Institute, 2004. Consul-tado en: mayo-2005.http://www.soros.org/openaccess/pdf/OSI_Guide_to_IR_Software_v3.pdf

Cundiff, Morgan. “Towards an archival infor-mation package for audiovisual materials”. Li-brary of Congress. Consultado en: abril-2005.http://www.rlg.org/en/downloads/longterm/forum02/cundiff.html

Fox, Edward. “Open archives initiative”. En:D-lib magazine, 2000, v. 6, n. 6. Consultado en:abril-2005.http://www.dlib.org/dlib/june00/06inbrief.html#FOX

Franklin, Jack. “Open access to scientific andtechnical information: the state of the art”. En:Inist report, 2002. Consultado en: abril-2005.

http://www.inist.fr/openaccess/en/etat_art.php

Garrett, John. ISO archiving standards over-view. Consultado en: abril-2005.

http://ssdoo.gsfc.nasa.gov/nost/isoas/overview.html

Ginsparg, Paul; Luce, Rick; Van de Sompel,Herbert. The open archives initiative aimed atthe further promotion of author self-archivedsolutions, 1999. Consultado en: febrero-2005.http://www.openarchives.org/meetings/Santa-Fe1999/ups-invitation-ori.htm

Ginsparg, Paul; Luce, Rick; Van de Sompel,Herbert. First meeting of the universal preprintservice initiative, 1999. Consultado en: febrero-

2005.http://www.openarchives.org/news/ups1–press.htm

González Jesús; Seoane, Joaquín; Robles, Gre-gorio. Introducción al software libre, Barcelona,UOC, 2003,http://www.uoc.edu/masters/softwarelibre/esp/materials/libre.pdf

Goodman, David. “The criteria for open ac-cess”. En: Serials review, 2004, v. 30, n. 4, pp.258-270. Consultado en: marzo-2005.http://www.sciencedirect.com/science/jour-nal/00987913

Goodman, David. “The criteria for open ac-cess”. En: Serials review, 2004, v. 30, n. 4, pp.258-270. Consultado en: marzo-2005.http://eprints.rclis.org/archive/00003542/02/SR30_4_Goodman.pdf

Page 16: Open Archives Initiative y Open Archival Information System

El profesional de la información, v. 14, n. 5, septiembre-octubre 2005380

Grivell, Les; E-Biosci: Semantic networks ofbiological information, (EMBO) 2003http://eprints.rclis.org/archive/00000912/

Hirtle, Peter. “OAI and OAIS: what’s in a na-me?” En: D-lib magazine, 2001, v. 7, n. 4. Con-sultado en: marzo-2005.http://www.dlib.org/dlib/april01/04editorial.html

Hitchcock, Steve. “Metalist of open access e-print archives: the genesis of institutionalarchives and independent services”. En: ARL bi-monthly report, 2003, April, n. 227. Consultadoen: abril-2005.http://www.arl.org/newsltr/227/metalist.html

Holdsworth, David; Sergeant, D. M. A blue-print for representation information in the OAISmodel, 1999. Consultado en: abril-2005.http://www.personal.leeds.ac.uk/~ecldh/cedars/ieee00.html

Hubbard, William. Open access institutionalrepositories in UK universities, 2005. Consulta-do en: mayo-2005.http://eprints.rclis.org/archive/00003519/

IFLA statement on open access to scholarly lite-rature and research documentation, February24, 2004. Consultado en: marzo-2005.http://www.ifla.org/V/cdoc/open-access04.html

Lagoze, Carl; Van de Sompel, Herbert; Nel-son, Michael; Warner, Simeon. 2002. TheOpen archives initiative protocol for metadataharvesting, version 2.0, 2002, June. Consultadoen: marzo-2005.http://www.openarchives.org/OAI/2.0/openarchivesprotocol.htm

McKiernan, Gerry. “Open content and accessfor digital scholarship”. En: WiLSWorld confe-rence, 2004. Consultado en: marzo-2005.

http://www.public.iastate.edu/~gerrymck/OpenContent.ppt

Méndez, Eva. Metadatos y recuperación de in-formación. Gijón: Trea, 2002, Isbn 84-9704-055-4.

Nelson, Michael. Institutional archives techno-logy overview, 2003. Consultado en: marzo-2005.http://www.cs.odu.edu/~mln/pubs/loc-ia-nelson.ppt

Nixon, William. “Daedalus: freeing scholarlycommunication at the University of Glasgow”.En: Ariadne, 2003, 14 Jan., n. 34. Consultadoen: mayo-2005.http://www.ariadne.ac.uk/issue34/nixon/intro.html

Raymond, Eric. La catedral y el bazar, 1998.Consultado en: abril-2005.http://sindominio.net/biblioweb/telematica/catedral.html

Ross, S., et al. “Core technologies for the cultu-ral and scientific heritage sector”. The Digi-CULT technology watch report 3. Luxemburgo:Office for Official Publications of the EuropeanCommunities, 2005, 92-828-5189-3. Consultadoen: marzo-2005.http://www.digicult.info

Samuels, Harry. OpenURL: a tutorial. Consul-tado en: abril-2005.http://www.endinfosys.com/pdf/openurl4_02.pdf

Samuels, Harry. The state of linking today andendeavor’s linking solutions: Linkfinder andLinkfinder plus, 2001. Consultado en: marzo-2005.http://www.endinfosys.com/ENCompass/linkingwhitepapers.pdf

Smith, Alastair. Citations and links as a mea-sure of effectiveness of online LIS journals. En:

IFLA journal, 2005, v. 31, n. 1, pp. 76-84. Con-sultado en: marzo-2005.http://ifla.org/V/iflaj/IFLA-Journal-1-2005.pdf

Suber, Peter. “Open access in 2004”. En: Sparcopen access newsletter, 2005a, enero, n. 81.Consultado en: abril-2005.http://www.earlham.edu/~peters/fos/newsletter/01-02-05.htm

Suber, Peter. Open access overview: focusingon open access to peer-reviewed research arti-cles and their preprints, 2005b, marzo. Consul-tado en: febrero-2005.http://www.earlham.edu/~peters/fos/overview.htm

Weibel, Stuart. “The Dublin Core MetadataInitiative: mission, current activities, and futuredirections”. En: D-lib magazine, 2000, v. 6, n.12. Consultado en: abril-2005.http://www.dlib.org/dlib/december00/weibel/12weibel.html

Zurita Sánchez, Juan Manuel. “Software librey libre acceso a la información: ingredientes pa-ra un ciberespacio público”. En: ProceedingsXXXIV Jornadas mexicanas de biblioteconomía,2003, pp. 408-424. Consultado en: abril-2005.http://eprints.rclis.org/archive/00003480/

Van de Sompel, Herbert; Nelson, Michael;Lazoge, Carl; Warner, Simeon. “Resource har-vesting within the OAI-PMH framework”. En:D-lib magazine, 2004, v. 10, n. 12, Consultadoen: marzo-2005.http://www.dlib.org/dlib/december04/vandesompel/12vandesompel.html

Teresa Silió, Laboratorio de Internet,Cindoc-CSIC.Joaquín Costa, 22; 28002 [email protected]