Tema 5; XML en la descripción de recursos

42
Tema 5; Tema 5; XML en la descripción de XML en la descripción de recursos recursos Ricardo Eíto Brun Ricardo Eíto Brun Sevilla, 23-25 de octubre Sevilla, 23-25 de octubre 2002 2002

description

Tema 5; XML en la descripción de recursos. Ricardo Eíto Brun Sevilla, 23-25 de octubre 2002. Introduction. - PowerPoint PPT Presentation

Transcript of Tema 5; XML en la descripción de recursos

Page 1: Tema 5; XML en la descripción de recursos

Tema 5;Tema 5;XML en la descripción de recursosXML en la descripción de recursos

Ricardo Eíto BrunRicardo Eíto Brun

Sevilla, 23-25 de octubre 2002Sevilla, 23-25 de octubre 2002

Page 2: Tema 5; XML en la descripción de recursos

IntroductionIntroduction Los formatos de marcas se han presentado Los formatos de marcas se han presentado

como una alternativa/complemento a los como una alternativa/complemento a los sistemas de codificación de datos utilizados sistemas de codificación de datos utilizados tradicionalmente por la comunidad tradicionalmente por la comunidad bibliotecaria en la descripción de recursosbibliotecaria en la descripción de recursos

Desde mediados de los años 90 se han Desde mediados de los años 90 se han planteado distintas iniciativas en esta líneaplanteado distintas iniciativas en esta línea

El origen de estas iniciativas están distintas El origen de estas iniciativas están distintas bibliotecas. Las iniciativas más importantes bibliotecas. Las iniciativas más importantes han sido lideradas por la Library of Congress han sido lideradas por la Library of Congress

Page 3: Tema 5; XML en la descripción de recursos

MARC y XMLMARC y XML Podemos señalar distintas líneas de trabajo:Podemos señalar distintas líneas de trabajo:

• Diseño de modelos alternativos para la Diseño de modelos alternativos para la descripción de recursos (Dublin Core)descripción de recursos (Dublin Core)

• Adaptación de los modelos “tradicionales” – Adaptación de los modelos “tradicionales” – MARC -, a los nuevos formatos Internet (xml)MARC -, a los nuevos formatos Internet (xml)

El formato XML se ha presentado como una El formato XML se ha presentado como una alternativa para representar y transferir registros alternativa para representar y transferir registros MARC a través de Internet y facilitar su MARC a través de Internet y facilitar su tratamiento automatizadotratamiento automatizado

Page 4: Tema 5; XML en la descripción de recursos

MARC y XMLMARC y XML Las ventajas de XML son:Las ventajas de XML son:

• XML ofrece un sistema de codificación más XML ofrece un sistema de codificación más simple y fácil de procesar que el utilizado simple y fácil de procesar que el utilizado actualmente para registros MARC (2709)actualmente para registros MARC (2709)

• XML se presenta como un formato “universal”, XML se presenta como un formato “universal”, utilizado en cualquier tipo de aplicación, frente utilizado en cualquier tipo de aplicación, frente al sistema de codificación actual de MARCal sistema de codificación actual de MARC

• XML elimina complejidad innecesaria para los XML elimina complejidad innecesaria para los desarrolladoresdesarrolladores

• Se pretende evitar la “segregación” de MARC Se pretende evitar la “segregación” de MARC frente a otros formatos de metadatos Internet frente a otros formatos de metadatos Internet utilizados en los proyectos de “biblioteca utilizados en los proyectos de “biblioteca electrónica”electrónica”

Page 5: Tema 5; XML en la descripción de recursos

MARC y XMLMARC y XML Al mismo tiempo, MARC presenta ventajas frente Al mismo tiempo, MARC presenta ventajas frente

a los formatos de metadatos que se han a los formatos de metadatos que se han propuesto para el “mundo Internet”, como Dublin propuesto para el “mundo Internet”, como Dublin Core:Core:

• Mayor capacidad expresivaMayor capacidad expresiva• Soporte de más de 30 años por parte de la Soporte de más de 30 años por parte de la

comunidad bibliotecaria y de la industria comunidad bibliotecaria y de la industria software especializadosoftware especializado

• Una semántica claramente definida, aceptada Una semántica claramente definida, aceptada y adaptada a las distintas realidades y adaptada a las distintas realidades nacionalesnacionales

• Cobertura a un amplio número de “formatos” y Cobertura a un amplio número de “formatos” y “tipos de información” (autoridades, datos “tipos de información” (autoridades, datos bibliográficos, holdings, etc.)bibliográficos, holdings, etc.)

Page 6: Tema 5; XML en la descripción de recursos

MARC y XMLMARC y XML Resumiendo:Resumiendo:

• MARC es un formato que permite codificar y MARC es un formato que permite codificar y transmitir un gran número de datos de una transmitir un gran número de datos de una forma estandarizada y fácilmente procesableforma estandarizada y fácilmente procesable

• El resto de alternativas que se an propuesto El resto de alternativas que se an propuesto para la descripción de recursos adaptadas a para la descripción de recursos adaptadas a “Internet” no ofrecen la expresividad o el nivel “Internet” no ofrecen la expresividad o el nivel de detalle necesariode detalle necesario

• Estas alternativas se encuentran en fase de Estas alternativas se encuentran en fase de desarrollo, y no podemos garantizar su desarrollo, y no podemos garantizar su permanencia en un futuropermanencia en un futuro

Page 7: Tema 5; XML en la descripción de recursos

MARC y XMLMARC y XML Resumiendo:Resumiendo:

• MARC no sólo es un estándar para facilitar el MARC no sólo es un estándar para facilitar el intercambio de información bibliográfica, intercambio de información bibliográfica,

• También se ha convertido en la base de los También se ha convertido en la base de los sistemas integrados de gestión bibliotecaria sistemas integrados de gestión bibliotecaria actualesactuales

Page 8: Tema 5; XML en la descripción de recursos

MARC y XMLMARC y XML Sin embargo, hay quien señala que MARC no es Sin embargo, hay quien señala que MARC no es

un formato “óptimo” para las necesidades un formato “óptimo” para las necesidades actuales en lo referente a la descripción de actuales en lo referente a la descripción de recursos:recursos:

• MARC es sumamente complejo, la descripción MARC es sumamente complejo, la descripción es costosa y lenta para el gran número de es costosa y lenta para el gran número de recursos que tenemos que describirrecursos que tenemos que describir

• El creciente número de recursos a describir nos El creciente número de recursos a describir nos obliga a plantear sistemas de indización obliga a plantear sistemas de indización “descentralizados”, que no requieran una “descentralizados”, que no requieran una formación tan compleja como la requerida para formación tan compleja como la requerida para trabajar con MARC, ni mecanismos de entrada trabajar con MARC, ni mecanismos de entrada de datos tan complejosde datos tan complejos

Page 9: Tema 5; XML en la descripción de recursos

MARC y XMLMARC y XML Los partidarios de “alternativas a MARC”:Los partidarios de “alternativas a MARC”:

• se basan más en la rapidez con que se podría se basan más en la rapidez con que se podría describir los recursos, y describir los recursos, y

• sacrifican la calidad y el detalle de la sacrifican la calidad y el detalle de la descripción de los recursos...descripción de los recursos...

Page 10: Tema 5; XML en la descripción de recursos

Adaptar MARC a Internet: primeras iniciativasAdaptar MARC a Internet: primeras iniciativas

Las primera iniciativa de la LOC se remonta a 1992 con la Las primera iniciativa de la LOC se remonta a 1992 con la inclusión del campo 856 (electronic location and access) en inclusión del campo 856 (electronic location and access) en MARCMARC

Este campo permitiría crear un enlace entre un registro Este campo permitiría crear un enlace entre un registro bibliográfico y un recurso remoto disponible en formato bibliográfico y un recurso remoto disponible en formato electrónicoelectrónico

Proyectos como el OCLC Internet Cataloging (1994-1996) Proyectos como el OCLC Internet Cataloging (1994-1996) utilizaron este campo para codificar 5000 registros de utilizaron este campo para codificar 5000 registros de recursos Internetrecursos Internet

El proyecto CATRIONA (CATaloguing and Retrieval of El proyecto CATRIONA (CATaloguing and Retrieval of Information Over Network Applications) también utilizó el Information Over Network Applications) también utilizó el 856856

Page 11: Tema 5; XML en la descripción de recursos

Adaptar MARC a Internet: primeras iniciativasAdaptar MARC a Internet: primeras iniciativas

El campo 856 “contiene la información necesaria para El campo 856 “contiene la información necesaria para localizar y acceder a un recurso electrónico [...] puede localizar y acceder a un recurso electrónico [...] puede utilizarse en un registro bibliográfico de un recurso cuando utilizarse en un registro bibliográfico de un recurso cuando éste o una parte del mismo esté disponible éste o una parte del mismo esté disponible electrónicamente...”electrónicamente...”

El primer indicador “define el método de acceso al recurso El primer indicador “define el método de acceso al recurso electrónico. Si el recurso es accesible por más de un electrónico. Si el recurso es accesible por más de un método, éste repite”método, éste repite”

El segundo indicador “indica la relación entre el recurso El segundo indicador “indica la relación entre el recurso electrónico identificado en el campo 856 y el documento electrónico identificado en el campo 856 y el documento descrito en el registro como un todo”descrito en el registro como un todo”

Page 12: Tema 5; XML en la descripción de recursos

Adaptar MARC a Internet: primeras iniciativasAdaptar MARC a Internet: primeras iniciativas

Los valores posibles para el primer indicador son:Los valores posibles para el primer indicador son:• # - no se proporciona información# - no se proporciona información• 0 – correo electrónico0 – correo electrónico• 1 – FTP1 – FTP• 2 – Telnet2 – Telnet• 3 – Llamada telefónica3 – Llamada telefónica• 4 – HTTP 4 – HTTP • 7 – Un método distinto al anterior, que se 7 – Un método distinto al anterior, que se

habrá indicado en el subcampo $2.habrá indicado en el subcampo $2.

Page 13: Tema 5; XML en la descripción de recursos

Adaptar MARC a Internet: primeras iniciativasAdaptar MARC a Internet: primeras iniciativas

Los valores posibles para el segundo indicador Los valores posibles para el segundo indicador son:son:• # - No se proporciona información# - No se proporciona información• 0 – Recurso. La localización electrónica hace referencia 0 – Recurso. La localización electrónica hace referencia

al mismo recurso descrito en el registro como un todo. al mismo recurso descrito en el registro como un todo. Es decir, el ítem representado por el registro Es decir, el ítem representado por el registro bibliográfico es un recurso electrónicobibliográfico es un recurso electrónico

• 1 – versión del recurso. La localización electrónica hace 1 – versión del recurso. La localización electrónica hace referencia a la versión electrónica del recurso descrito referencia a la versión electrónica del recurso descrito en el registro. Es decir, el documento descrito mediante en el registro. Es decir, el documento descrito mediante el registro no es electrónico, pero existe una versión en el registro no es electrónico, pero existe una versión en formato electrónicoformato electrónico

• 2 – Recurso relacionado2 – Recurso relacionado• 8 – “no hay una visualización asociada”8 – “no hay una visualización asociada”

Page 14: Tema 5; XML en la descripción de recursos

Adaptar MARC a Internet: primeras iniciativasAdaptar MARC a Internet: primeras iniciativas

245 10$aProceedings of the Seminar…245 10$aProceedings of the Seminar…

856 40$uhtp://www.loc.gov/seminar.html856 40$uhtp://www.loc.gov/seminar.html

245 00$aAnalyzing qualitative date$c/edited by…245 00$aAnalyzing qualitative date$c/edited by…

856 40$uhtp://www.loc.gov/analyzing.html856 40$uhtp://www.loc.gov/analyzing.html

245 00$aAmerican quarterly245 00$aAmerican quarterly

856 41$uhtp://www.muse.edu/journals/amquarterly.htm856 41$uhtp://www.muse.edu/journals/amquarterly.htm

245 00$aDocumentos de D. Pedro Valverde…245 00$aDocumentos de D. Pedro Valverde…

856 42$3Indice$uhtp://www.bne.es/pedroValverde.pdf856 42$3Indice$uhtp://www.bne.es/pedroValverde.pdf

Page 15: Tema 5; XML en la descripción de recursos

Adaptar MARC a Internet: primeras iniciativasAdaptar MARC a Internet: primeras iniciativas

SUBCAMPOSSUBCAMPOS $a – nombre del host de la localización electrónica$a – nombre del host de la localización electrónica $b – número de acceso (dirección IP)$b – número de acceso (dirección IP) $c – información sobre la compresión$c – información sobre la compresión $d – ruta física$d – ruta física $f – nombre electrónico del fichero$f – nombre electrónico del fichero $k – contraseña necesaria para acceder al recurso$k – contraseña necesaria para acceder al recurso $m – contacto para facilitar el acceso$m – contacto para facilitar el acceso $p – puerto$p – puerto $u – URI o URL$u – URI o URL $y – texto del enlace$y – texto del enlace $3 – Especificación de materiales $3 – Especificación de materiales

Page 16: Tema 5; XML en la descripción de recursos

Adaptar MARC a Internet: primeras iniciativasAdaptar MARC a Internet: primeras iniciativas

Una segunda iniciativa de la LOC consistió en Una segunda iniciativa de la LOC consistió en adaptar MARC a SGML, iniciada en 1995adaptar MARC a SGML, iniciada en 1995

El objetivo era crear una DTD que permitiese la El objetivo era crear una DTD que permitiese la conversión de registros MARC a SGML – y conversión de registros MARC a SGML – y viceversa -, sin pérdida de informaciónviceversa -, sin pérdida de información

Se diseñaron 2 DTDs, para datos bibliográficos / Se diseñaron 2 DTDs, para datos bibliográficos / fondos y para autoridades / clasificación y una fondos y para autoridades / clasificación y una aplicación PERL para la conversión de MARC 2709 aplicación PERL para la conversión de MARC 2709 a MARC SGML y viceversaa MARC SGML y viceversa

Las DTD se publicaron en mayo 1996. La utilidad Las DTD se publicaron en mayo 1996. La utilidad de conversión se inició en julio 1997. En enerp de conversión se inició en julio 1997. En enerp 1998 se hizo pública.1998 se hizo pública.

Posteriormente, estas DTDs se migraron a XML Posteriormente, estas DTDs se migraron a XML para adaptarlas al “nuevo escenario tecnológico”para adaptarlas al “nuevo escenario tecnológico”

Page 17: Tema 5; XML en la descripción de recursos

Adaptar MARC a Internet: primeras iniciativasAdaptar MARC a Internet: primeras iniciativas

El programa de conversión de MARC a SGML/XML El programa de conversión de MARC a SGML/XML utiliza PERL y nsgmlsutiliza PERL y nsgmls

Estas utilidades de libre distribución se pueden Estas utilidades de libre distribución se pueden descargar de:descargar de:• http://www.perl.comhttp://www.perl.com• http://www.jclark.com/sphttp://www.jclark.com/sp

En el diseño de las DTD y utilidades de En el diseño de las DTD y utilidades de conversión participaron las empresasa Mulberry conversión participaron las empresasa Mulberry Technologies y ATLIS Consulting GroupTechnologies y ATLIS Consulting Group

Page 18: Tema 5; XML en la descripción de recursos

Adaptar MARC a Internet: primeras iniciativasAdaptar MARC a Internet: primeras iniciativas

Las DTD para XML y SGML contenían un elemento XML para Las DTD para XML y SGML contenían un elemento XML para cada campo y subcampo de MARCcada campo y subcampo de MARC

Por ejemplo, para el elemento 245 MARC, en la DTD se Por ejemplo, para el elemento 245 MARC, en la DTD se incluía un elemento mrcb245, un mrcb245-b, mrcb245-c, incluía un elemento mrcb245, un mrcb245-b, mrcb245-c, etc. etc.

Estos campos se agrupaban en otros elementos, como por Estos campos se agrupaban en otros elementos, como por ejemplo mrcb-title-and-title-related, mrcb-subject-access, ejemplo mrcb-title-and-title-related, mrcb-subject-access, etc.etc.

Los campos de control variables – 008 – contaban con un Los campos de control variables – 008 – contaban con un elemento para cada “posición” o “ítem” del que contienen elemento para cada “posición” o “ítem” del que contienen información, etc...información, etc...

Esto hacía que la DTD y los registros fuesen muy largosEsto hacía que la DTD y los registros fuesen muy largos PRACTICA: Abrir con XML Spy el archivo PRACTICA: Abrir con XML Spy el archivo mrcbxmlfilemrcbxmlfile

Page 19: Tema 5; XML en la descripción de recursos

Adaptar MARC a Internet: estado actualAdaptar MARC a Internet: estado actual

El 5 de junio 2002, la LOC Network Development El 5 de junio 2002, la LOC Network Development and MARC Standards Office publicó un esquema and MARC Standards Office publicó un esquema XML para codificar registros MARC21XML para codificar registros MARC21

Este esquema, resultado del trabajo de la LOC, Este esquema, resultado del trabajo de la LOC, OCLC, RLG - y revisado por la NLM y la National OCLC, RLG - y revisado por la NLM y la National Library of Canada – sustituía a la iniciativa Library of Canada – sustituía a la iniciativa anterior derivada de la DTD SGMLanterior derivada de la DTD SGML

Este esquema está previsto que sirva para Este esquema está previsto que sirva para codificar cualquier tipo de registro MARC codificar cualquier tipo de registro MARC (bibliográfico, autoridades, etc.)(bibliográfico, autoridades, etc.)

Page 20: Tema 5; XML en la descripción de recursos

Adaptar MARC a Internet: estado actualAdaptar MARC a Internet: estado actual

El nuevo esquema pretende ir más allá de un El nuevo esquema pretende ir más allá de un mero mecanismo de conversión, y así facilitar:mero mecanismo de conversión, y así facilitar:

• La representación de registros MARC existentes en La representación de registros MARC existentes en formato XMLformato XML

• La representación de metadatos para facilitar el La representación de metadatos para facilitar el harvesting del proyecto OAI (Open Archives Initiative)harvesting del proyecto OAI (Open Archives Initiative)

• La descripción inicial de recursos utilizando MARCLa descripción inicial de recursos utilizando MARC

• La codificación de metadatos MARC que puedan ser La codificación de metadatos MARC que puedan ser “incluidos” como parte o junto a recursos de información “incluidos” como parte o junto a recursos de información disponibles en formato electrónicodisponibles en formato electrónico

Page 21: Tema 5; XML en la descripción de recursos

Adaptar MARC a Internet: estado actualAdaptar MARC a Internet: estado actual

El elemento raíz es El elemento raíz es collectioncollection, que tendrá un elemento , que tendrá un elemento recordrecord para cada registro para cada registro

El elemento record contendrá:El elemento record contendrá:

• un elemento no vacío un elemento no vacío leaderleader para la cabecera, para la cabecera,

• Elementos no vacíos Elementos no vacíos controlfieldcontrolfield para cada campo de control y para cada campo de control y

• Elementos no vacíos Elementos no vacíos datafielddatafield para cada campo de datos para cada campo de datos

La cabecera se indica en un elemento La cabecera se indica en un elemento leaderleader

Los campos de control se indican con elementos Los campos de control se indican con elementos controlfieldcontrolfield. .

Cada campo de control tendrá un atributo Cada campo de control tendrá un atributo tagtag que recogerá que recogerá su código (éste se indica mediante 3 dígitos). Entre sus su código (éste se indica mediante 3 dígitos). Entre sus etiquetas de inicio y de fin se escribirá su valoretiquetas de inicio y de fin se escribirá su valor

Page 22: Tema 5; XML en la descripción de recursos

Adaptar MARC a Internet: estado actualAdaptar MARC a Internet: estado actual

Los campos se representan mediante elementos Los campos se representan mediante elementos datafielddatafield

La etiqueta (nombre del campo) y los indicadores se La etiqueta (nombre del campo) y los indicadores se escriben como valores de los atributos escriben como valores de los atributos tagtag, , ind1ind1 y y ind2ind2 del del elemento elemento datafielddatafield

Los subcampos se tratan como elementos hijos – Los subcampos se tratan como elementos hijos – subfieldsubfield - - del elemento del elemento datafielddatafield correspondiente al campo. correspondiente al campo.

El código del subcampo se escriben como valor del El código del subcampo se escriben como valor del atributos atributos codecode

El valor del subcampo se escribe entre las etiquetas de El valor del subcampo se escribe entre las etiquetas de inicio y fin del elemento inicio y fin del elemento subfieldsubfield

PRACTICA: Abrir el documento de ejemplo PRACTICA: Abrir el documento de ejemplo sandburg.xml para ver un ejemplosandburg.xml para ver un ejemplo

Page 23: Tema 5; XML en la descripción de recursos

Adaptar MARC a Internet: estado actualAdaptar MARC a Internet: estado actual

La información que encontramos en MARC 2709 La información que encontramos en MARC 2709 sobre longitud de campos y las posiciones de sobre longitud de campos y las posiciones de inicio del campo (el directorio) no se utilizan en el inicio del campo (el directorio) no se utilizan en el esquema xmlesquema xml

Las posiciones de la cabecera del registro que no Las posiciones de la cabecera del registro que no son necesarias se mantienen, pero se dejan en son necesarias se mantienen, pero se dejan en blancoblanco

Se trata de un esquema más fácilmente Se trata de un esquema más fácilmente procesable y comprensible que la DTD anteriorprocesable y comprensible que la DTD anterior

Page 24: Tema 5; XML en la descripción de recursos

El esquema XML forma parte de una iniciativa El esquema XML forma parte de una iniciativa mayor – framework -, que incluye el desarrollo de mayor – framework -, que incluye el desarrollo de distintas “aplicaciones”, utilidades e interfaces distintas “aplicaciones”, utilidades e interfaces para permitir:para permitir:

• Transformaciones entre MARC (2709), MARC (xml) Transformaciones entre MARC (2709), MARC (xml) Dublin Core y MODS (Metadata Object Description Dublin Core y MODS (Metadata Object Description Schema) forman parte de la iniciativaSchema) forman parte de la iniciativa

• Hojas de estilo para la presentación de la información Hojas de estilo para la presentación de la información XML como HTMLXML como HTML

Adaptar MARC a Internet: estado actualAdaptar MARC a Internet: estado actual

Page 25: Tema 5; XML en la descripción de recursos

En el modelo propuesto se habla del esquema xml como En el modelo propuesto se habla del esquema xml como “piedra angular” para representar los datos de una forma “piedra angular” para representar los datos de una forma que sea fácilmente procesable por distintas aplicaciones que sea fácilmente procesable por distintas aplicaciones “consumidoras” – xml consumers“consumidoras” – xml consumers

Los XML consumers procesan los documentos xml Los XML consumers procesan los documentos xml codificados con el esquema anterior. Los “consumidores” codificados con el esquema anterior. Los “consumidores” incluyen distintos tipos de utilidades:incluyen distintos tipos de utilidades:

• Transformación de MARC xml a otros formatos de Transformación de MARC xml a otros formatos de metadatosmetadatos

• Presentación de registros MARC xml en un formato Presentación de registros MARC xml en un formato fácilmente legible (html, pdf, etc.)fácilmente legible (html, pdf, etc.)

• Validación de documentos, extracción de datos, etc.Validación de documentos, extracción de datos, etc.

Adaptar MARC a Internet: estado actualAdaptar MARC a Internet: estado actual

Page 26: Tema 5; XML en la descripción de recursos

Adaptar MARC a Internet: estado actualAdaptar MARC a Internet: estado actual

Page 27: Tema 5; XML en la descripción de recursos

Entre las utilidades que se han diseñado a partir del Entre las utilidades que se han diseñado a partir del esquema anterior, contamos con las siguientes:esquema anterior, contamos con las siguientes:

• MARC4J – conversión de MARC 2709 a xmlMARC4J – conversión de MARC 2709 a xml

• Hojas de estilo XSLT para convertir de MARC XML a Hojas de estilo XSLT para convertir de MARC XML a MODS, Dublin Core y OAI MARC (Open Archives MODS, Dublin Core y OAI MARC (Open Archives Initiative)Initiative)

• Hojas de estilo XSLT para presentar datos MARC en Hojas de estilo XSLT para presentar datos MARC en HTMLHTML

Adaptar MARC a Internet: estado actualAdaptar MARC a Internet: estado actual

Page 28: Tema 5; XML en la descripción de recursos

MARCXML – Prácticas codificaciónMARCXML – Prácticas codificación

Utilizando el esquema MARCXMLSlim.xsd y XML Spy, codifica el Utilizando el esquema MARCXMLSlim.xsd y XML Spy, codifica el siguiente registro MARC:siguiente registro MARC:

Page 29: Tema 5; XML en la descripción de recursos

MARCXML – Prácticas codificaciónMARCXML – Prácticas codificación

Utilizando el esquema MARCXMLSlim.xsd y XML Spy, codifica el Utilizando el esquema MARCXMLSlim.xsd y XML Spy, codifica el siguiente registro MARC:siguiente registro MARC:

Page 30: Tema 5; XML en la descripción de recursos

MARCXML – Prácticas codificaciónMARCXML – Prácticas codificación

Utilizando las utilidades de conversión, crea el registro COLLECTION.xml a Utilizando las utilidades de conversión, crea el registro COLLECTION.xml a formato MODS, y a las presentaciones HTML con etiquetas numéricas y con formato MODS, y a las presentaciones HTML con etiquetas numéricas y con textos en inglés.textos en inglés.

Page 31: Tema 5; XML en la descripción de recursos

XMLMARC – Stanford UniversityXMLMARC – Stanford University

XMLMARC es una iniciativa dirigida por Lane Medical Library XMLMARC es una iniciativa dirigida por Lane Medical Library en la Universidad de Stanford, en el ámbito de las bibliotecas en la Universidad de Stanford, en el ámbito de las bibliotecas digitalesdigitales

La motivación: analizar la viabilidad de adaptar MARC a XML La motivación: analizar la viabilidad de adaptar MARC a XML para facilitar la integración de distintas fuentes de para facilitar la integración de distintas fuentes de información y descripciones de recursosinformación y descripciones de recursos

En diciembre 1999 publicaron una utilidad Java que convertía En diciembre 1999 publicaron una utilidad Java que convertía registros MARC 2709 a formato XML, de libre utilización.registros MARC 2709 a formato XML, de libre utilización.

El proyecto diseñó una DTD para codificar datos El proyecto diseñó una DTD para codificar datos bibliográficos y de autoridadesbibliográficos y de autoridades

Como parte del proyecto se convirtieron 250.000 registros Como parte del proyecto se convirtieron 250.000 registros MARC a XMLMARC a XML

http://xmlmarc.stanford.eduhttp://xmlmarc.stanford.edu

Page 32: Tema 5; XML en la descripción de recursos

XMLMARC – Stanford UniversityXMLMARC – Stanford University

El proyecto XMLMARC de Stanford sigue vivoEl proyecto XMLMARC de Stanford sigue vivo

Próximamente se presentará XOBIS v1.0a Próximamente se presentará XOBIS v1.0a ((XML Organic XML Organic Bibliographic Information Schema ) , un esquema XML para Bibliographic Information Schema ) , un esquema XML para codificar datos bibliográficos que reemplazará al XMLMARC codificar datos bibliográficos que reemplazará al XMLMARC anteriormente usado en este proyectoanteriormente usado en este proyecto

Se puede obtener información detallada de este formato Se puede obtener información detallada de este formato en: en: httphttp://://xobis.stanford.eduxobis.stanford.edu . Un ejemplo de documento . Un ejemplo de documento XML codificado según este esquema se encuentra en el XML codificado según este esquema se encuentra en el archivo lanerecords.xmlarchivo lanerecords.xml

Page 33: Tema 5; XML en la descripción de recursos

XMLMARC – Stanford UniversityXMLMARC – Stanford University

La estructura de un registro La estructura de un registro XOBIS sigue el siguiente XOBIS sigue el siguiente modelo:modelo:

ControlDataControlData – metadatos – metadatos acerca del registro acerca del registro propiamente dicho: fecha propiamente dicho: fecha creación, tipo, etc. creación, tipo, etc.

Principal elements o Principal elements o WorkWork element element

RelationshipsRelationships

Page 34: Tema 5; XML en la descripción de recursos

BiblioMLBiblioML Este es otro proyecto que muestra el interés despertado Este es otro proyecto que muestra el interés despertado

por el lenguaje XML como mecanismo para codificar por el lenguaje XML como mecanismo para codificar información bibliográfica y de autoridades UNIMARCinformación bibliográfica y de autoridades UNIMARC

El proyecto subvencionado por el El proyecto subvencionado por el Ministère de la culture Ministère de la culture et de la communication, France, aparentemente está et de la communication, France, aparentemente está detenidodetenido

http://www.culture.fr/BiblioML/en/index.htmlhttp://www.culture.fr/BiblioML/en/index.html

Page 35: Tema 5; XML en la descripción de recursos

MODS (Metadata Object Description Schema)MODS (Metadata Object Description Schema)

Se trata de un proyecto reciente, liderado por la LOC Se trata de un proyecto reciente, liderado por la LOC americanaamericana

Consiste en un esquema para codificar metadatos e Consiste en un esquema para codificar metadatos e información bibliográfica utilizando XMLinformación bibliográfica utilizando XML

Se utilizan etiquetas alfanuméricas en lugar de numéricas, Se utilizan etiquetas alfanuméricas en lugar de numéricas, y en ciertos casos se agrupan elementos de MARC en un y en ciertos casos se agrupan elementos de MARC en un mismo elementomismo elemento

De su mantenimiento se encarga la LOC NDMSODe su mantenimiento se encarga la LOC NDMSO

Última versión disponible: 14 junio de 2002 – v1.2. Estable Última versión disponible: 14 junio de 2002 – v1.2. Estable por un periodo de 6 mesespor un periodo de 6 meses

http://www.loc.gov/standards/modshttp://www.loc.gov/standards/mods

Page 36: Tema 5; XML en la descripción de recursos

MODS (Metadata Object Description Schema)MODS (Metadata Object Description Schema)

MODS no nos indica cómo transferir registros MARC MODS no nos indica cómo transferir registros MARC utilizando XML, sino que ofrece un mecanismo que permite utilizando XML, sino que ofrece un mecanismo que permite describir recursos con XML utilizando un esquema que se describir recursos con XML utilizando un esquema que se sitúa a medio camino entre MARC y Dublin Coresitúa a medio camino entre MARC y Dublin Core

Aparentemente, MODS es la opción que debería imponerse Aparentemente, MODS es la opción que debería imponerse como sistema para la descripción de recursos en Internetcomo sistema para la descripción de recursos en Internet

• Es más sofisticado que DCEs más sofisticado que DC

• No es tan complejo como MARCNo es tan complejo como MARC

• Es más compatible con MARC que otros esquemas (la Es más compatible con MARC que otros esquemas (la pérdida de información en las transformaciones en pérdida de información en las transformaciones en menor)menor)

Page 37: Tema 5; XML en la descripción de recursos

MODS (Metadata Object Description Schema)MODS (Metadata Object Description Schema)

MODS define un conjunto de elementos que son un MODS define un conjunto de elementos que son un subconjunto del MARC21 Format for Bibliographic Datasubconjunto del MARC21 Format for Bibliographic Data

En total se definen 20 elementos (cada uno de ellos con En total se definen 20 elementos (cada uno de ellos con unos elementos hijos que matizan su semántica)unos elementos hijos que matizan su semántica)

Todos los elementos, excepto dos, y atributos son Todos los elementos, excepto dos, y atributos son opcionalesopcionales

La LOC ha establecido un “mapeo” entre los elementos La LOC ha establecido un “mapeo” entre los elementos MODS y los campos y subcampos de MARCMODS y los campos y subcampos de MARC

Práctica: abrir el archivo mods99042030Book.xml y ver su Práctica: abrir el archivo mods99042030Book.xml y ver su estructura. estructura.

La conversión entre MARC 2709 y MODS siempre se hará La conversión entre MARC 2709 y MODS siempre se hará mediante MARC XML; nunca directamente.mediante MARC XML; nunca directamente.

Page 38: Tema 5; XML en la descripción de recursos

MODS (Metadata Object Description Schema)MODS (Metadata Object Description Schema)

Los principales elementos en MODS son:Los principales elementos en MODS son:

• titleInfotitleInfo – es obligatorio. Contiene al menos un – es obligatorio. Contiene al menos un elemento hijo llamado elemento hijo llamado titletitle

• namename – correspondería al “encabezamiento”. Puede ser – correspondería al “encabezamiento”. Puede ser de persona, organización o conferencia.de persona, organización o conferencia.El tipo de encabezamiento se indica mediante un El tipo de encabezamiento se indica mediante un atributo atributo typetype que aceptará los valores que aceptará los valores personalpersonal, , corporatecorporate o o conferenceconference

namename puede incluir los elementos hijos: puede incluir los elementos hijos: namePartnamePart, , rolerole, , affiliationaffiliation y y displayFormdisplayForm

• typeOfResourcetypeOfResource – tipo del recurso – tipo del recurso

Page 39: Tema 5; XML en la descripción de recursos

MODS (Metadata Object Description Schema)MODS (Metadata Object Description Schema)

• genregenre – género. No tiene elementos hijos. Sólo tiene un – género. No tiene elementos hijos. Sólo tiene un atributo atributo authorityauthority que tomará el valor que tomará el valor marcmarc. Su valor . Su valor se tomará de la lista disponible en la URL:se tomará de la lista disponible en la URL:http://www.loc.gov/marc/sourcecode/genre/http://www.loc.gov/marc/sourcecode/genre/

• publicationInfopublicationInfo – agrupa los datos sobre el “editor”, – agrupa los datos sobre el “editor”, mediante los elementos hijos placeCode, place, mediante los elementos hijos placeCode, place, publisher, dateIssued, dateCreated, edition, etc.publisher, dateIssued, dateCreated, edition, etc.

• languagelanguage – idioma del recurso – idioma del recurso

• physicalDescriptionphysicalDescription – descripción física del recurso. – descripción física del recurso. Incluye los elementos hijos: form, extent, digitalOrigin, Incluye los elementos hijos: form, extent, digitalOrigin, etc.etc.

• abstract abstract – resumen; puede apuntar a un recurso – resumen; puede apuntar a un recurso remotoremoto

Page 40: Tema 5; XML en la descripción de recursos

MODS (Metadata Object Description Schema)MODS (Metadata Object Description Schema)

• tableOfContentstableOfContents – incluirá una URL que apunta a un – incluirá una URL que apunta a un recurso remoto con esta informaciónrecurso remoto con esta información

• targetAudience targetAudience – audiencia a la que va dirigida el – audiencia a la que va dirigida el contenidocontenido

• note note – para codificar notas. Puede apuntar a una nota – para codificar notas. Puede apuntar a una nota disponible como un recurso externo mediante un disponible como un recurso externo mediante un hipervínculohipervínculo

• cartographics cartographics – para información cartográfica, – para información cartográfica, contiene los elementos hijos coordenadas, escala y contiene los elementos hijos coordenadas, escala y proyecciónproyección

• subjectsubject – temas de los que trata el recurso. Incluye los – temas de los que trata el recurso. Incluye los elementos hijos topic, geographic y temporal.elementos hijos topic, geographic y temporal.

Page 41: Tema 5; XML en la descripción de recursos

MODS (Metadata Object Description Schema)MODS (Metadata Object Description Schema)

• Classification – Classification – código de clasificación según un código de clasificación según un esquema de clasificación que se indicará en el atributo esquema de clasificación que se indicará en el atributo authority authority de este elementode este elemento

• relatedItem relatedItem – permite relacionar elementos– permite relacionar elementos

• IdentifierIdentifier – ID del recurso. Puede ser un isbn, issn, etc. – ID del recurso. Puede ser un isbn, issn, etc. Su tipo se indicará mediante un atributo Su tipo se indicará mediante un atributo typetype

• Location – Location –

• accessConditions – accessConditions –

• ExtensionExtension

• recordInfo – recordInfo – contiene los siguientes elementos hijos: contiene los siguientes elementos hijos: recordCreationDate, recordChangeDate, recordIdentifier, recordCreationDate, recordChangeDate, recordIdentifier, etc.etc.

Page 42: Tema 5; XML en la descripción de recursos

ConclusionesConclusiones

• En los últimos 10 años se han lanzado distintas En los últimos 10 años se han lanzado distintas iniciativas para complementar / sustituir MARC iniciativas para complementar / sustituir MARC con XMLcon XML

• El último modelo propuesto por la LOC parece más El último modelo propuesto por la LOC parece más fiable, y probablemente tenga una mayor fiable, y probablemente tenga una mayor aceptación que la iniciativa de 1995aceptación que la iniciativa de 1995

• MODS ofrece un esquema más completo que DC y MODS ofrece un esquema más completo que DC y más próximo a MARCmás próximo a MARC

• El hecho de estar promovido por la LOC puede ser El hecho de estar promovido por la LOC puede ser un punto importante, aunque la experiencia de un punto importante, aunque la experiencia de MARC SGML puede repetirseMARC SGML puede repetirse

• Actualmente, falta una documentación detallada Actualmente, falta una documentación detallada sobre cómo usar este nuevo esquema, para que sobre cómo usar este nuevo esquema, para que pueda considerarse una alternativa real a DCpueda considerarse una alternativa real a DC