Pautas digitalizacion

121
1 DIRECTRICES PARA PROYECTOS DE DIGITALIZACIÓN de colecciones y fondos de dominio publico, en particular para aquellos custodiados en bibliotecas y archivos Marzo de 2002 Estas directrices son el resultado del trabajo de un grupo de expertos de IFLA e ICA (International Council on Archives) invitados a elaborarlas por la UNESCO Los miembros del grupo de trabajo fueron: . John MacIlwaine (IFLA, Presidente) . Jean-Marc Comment (ICA) . Clemens de Wolf (IFLA) . Dale Peters (IFLA) . Borje Justrell (ICA) . John MacIlwaine (IFLA) . Marie-Thérèse Varlamoff (IFLA) . Sjoerd Koopman (IFLA, Secretario) Traducidas por el grupo de trabajo de colecciones digitales de las Comunidades Autónomas y el Ministerio de Cultura: . Ana Isabel Cámara (Asturias) . Alejandro Carrión (Castilla y León) . Laura Cerezo (Andalucía) . Jaime Chiner (Valencia) . Belén Díaz (Extremadura) . Elena García-Puente (Ministerio de Cultura) . Juan Francisco Elizari (Navarra) . José Luis González (Xunta de Galicia) . Carmen Jiménez Martínez (La Rioja) . María Luisa Martínez-Conde (Ministerio de Cultura) . Ángel Peñalver (Murcia) . Elvira Permanyer (Cataluña) . María de la Villa (Madrid)

description

 

Transcript of Pautas digitalizacion

  • 1. DIRECTRICES PARA PROYECTOS DE DIGITALIZACIN de colecciones y fondosde dominio publico, en particular para aquellos custodiados en bibliotecas yarchivos Marzo de 2002Estas directrices son el resultado del trabajo de un grupo de expertos de IFLA e ICA(International Council on Archives) invitados a elaborarlas por la UNESCOLos miembros del grupo de trabajo fueron:. John MacIlwaine (IFLA, Presidente). Jean-Marc Comment (ICA). Clemens de Wolf (IFLA). Dale Peters (IFLA). Borje Justrell (ICA). John MacIlwaine (IFLA). Marie-Thrse Varlamoff (IFLA). Sjoerd Koopman (IFLA, Secretario)Traducidas por el grupo de trabajo de colecciones digitales de las ComunidadesAutnomas y el Ministerio de Cultura:. Ana Isabel Cmara (Asturias). Alejandro Carrin (Castilla y Len). Laura Cerezo (Andaluca). Jaime Chiner (Valencia). Beln Daz (Extremadura). Elena Garca-Puente (Ministerio de Cultura). Juan Francisco Elizari (Navarra). Jos Luis Gonzlez (Xunta de Galicia). Carmen Jimnez Martnez (La Rioja). Mara Luisa Martnez -Conde (Ministerio de Cultura). ngel Pealver (Murcia). Elvira Permanyer (Catalua). Mara de la Villa (Madrid) 1
  • 2. DIRECTRICES PARA PROYECTOS DE DIGITALIZACIN de colecciones y fondosde dominio publico, en particular para aquellos custodiados en bibliotecas yarchivosTabla de contenidosPrlogoINTRODUCCIN1. SELECCIN 1.1 Principales razones para la digitalizacin 1.1.1 Para mejorar el acceso 1.1.2 Para facilitar nuevas formas de acceso y uso 1.1.3 Para la preservacin 1.2 Criterios de seleccin 1.2.1 Contenido 1.2.2 Demanda 1.2.3 Estado fsico2. REQUISITOS TCNICOS E IMPLEMENTACIN 2.1 Conversin 2.1.1 Los atributos de los documentos 2.1.2 Calidad de la imagen 2.1.2.1 Resolucin 2.1.2.2 Profundidad del bit 2.1.2.3 Procesos de optimizacin de la imagen 2.1.2.4 Compresin 2.1.2.5 El equipo utilizado y su funcionamiento 2.1.2.6 Criterio y cuidado del tcnico 2.2 Control de calidad 2.2.1 Principios bsicos de un programa de control de calidad 2.2.1.1 Objetivo 2.2.1.2 Mtodos 2.2.2 Control de calidad del escner 2.2.2.1 Resolucin espacial 2.2.2.2 Reproduccin tonal 2.2.2.3 Reproduccin del color 2.2.2.4 Ruido 2.2.2.5 Objetos 2
  • 3. 2.2.3 Control de calidad del monitor 2.2.3.1 Condiciones de visualizacin2.3 Gestin de la coleccin2.3.1 Organizacin de las imgenes2.3.2 Nombres de las imgenes2.3.3 Descripcin de las imgenes2.3.4 Uso de los metadatos2.3.4.1 Tcnicas de gestin de datos2.3.4.2 Codificacin del documento3. ASPECTOS LEGALES 3.1 Derechos de autor 3.2 Autenticidad 3.3 Gestin de la propiedad intelectual 3.4 Depsito legal4. PRESUPUESTO 4.1 Recuperacin de los costes 4.2 reas de gasto 4.2.1 Formacin del personal 4.2.2 Gestin de las instalaciones 4.2.3 Gastos operativos 4.2.3.1 Seleccin y preparacin de los materiales originales para la digitalizacin 4.2.3.2 Conversin digital 4.2.3.3 Captura de los metadatos 4.2.3.4 Gestin de los datos 4.2.4 Gestin de almacenamiento y sistemas de entrega5. PLANIFICACIN DE LOS RECURSOS HUMANOS 5.1 Gestin del cambio 5.2 Formacin de la capacidad 5.3 El compromiso social 3
  • 4. 6. DESARROLLO Y MANTENIMIENTO DE LAS INTERFACES WEB 6.1 Desarrollo del contenido digital 6.2 Formacin de un equipo web 6.3 Produccin y gestin de la web 6.3.1 Directrices para la produccin de la web 6.3.1.1 Estructura de los ficheros y carpetas 6.3.1.2 Convenciones para nombrar ficheros 6.3.1.3 Disposicin y diseo de la pgina 6.3.1.4 Grficos adaptados a la web 6.3.1.5 Requisitos mnimos 6.3.1.6 Mantenimiento de la web 6.4 Introduccin de servicios basados en la web 6.4.1 Indizacin del contenido digital 6.4.2 Gestin del acceso 7. PRESERVACIN DEL CONTENIDO DIGITAL 7.1 Retos de la preservacin 7.1.1 Apoyo tcnico 7.1.2 Obsolescencia tecnolgica 7.2 Desarrollo de la poltica desde el punto de vista de la captura 7.3 Normativa internacional 7.4 Modelos no propietarios 7.5 Gestin de un fichero consolidado 7.6 Repositorio digital fiable8. GESTIN DEL PROYECTO8.1 Redaccin de la propuesta8.1.1 Introduccin8.1.2 Visin y misin8.1.3 Evaluacin de las necesidades8.1.4 Actividades8.1.5 Indicadores de rendimiento8.1.6 Personal responsable8.1.7 Calendario 4
  • 5. 8.2 Estimacin de costes8.2.1 Costes operativos8.2.2 Costes organizativos8.2.3 Costes de personal8.3 Gestin del ciclo de digitalizacin8.3.1 Material original8.3.2 Gestin de datos8.3.3 Estndares para las imgenes8.3.4 Alcance de los metadatos8.3.5 Sistemas de presentacin8.4 Gestin de los flujos de actividadAPNDICES A. Bibliografa B. Organizaciones significativas relacionadas con la normativa y las buenas prcticas C. Glosario de trminos y abreviaturasAPNDICES A LA TRADUCCIN ESPAOLA A. Borrador de pliego de prescripciones tcnicas para la digitalizacin de colecciones de patrimonio bibliogrfico B. Borrador de pliego de prescripciones tcnicas para la digitalizacin de prensa histrica C. Borrador de pliego de prescripciones tcnicas para la digitalizacin de prensa moderna D. Ejemplos de proyectos digitales existentes en EspaaPRLOGOEstas pautas han sido elaboradas por un grupo de trabajo que representa a IFLA e ICAal que la UNESCO encarg establecer unas directrices para programas de digitalizacinde colecciones y fondos de dominio pblico. El contrato especificaba que las directricesdeberan ser, en la medida de lo posible, especialmente aplicables por las instituciones 5
  • 6. de los pases en vas de desarrollo. Los miembros del grupo fueron designados porIFLA e ICA y sus actividades fueron coordinadas por Sjoerd Koopman, Coordinador deActividades Profesionales de IFLA.El grupo fue consciente desde el principio de que ya existen muchas publicaciones ysitios web que ofrecen informacin y recomendaciones en el campo de la digitalizacin.Los han producido instituciones pblicas y privadas o de forma cooperativa, bibliotecas,archivos, organismos de normalizacin, fabricantes comerciales, etc. Algunos son decarcter general en cuanto a sus objetivos, otros consisten bsicamente en una relacinde las decisiones tomadas por una institucin determinada as como de los programasseguidos por dicha institucin. Son pocos los que han surgido en los pases en vas dedesarrollo, o los que prestan mayor atencin a las cuestiones especficas de dichospases.La lgica seguida por el grupo de trabajo fue la de no duplicar los textos existentes, sinoms bien ofrecer una sntesis de la informacin disponible, basndose tanto en lasfuentes publicadas como en las actuaciones de proyectos especficos, avalados por laexperiencia personal de los miembros del grupo por su implicacin en dichos deproyectos. Se trata de un resumen de los mejores conocimientos y prcticas existentesa nivel internacional.Por lo tanto, estas directrices identifican y discuten las cuestiones clave relativas a laconceptualizacin, planificacin e implementacin de un proyecto de digitalizacin, conrecomendaciones de buenas prcticas que deben seguirse en cada una de las etapasdel proceso. Se ha hecho un esfuerzo especial para tomar en consideracin lascircunstancias especficas de los pases en vas de desarrollo. Cada una de las ochosecciones comprende una introduccin que presenta el contexto e identifica lascuestiones relevantes, seguido de un texto que discute con ms detalle las cuestiones yactuaciones que deben llevarse a cabo y termina con una o ms secciones de texto enun recuadro que incluye un resumen de las principales recomendaciones. Como seindica en la introduccin, su alcance solo se refiere al patrimonio documental basado enpapel, esto es, manuscritos, libros impresos y fotografas. No incluye las cuestionesespeciales relativas a los registros sonoros o pelculas, que se tratarn en otro conjuntode directrices patrocinadas por el Programa Memoria del Mundo de la UNESCO.Desde luego el grupo reconoce que es posible que ningn conjunto nico derecomendaciones sea capaz de satisfacer plenamente las necesidades y circunstanciasespecficas de cada institucin. Es tambin muy consciente de que se trata de uncampo que cambia muy rpidamente por los nuevos desarrollos que experimentanconstantemente las tecnologas correspondientes y por la consiguiente respuesta de losprofesionales a dichos desarrollos. Por consiguiente, el grupo espera que estasdirectrices no se consideren simplemente como un compartimento estanco sino querepresentan una pasarela a informacin complementaria. En cada seccin seproporcionan extensas listas de referencias que se consolidan en una lista ms ampliaen los Apndices, junto con URLs de listas de discusin abiertas y otras fuentes deinformacin actualizada. Hay tambin URLs de instituciones relevantes en los campos 6
  • 7. de las bibliotecas, los archivos, de las comunicaciones y de la normalizacin y deproyectos actuales de digitalizacin.Los miembros del grupo de trabajo fueron:Jean-Marc CommentClemente de WolfDale PetersBorje JustrellJohn McIlwaineMarie-Thrse VarlamoffJohn McIlwaine, Presidente, marzo de 2002 7
  • 8. INTRODUCCINLa tecnologa digital abre una perspectiva totalmente nueva. La www mantiene millonesde sitios web e Internet es el lugar de mercado para la investigacin, la enseanza, laexpresin, la publicacin y la comunicacin de la informacin. Las bibliotecas y losarchivos son proveedores de informacin primaria para la sociedad y fueron usuarios dela nueva tecnologa digital primero en relacin con la catalogacin y la gestin de losprocesos, y ms tarde para proporcionar informacin sobre sus colecciones a lacomunidad de la www. Adems de preservar y proporcionar acceso al material nacidodigital, en la actualidad un gran nmero de archivos y bibliotecas han iniciado tambinla creacin de copias digitales de sus recursos ya existentes. Para dichas bibliotecas yarchivos se han redactado estas directricesDefinicinEstas son Directrices para emprender proyectos de digitalizacin de colecciones yfondos de dominio pblico, en particular para aquellas colecciones custodiadas enbibliotecas y archivos. Tratan del patrimonio documental en papel, manuscritos, librosimpresos y fotografas, y no de registros sonoros ni de pelculas, objetos omonumentos. Hacen referencia a la planificacin y establecimiento de proyectos, esdecir, a la seleccin, gestin y procesos de produccin implicados en dichos proyectosen actividades bien definidas, financiadas independientemente y que se llevan a cabonormalmente a corto plazo, y no a programas que forman parte de la misin oestrategia de una institucin.Por qu unas directrices? Muchas bibliotecas y archivos desearan planificar proyectos de digitalizacin pero carecen de experiencia. Es necesaria una gua prctica como herramienta de trabajo para la planificacin de proyectos de digitalizacin. Esta necesidad es particularmente importante en los pases en vas de desarrolloUNESCOEstas Directrices se enmarcan en de la estrategia de la UNESCO del conocimiento paratodos. Tambin tienen una estrecha relacin con el Programa Memoria del Mundo dela UNESCO cuyo objetivo es la salvaguarda del patrimonio documental internacional, elacceso democrtico a dicho patrimonio, el conocimiento creciente de su significado y lanecesidad de preservarlo. 8
  • 9. Pblico objetivoEstas Directrices se dirigen a quienes toman decisiones, a los gestores de bibliotecas yarchivos, conservadores y personal tcnico, en particular a aquellos de las institucionesde los pases en vas de desarrollo.Por qu digitalizar?La razn de la implementacin de un proyecto de digitalizacin, o ms exactamente dela conversin digital de documentos originales no digitales son variadas y puedensolaparse. La decisin de digitalizar puede tomarse con objeto de: Incrementar el acceso: esta es razn principal y la ms obvia, cuando se sabe que hay una alta demanda por parte de los usuarios y la biblioteca o el archivo desean mejorar el acceso a una determinada coleccin Mejorar los servicios para un grupo creciente de usuarios proporcionando un acceso de mayor calidad a los recursos de la institucin en relacin con la educacin y la formacin continua Reducir la manipulacin y el uso de materiales originales frgiles o utilizados intensivamente y crear una copia de seguridad para el material deteriorado como libros o documentos quebradizos Ofrecer a la institucin oportunidades para el desarrollo de su infraestructura tcnica y para la formacin tcnica de su personal Impulsar el desarrollo de recursos cooperativos, compartiendo intereses comunes con otras instituciones para crear colecciones virtuales e incrementar el acceso a nivel internacional Buscar intereses comunes con otras instituciones para rentabilizar las ventajas econmicas de un enfoque compartido. Aprovechar las oportunidades financieras, como, por ejemplo, la posibilidad de asegurar una inversin para implementar un programa, o un proyecto concreto capaz de generar un beneficio significativo.Debe estar claro por qu se embarca uno en un proyecto de digitalizacin: el objetivodeterminar el proceso y los costes. Puesto que la digitalizacin supone un trabajointenso y caro (vase el captulo 4) es importante capturar una imagen de modo quesea posible utilizarla para satisfacer diferentes necesidades 9
  • 10. Antes de empezar, pregnteseEst el proyecto? Dirigido por el usuario: alta demanda de acceso (mejorado) Dirigido por la oportunidad: dinero disponible y por tanto puede llevarse a cabo Dirigido por la preservacin: alta demanda de materiales frgiles Dirigido por los beneficios: podemos obtener dinero de el. Tenemos? El dinero Las herramientas La capacidad La infraestructura tcnica Lleve a cabo Un estudio de rendimiento Un estudio de los derechos de propiedad intelectual Un estudio de viabilidad Un estudio tcnico pilotoElementosLos elementos clave de un proyecto de digitalizacin son: Poltica de seleccin Conversin Programa de control de calidad Gestin de la coleccin 10
  • 11. Presentacin Mantenimiento del acceso a largo plazoTodos estos elementos tienen la misma importancia -la cadena no es ms fuerte que sueslabn son ms dbil.Tomar la decisinLas tecnologas digitales estn sometidas a un rpido y continuo desarrollo y muchascuestiones no estn resueltas suscitando una engaosa confianza en el enfoqueesperar y mirar. La base para emprender la digitalizacin es el reconocimiento de quela tecnologa cambiar y que cambiar con frecuencia. Por lo tanto la decisin crucialno tiene que ver con cuando comenzar o si comenzar. Ms bien es cuestin de si lainstitucin puede permitirse despreciar la oportunidad de conseguir una ms ampliaaudiencia en una comunidad global, de la manera que permite la tecnologa paramejorar el acceso y la preservacin de los recursos culturales y de investigacin.La digitalizacin ser una tarea costosa, que requiere una planificacin detallada y elestablecimiento de una infraestructura que asegure el acceso continuo a los ficherosdigitalizados. En especial las instituciones de los pases en vas de desarrollo tendrnque considerar si el coste y el tiempo invertido se compensarn con los beneficios.Dichas instituciones deberan estar preparadas, por ejemplo, para oponerse al apoyode la implementacin de un proyecto de digitalizacin por parte de organismosdonantes externos, cuando los anlisis muestren, por ejemplo, que el uso del microfilmpodra ser adecuado, incluso preferible.UsuariosObviamente el usuario juega un papel importante en la decisin de poner en marcha unproyecto, pero con mucha frecuencia es difcil definir cul es ese papel. De hecho lasnecesidades especficas de los usuarios pueden ser difciles de conocer. En la mayorade los casos existe un supuesto grupo de usuarios, y el objetivo de la institucin esincrementar sus servicios y extender su enfoque e influencia. El grupo de usuariospuede diferir, dependiendo del tipo de institucin y de la misin de la organizacin. Lasinstituciones de educacin superior satisfacen las necesidades de su personal docentey de los estudiantes. Las instituciones pblicas y nacionales deben satisfacer a unapoblacin mayor y ms diversificada. Esto influye no slo en la seleccin sino tambinen las formas de presentacin y acceso (la interfaz del usuario).PreservacinDigitalizacin no es lo mismo que preservacin: la digitalizacin no es ms barata, mssegura, ni ms fiable que la microfilmacin. A diferencia de un fotograma de unmicrofilm de alta calidad, una imagen digital no es un master de preservacin. La nicamanera en la que la conversin digital contribuye positivamente a la preservacin escuando la copia digital reduce el desgaste y la rotura del original, o cuando los ficheros 11
  • 12. estn escritos como salida de ordenador en microfilm, que cumple los estndares depreservacin de calidad y perdurabilidad. Por lo tanto, un proyecto de digitalizacin nosustituye a un programa de preservacin basado en la conversin a microfilm (o dedesacidificacin, de un tratamiento de conservacin o de mejora de las condiciones dealmacenamiento).En general todo ello es cierto. Pero puede haber circunstancias especficas, porejemplo en los pases en vas de desarrollo, que pueden cambiar la base de esteplanteamiento. Si una institucin sin ninguna experiencia ni facilidad para laconservacin quiere preservar una determinada coleccin, puede decidir invertir enequipos de digitalizacin en lugar de en equipos de microfilmacin, evitando de estemodo el elevado gasto en cmaras y procesadores de microfilmacin y reconociendoque este equipamiento digital y el desarrollo de los conocimientos de su personalsatisfarn igualmente otros objetivos. Este cambio de la microfilmacin como mtodogeneralmente recomendado de preservacin por el de la digitalizacin con sus riesgosa largo plazo no es quizs la solucin ideal para el problema de la descomposicin delpapel de los siglos XIX y XX, pero puede servir como un modo prctico de proporcionarproteccin a ciertos documentos.Las tecnologas digitales ofrecen un nuevo paradigma de preservacin. Ofrecen laoportunidad de preservar el original proporcionando acceso a la copia digital; deseparar el contenido informativo de la degradacin del soporte fsico. Adems lastecnologas digitales liberan la gestin de la preservacin de las limitaciones de lasprecarias condiciones medioambientales de almacenamiento tpicas de los climastropicales y subtropicales en los que se sitan muchos pases en vas de desarrollo.Ahorrar costesLa digitalizacin no produce un ahorro del coste de la gestin de la coleccin. Una copiadigital nunca puede sustituir al documento u objeto original. Si una institucin quiereahorrar espacio no permitiendo el acceso a la prensa deteriorada, hara mejor creandouna copia en microfilm que imgenes digitales (e incluso mejor no desechando nuncalas copias de la prensa microfilmada).El proceso completo, seleccin, escaneo, creacin de registros, etc. requiere una graninversin y el mantenimiento a largo plazo de los equipos digitales tiene sus propiosaltos costes. Una institucin puede desear investigar las posibilidades de recuperar lainversin realizada mediante la comercializacin de las copias digitales. (vanse lasSecciones 3 y 4)Urgencia de construir depsitos digitalesLa conservacin de la informacin digital es indudablemente cara y requiere un granequipo tcnico de profesionales y equipamiento. 12
  • 13. Las bibliotecas que se embarcan en solitario en proyectos de digitalizacin deberanbuscar la cooperacin mediante acuerdos regionales, nacionales e internacionales ydeberan concertar acuerdos con depsitos adecuados (vase la Seccin 7)Otras decisiones a tener en cuentaSi se utiliza un procedimiento de digitalizacin que reproduzca la imagen o se utilizaOCR (reconocimiento ptico de caracteres) o se teclea el texto original. Es probableque los usuarios quieran textos recuperables, y esto significa OCR o tecleado (en lamayora de los casos lo segundo ser ms barato que lo primero, pero no hay ningunaregla fija y puede ser adecuada la combinacin de ambos mtodos). Por otro lado,dependiendo del tipo de usuarios y del tipo de texto muchos usuarios querrn tambinver las imgenes de la pgina, y la experiencia del aspecto del original. Esto puedellevarnos a la conclusin de usar ambos mtodos aunque en la mayora de los casoseso puede suponer un coste prohibitivo. As, la mejor solucin es elegir las imgenes dela pgina.Si se producen ficheros digitales capaces de llevar a cabo el trabajo que realizabantradicionalmente los servicios convencionales de fotografa (como por ejemploimgenes para publicaciones profesionales, muestras para exposiciones, etc.)Si se digitaliza desde el original o desde el microfilm. La segunda opcin representa elllamado sistema hbrido investigado particularmente por la Universidad de Cornell y porel proyecto Open Book en la Universidad de Yale.Lecturas recomendadasCOMMISSION ON PRESERVATION AND ACCESS. Digiting imaging and preservationmicrofilm: the future of the hybrid approach for the preservation of the books.Washington, DC, 1999. http://www.clir.org/pubs/archives/hybridintro.htmlCOUNCIL ON LIBRARY & INFORMATION RESOURCES (2001). Building andsustaining digital collections: models for libraries and museums. Washington, DC.(Publication 100) http://www.clir.org/pubs/reports/pub103/contents.htmlCOUNCIL ON LIBRARY & INFORMATION RESOURCES (2001). The evidence inhand: Report of the Task Force on the Artifact in Library Collections. Washington DC.(Publication 103) http://www.clir.org/pubs/reports/pub103/contents.htmlKENNEY, A. R. & RIEGER, O. (2000). Moving theory into practice : digital imaging forlibraries and archives . Mountain View, VA, Research Libraries Group (RLG)SMITH, Abby (2001). Strategies for building digitized collections . Washington, DC,Council on Library & Information Resources (Publication 101)http://www.clir.org/pubs/reports/pub101/contents.html 13
  • 14. SMITH, Abby (1999). Why digitise?. Washington, DC, Council on Library & InformationResources (Publication 80) http://www.clir.org/pubs/reports/pub80-smith/pub80.htmlRecursos relacionadosBritish Library, U.K. Objectives of digitisationhttp://www.bl.uk/about/policies/digital.htmCORNELL UNIVERSITY. DEPARTMENT OF PRESERVATION 6 CONSERVATION.Moving theory into practice: Digital Imaging Tutorialhttp://www.library.cornell.edu/preservation/publications.html (To accompany KENNEY, A. R.& RIEGER, O. (2000). Moving theory into practice : digital imaging for libraries andarchives. Mountain View, VA, Research Libraries Group (RLG) vase ms arriba)DIGITAL LIBRARY FEDERATION. Digital Library Standards and Practiceshttp://www.diglib.org/standardspv.htmLibrary of Congress. American Memory una pasarela a materiales originales primariosrelativos a la historia y a la cultura de los Estados Unidos. El sitio ofrece ms de 7millones de documentos digitales de ms de 100 colecciones histricas.http://memory.loc.govMemoria del Mundo de la UNESCO http://www.unesco.org/webworld/mdm/index.2htmlMemoria Virtual del Mundo de la UNESCOhttp:///www.unesco.org/webworld/en/memoire.html 14
  • 15. SELECCINAntecedentesEs importante entender la digitalizacin como una serie de opciones en las queconcurren demandas y requisitos que deben equilibrarse. Cuando se seleccionanmateriales originales para su digitalizacin se presentan tres cuestiones bsicas: si elmaterial original Necesita convertirse Debe convertirse Puede convertirsePor lo tanto, la seleccin tiene que orientarse de modo que se asegure que no solo seconsideren cuestiones como el valor del material seleccionado y el inters de sucontenido, sino tambin cuestiones relacionadas con la viabilidad tcnica, los aspectoslegales y las circunstancias de las instituciones.Las cuestiones implicadas en la seleccin de los materiales que se van a digitalizar seexaminarn desde dos puntos de vista: Principales razones para digitalizar (para mejorar el acceso y/o la preservacin) Criterios de seleccin (basados en el contenido o en las demandas)1.1 Principales razones para la digitalizacin1.1.1 Para mejorar el accesoComo se ha indicado en la Introduccin puede haber varias razones para incrementarel acceso: La mejora del acceso a un fondo concreto de material de investigacin La creacin de un nico punto de acceso a documentos de distintas instituciones que se refieren a una determinada materia La implementacin de una reunificacin virtual de colecciones y fondos de procedencia nica, pero que en la actualidad se encuentran muy dispersos (vase tambin, ms abajo, Colecciones virtuales) El apoyo a consideraciones democrticas mediante la creacin de registros pblicos ms ampliamente accesibles La ampliacin de la disponibilidad de los materiales como apoyo a la educacin y a otros proyectos de investigacin. 15
  • 16. La clave est en evaluar qu puede aportar un acceso generalizado a una comunidadde usuarios concretos. Si la institucin que planifica un proyecto de digitalizacin esprivada, es normal que lo enfoque a sus necesidades especficas y al grupo de usuariosque es su objetivo. Sin embargo, si se trata de una institucin pblica deber satisfacera una poblacin mayor y demandas ms diversificadas.La manera en que se pretenda utilizar la digitalizacin es de vital importancia para ladeterminacin de los requisitos tcnicos. Por ejemplo, la cantidad de informacincapturada en la conversion digital limitar la usabilidad de las imgenes digitales (vasela Seccin 2)1.1.2 Para facilitar nuevas formas de acceso y usoEl propsito principal en este caso es posibilitar el uso de materiales (manuscritos yarchivos, mapas, objetos musestic os, libros raros originales, etc.): Cuyos originales solo pueden consultarse visitando sus depsitos especficos. que se han deteriorado y necesitan apoyo tecnolgico para mostrar su contenido o forma (recuperacin de datos) de un modo ms fcil y productivo que utilizando herramientas avanzadas de ordenador como OCR (Reconocimiento ptico de Caracteres) o codificacin del texto para textos convertidos.En estos casos el inters debe centrarse principalmente en como aadir valor almaterial original y no en la digitalizacin como tal. A veces los costes y las limitacionestcnicas facilitarn la utilizacin de soluciones distintas a la digitalizacin o solucioneshbridas en las que intervengan ambas, la digitalizacin y la microfilmacin.1.1.3 Para la preservacinSi se trata de la conversin digital de materiales que estn en peligro o daados, elobjetivo es, en primer lugar, la creacin de reproducciones exactas de estos originalesen un soporte de larga duracin y no la seleccin de materiales de a cuerdo con lademanda. Estas reproducciones deben satisfacer tanto a los usuarios actuales como alos potenciales usuarios del futuro, y por tanto deben ser de una gran calidad y poseeruna gran estabilidad fsica de modo que puedan mantenerse a lo largo del tiempo:Un mtodo de seleccin de materiales originales para su preservacin es clasificarlosen tres categoras: Documentos raros, nicos o frgiles, archivos y otros objetos de valor material que necesiten conservarse en su forma original: La conversin digital puede crear copias de gran calidad con un acceso rpido y amplio que en 16
  • 17. muchos casos proteger estos materiales de la manipulacin. Esto puede ser difcil de conseguir utilizando determinados tipos de microforma. Materiales originales con u importante valor intelectual pero con un valor n material relativamente bajo, utilizados intensivamente y daados o frgiles: Las imgenes digitalizadas son normalmente una buena alternativa para satisfacer las demandas inmediatas. Si los materiales originales estn deteriorados, y, por tanto, necesitan ser sustituidos permanentemente, los archivos y las bibliotecas a veces prefieren utilizar el microfilm para fines de preservacin y las copias digitales para el acceso (solucin hbrida). Materiales origi nales muy deteriorados de un alto valor intelectual pero de un bajo valor material y con un bajo nivel de uso. Este no es un material que interese digitalizar en primer lugar. Si es un material deteriorado que se necesita sustituir por copias que permitan su uso, el microfilm sigue siendo todava la opcin habitual en muchos pases, por ser estable, barata y fcil de almacenar (aunque hay que tener en cuenta los comentarios sobre la situacin en algunos pases en vas de desarrollo tal y como se ha expresado ms arriba, en la Introduccin). En el futuro, cuando los investigadores descubran estos materiales originales microfilmados y quizs los utilicen con ms frecuencia, siempre existir la posibilidad de digitalizar el microfilm.Muchas instituciones no han aceptado todava que la tecnologa digital essuficientemente estable para la preservacin a largo plazo. Con frecuencia las razonesson que sienten el peligro de la obsolescencia tcnica del medio digital e incertidumbretanto sobre el estatus legal de los documentos electrnicos como sobre los futuroscostes de la preservacin de este tipo de documentos (vanse las Secciones 3 y 7). Ala espera de que se resuelva el problema de la longevidad digital, muchas institucionesestn creando archivos de imgenes (vese ms arriba) que pueden considerarse consuficiente calidad de preservacin. Esto significa que: pueden utilizarse para diferentes fines se crean con un nivel de calidad que reducir las necesidades de un nuevo escaneo (vese la Seccin 2)El hecho de que se haya creado una copia ciertamente no es suficiente para justificar laeliminacin del original. Incluso para que el lector acepte la copia digital como textopreferible al original, las imgenes digitales deben: tener una autenticidad garantizada (vase Seccin 3) formar parte de un plan de preservacin (vase Seccin 8)La eliminacin de los documentos originales despus de la conversin digital se utiliza aveces en programas de gestin de archivos pero solo para aquellos documentos que 17
  • 18. se han evaluado previamente y cuya eliminacin estaba prevista y que se handigitalizado para facilitar un uso masivo durante su tiempo de vida.1.2 Criterios de seleccinCuando se planifica un proyecto de digitalizacin es til tener en cuenta las polticasestablecidas por otras instituciones para sus propios proyectos. Muchos de estosproyectos estn actualmente disponibles para su consulta en la Web. Un ejemplo es elde la Universidad de Columbia que ha desarrollado un conjunto de criterios deseleccin para la digitalizacin de imgenes dividido en seis categoras: desarrollo de lacoleccin, valor aadido, derechos de propiedad intelectual, preservacin, viabilidadtcnica y control intelectual. Otro ejemplo es la Biblioteca del Congreso donde laseleccin para la preservacin de la reconversin digital se basa en el valor, el uso, lascaractersticas del documento original y la conveniencia de la reproduccin digital parael uso y el acceso. (Vese Lecturas recomendadas al final de esta Seccin parareferencias sobres estos y otros programas establecidos).1.2.1 ContenidoCualquiera que sea el objetivo de la implementacin de un proyecto de digitalizacin, laseleccin de los materiales originales se basar siempre, en mayor o menor medida, enel contenido. De hecho el valor intelectual es la cuestin bsica en toda clase deseleccin: justifica el contenido de este documento (su valor para el posible lector)todos los esfuerzos, costes y otros recursos que sern necesarios?. Por lo tanto, todoproyecto o programa de digitalizacin debera tener sus propios principios de valorbasados en los objetivos que intenta conseguir. Colecciones virtualesDurante los diez ltimos aos los investigadores han comenzado a crear coleccionesvirtuales de documentos, libros, objetos musesticos, etc. escaneados. La seleccin sebasa normalmente en el contenido intelectual del material, pero podra basarse tambinen el aspecto fsico o en otros factores como la antigedad, etc. Los objetivos de lacreacin de colecciones virtuales pueden ser diferentes. Un motivo puede ser, porejemplo, la reunificacin de colecciones y fondos dispersos (vase ms arriba) o lamejora de la investigacin mediante la integracin de diferentes materiales originalesque de otro modo habran quedado como documentos aislados, localizados endiferentes partes del mundo. En este sentido las posibilidades de acceso generalizado atravs de Internet juegan un papel fundamental. Reunir una masa crtica de informacinLlevar a cabo un proyecto de digitalizacin que merezca la pena requiere contar con unvolumen mnimo de informacin. De no ser as su valor para la investigacin serdemasiado bajo para atraer lo suficiente a usuarios reales o potenciales. Por lo tanto,una cuestin importante si la seleccin se basa en el contenido es si debera incluirse lacoleccin completa o solo una parte de la misma. Normalmente, el valor de los 18
  • 19. documentos de archivos, colecciones fotogrficas, etc. es mayor en su conjunto quecomo partes individuales sacadas del contexto, aunque si los objetos o documentosindividuales tienen un valor significativo para la investigacin, incluso una partepequea de ellos pueden constituir una masa crtica de informacin.1.2.2 DemandaEl nivel de demanda es, por supuesto, de gran inters en el proceso de seleccin de losmateriales para la digitalizacin. Si el objetivo prioritario es mejorar el acceso, elproceso de seleccin se regir seguramente por las probabilidades de uso delcontenido del material digitalizado. Por tanto, la implicacin de los especialistas y otrosinvestigadores en la toma de decisiones es una metodologa tradicional de seleccin.Sin embargo, hay una cuestin bsica y es con qu tipo de usuarios quiere interactuarla institucin que digitaliza o, al menos, a qu usuarios quiere dar prioridad. Larespuesta depende de la misin de la institucin en cuestin, aunque a veces tambindepende de objetivos polticos y de lo que la sociedad espera de sus institucionesculturales.A veces, un activo grupo de usuarios de un determinado tipo de materiales puedenencontrarse dispersos por todo el mundo y precisamente por esto puede ser difcil dedefinir o identificar. Los documentos incluidos en colecciones especiales corren elriesgo de que se consideren como documentos de bajo uso, lo cual no esnecesariamente cierto puesto que un pequeo grupo de especialistas puede generaruna importante investigacin.Para equilibrar las demandas de los diferentes grupos de usuarios muchas institucionesdisponen de equipos de especialistas y otros investigadores que les ayudan aseleccionar aquel material que es prioritario digitalizar. Cuando las actividades dedigitalizacin de instituciones se desarrollan desde objetivos generales hacia proyectosconcretos que cubren colecciones completas o tipos de documentos u objetos, estosequipos asesores pueden ser estratgicamente importantes.Para instituciones culturales que comienzan su primer proyecto de digitalizacin, unbuen mtodo de trabajo es seleccionar las partes ms intensamente utilizadas de suscolecciones a las que, por lo general, darn el mayor valor aadido porque satisfarnlas necesidades de la mayora de las personas a las que quieren servir.1.2.3 Estado fsicoLa seleccin del material que se va a digitalizar se ver afectada tanto por el estadofsico del material como por la calidad de las descripciones bibliogrficas existentessobre el mismo. El material que es frgil, est daado o en condiciones precarias puedepresentar demasiados riesgos de daarse todava ms a causa de su manipulacin sise permite su escaneo sin un especial cuidado o sin un tratamiento bsico deconservacin. Esto implica costes adicionales, y la institucin tendr que considerar sidebe dar prioridad a otras colecciones en mejor estado, o si el coste de la preparacin y 19
  • 20. conservacin debera incluirse en el coste total del proyecto de digitalizacin (Vase ladiscusin ms adelante en la Seccin 4, Presupuestos)De forma similar, si el material que se ha considerado candidato par a la digitalizacintiene lagunas en su catalogacin o en la descripcin de sus datos, es fundamental parael futuro acceso a dichos materiales crear esos datos, y, por tanto, ser necesarioconsiderar si los costes adicionales de este trabajo pueden incluirse en el presupuestototal del proyecto de digitalizacin.RecomendacionesFormule una poltica de seleccin del material que se va a digitalizar comoprimera etapa del proyecto.Identifique las principales razones que animan el proyecto. Se trata demejorar el acceso, de apoyar la preservacin, o de ambas?.Las decisiones sobre los requisitos tcnicos, la indizacin y la bsqueda y lapreservacin de los ficheros digitales que se creen, dependen delplanteamiento del proyecto.Cree un conjunt o de criterios de seleccin.Considere la creacin de un equipo asesor de especialistas y otrosinvestigadores que representen a usuarios potenciales de estos archivosdigitales y que ayuden a seleccionar lo que es prioritario digitalizar.Capturar una imagen de modo que sea posible utilizarla para satisfacerdistintas necesidades y almacenarla como una imagen de archivo off line en unsoporte de almacenamiento barato y seguro (copia maestra). Las copiassustitutas de esta imagen se pueden utilizar para el acceso (ficheros deacceso). A veces las copias de seguridad se hacen con una mayor compresiny se usan solo como imgenes de muestreo para dar una idea del contenido(archivos de miniaturas)Lecturas recomendadasAYRIS, P. (1998). Guidance for selecting material for digitization, in NATIONALPRESERVATION OFFICE/RESEARCH LIBRARIES GROUP (1998). Guidelines for 20
  • 21. digital imaging: papers given at the joint NPO/RLG Preservation Conference, 1998.Londonhttp://www.rlg.org/preserv/joint/ayris.htmCOLUMBIA UNIVERSITY LIBRARIES. Selection criteria for digital imaginghttp://www.columbia.edu/cul/web/projects/digital/criteria.htmlCOMMISSION ON PRESERVATION ACCESS (1999). Digital imaging and preservationmicrofilm: the future of the hybrid approach for the preservation of books. Washington,DC.http://www.clir.or g/pubs/archives/hybridintro.htmlDe STEFANO, R. (2000). Selection for digital conversion in KENNEY, A.R. & RIEGER,O. Movin theory into practice: digital imaging for libraries and archives . Mountain View,VA, Research Libraries Group (RLG)GERTZ, J. (1998). Selecting guidelines for preservation in NATIONAL PRESERVATIONOFFICE/RESEARCH LIBRARIES GROUP (1998). Guidelines for digital imaging: :papers given at the joint NPO/RLG Preservation Conference, 1998. Londonhttp://www.rlg.org/preserv/joint/gertz.htmHARVARD UNIVERSITY LIBRARY. Selection for digitization. A decision- making matrixhttp://preserve.harvard.edu/bibliographies/matrix.pdfHAZEN, D. et al. (1998). Selecting research collections for digitization. Washington, DC,Council on Library & Information Resources. (Publication 74)http://www.clir.org/pubs/abstract/pub74.htmlKENNEY, A.R. & RIEGER, O. (2000). Moving theory into practice: digital imaging forlibraries and archives . Mountain View, VA, Research Libraries Group (RLG)MENNE-HARITZ, A. & BRBACH, N. (1997). The intrinsic value of archive and librarymaterial: list of criteria for imaging and textual conversion for preservation. Marburg,Archivschule.http://www.uni-marburg.de/archivschule/intrinsengl.htmlNATIONAL PRESERVATION OFFICE (1997). Preservation and digitisation: principles,practices and policies: papers given at the NPO 1996 Annual Conference. Londonhttp://www.rlg.org/preserv/jointSMITH, Abby (2001). Strategies for building digitized collections . Washington, DC,Council on Library & Information Resources (Publication 101)http://www.clir.org/pubs/reports/pub101/contents.htmlUNIVERSITY OF CALIFORNIA (UCLA) LIBRARY. Digital projects. Guidelines andstandards. http://www.digitallibrary.ucla.edu (en particular Guidelines for ChoosingMetadata and Standards Reference Guide) 21
  • 22. WEBER, H, & DRR, M. (1997). Digitisation as a method of preservation? Amsterdam,European Council on Preservation & Accesshttp://www.clir.org/pubs/reports/digpres/digpres.htm 22
  • 23. 2. REQUISITOS TCNICOS E IMPLEMENTACIN2.1 ConversinUna imagen digital es una fotografa electrnica convertida en un conjunto deelementos pictricos (pxels) y ordenada de acuerdo con una relacin predefinida decolumnas y filas. El nmero de pxels en una tabla dada define la resolucin de laimagen. Cada pxel tiene un determinado valor tonal que depende de la intensidad de laluz reflejada desde el documento original al dispositivo de carga acoplado (CCD)mediante diodos sensibles a la luz. Cuando los documentos se exponen a la luz creanuna carga elctrica proporcional, que genera, a travs de una conversinanalgica/digital, una serie de seales digitales representadas por un cdigo binario. Launidad ms pequea de informacin almacenada en un ordenador se denomina bit(acrnimo de binary digit). El nmero de bits utilizados para representar cada pxel enuna imagen determina el nmero de colores o escala de grises que se puedenrepresentar en una imagen digital. Esto se llama profundidad del bit.Las imgenes digitales se conocen tambin como imgenes representadas por bits oimgenes raster para diferenciarlas de otros tipos de ficheros electrnicos como losficheros vectoriales en los que la informacin grfica se codifica mediante frmulasmatemticas que representan lneas y curvas.Los documentos originales se transforman en imgenes convertidas en bits por mediode un escner o cmara digital. Durante la captura de la imagen dichos documentos seleen o escanean a una resolucin y a una profundidad predefinidas. Los ficherosdigitales resultantes que incluyen los bits para cada pxel, se formatean y etiquetan demanera que se facilite a un ordenador su almacenamiento y recuperacin. A partir deestos ficheros el ordenador puede realizar representaciones analgicas para suvisualizacin en pantalla o impresin. Debido a que los ficheros con imgenes de altaresolucin son muy grandes puede ser necesario reducir el tamao de los archivos(compresin) para hacerlos ms manejables tanto para el ordenador como para elusuario.Cuando un documento fuente se ha escaneado, todos los datos se convierten a undeterminado formato de fichero para su almacenamiento. Existe una variedad deformatos de imgenes ampliamente utilizados en el mercado. Algunos de ellos estnpensados tanto para el almacenamiento como para la compresin. Los ficheros deimgenes tambin incluyen informacin tcnica que se almacena en el rea del ficherollamada cabecera de la imagen.El objetivo de cualquier programa de digitalizacin debera ser capturar y presentar enformatos digitales el contenido informativo ms significativo de un nico documentooriginal o de una coleccin de tales documentos. Para capturar las partes significativas,las valoraciones de la calidad de las imgenes digitales deben basarse en lacomparacin entre esas imgenes digitales y los documentos originales que se van aconvertir, y no sobre algn concepto vagamente definido acerca de lo que bastara parasatisfacer las necesidades inmediatas. Sin embargo, la solucin no es capturar una 23
  • 24. imagen con la mayor calidad posible, sino comparar el proceso de conversin con elcontenido informativo del original- ni ms ni menos. Esto plantea dos cuestiones: lascaractersticas de los documentos originales que se van a digitalizar y la calidad de laimagen.2.1.1 Los atributos de los documentos originalesAl capturar, se deben tomar en consideracin tanto los procesos tcnicos implicados enla digitalizacin como los atributos de los documentos originales. Estos atributospueden ser de distintas dimensiones y nivel tonal (color o blanco y negro). Losdocumentos originales tambin pueden caracterizarse por el modo en que se hanproducido: a mano (tinta), mecanografiados o impresos, o por mtodos fotogrficos oelectrnicos.La condicin fsica de los documentos originales puede influir de diferentes maneras enla conversin. Los textos descoloridos, las manchas de tinta, las pginas quemadas yotro tipo de daos, a veces destruyen el contenido informativo, pero de forma msfrecuente imponen limitaciones fsicas a las posibilidades de capturar informacindurante el escaneo. Por tanto, se debe identificar la posible necesidad de untratamiento previo de los documentos originales antes de escanearlos. Despreciar estacuestin puede ser no slo una amenaza para los propios documentos sino quetambin puede limitar los beneficios y resultados de la digitalizacin e incrementar elcoste. Los pasos ms comunes para prevenir este problema son, por ejemplo, llevar acabo tratamientos bsicos de conservacin previos y usar atriles para los volmenesencuadernados, y rutinas para controlar la luz y otras condiciones ambientales duranteel escaneo . Si los documentos originales tiene un valor material necesitarn, por logeneral, que los examine un conservador antes de escanearlos.Cuando los riesgos de dao de los documentos originales sean altos y los documentostengan un valor especial o estn en malas condiciones, a veces puede ser mejorescanear a partir de ficheros intermedios de microfilm y no a partir de los documentosoriginales, si se dispone de dichos microfilm s.2.1.2 Calidad de la imagenLa calidad de la imagen durante la captura depende de la suma de resultados de laresolucin aplicada al escaneo, la profundidad del bit de la imagen escaneada, losprocesos de mejora y el nivel de compresin aplicada, el dispositivo de escaneoutilizado o tcnicas usadas, y la preparacin del operador del escner.2.1.2.1 ResolucinLa resolucin viene determinada por el nmero de pxels utilizados para presentar laimagen, expresada en puntos por pulgada (ppp) o pxels por pulgada (ppi). Ladiferencia entre ppp y ppi se describe a continuacin en la Seccin 2.2. 24
  • 25. Aumentar el nmero de pxels utilizados para captar una imagen dar como resultadouna resolucin ms alta y una mayor capacidad para definir los detalles ms precisos,pero continuar incrementando la resolucin no proporcionar una mejor calidad,nicamente ficheros de tamao mayor. La cuestin clave es determinar el nivel deresolucin suficiente para capturar todos los detalles significativos del documentooriginal.El tamao fsico del documento original es importante a la hora de determinar laresolucin. Cuanto ms grande es un documento mayor ser el nmero de pxels quese necesitan para captar los detalles requeridos de la imagen, as como el tamao delfichero. Los ficheros muy grandes pueden causar problemas a los usuarios al visualizarlas imgenes en pantalla o al enviarlas a travs de las redes, debido a que el tamaodel fichero tiene una importante incidencia en el tiempo que se tarda en mos trar unaimagen. Una manera de disminuir el tamao del fichero es disminuir la resolucin. Estaes una decisin crtica, especialmente si el documento original tiene tanto un grantamao fsico como un alto nivel de detalle, como puede ser el caso de los dibujos y losmapas de gran tamao.2.1.2.2 Profundidad del bitLa profundidad del bit es la medida del nmero de bits utilizados para definir cada pxel.A mayor profundidad del bit, pueden representarse mayor nmero de tonos en grises ycolor. Existen tres modos: escaneo binario, utilizando un bit por pxel para representar el blanco o el negro escaneo en escala de grises, utilizando mltiples bits por pxel para representar las escalas de grises. El mejor nivel de escala de grises es de ocho bits por pxel, y en este nivel la imagen que se muestra puede seleccionar hasta 256 diferentes niveles de grises escaneo en color utilizando mltiples bits por pxel para representar el color; se considera un buen nivel de color 24 bits por pxel y permite una seleccin de hasta 16.7 millones de colores.La eleccin de la profundidad de los bits afecta a las posibilidades de captura, tanto dela apariencia fsica del documento original como de su contenido informativo. De estomodo, las decisiones sobre la profundidad de los bits deben tener en cuenta si elaspecto fsico del documento, o de sus partes, tienen un valor informativo aadido quees necesario reflejar. Este puede ser el caso de los proyectos de digitalizacin quetienen como objetivo la realizacin de facsmiles de los documentos originales.2.1.2.3 Procesos de optimizacin de la imagenLos procesos de optimizacin de la imagen se pueden aplicar para modificar o mejorarla imagen captada, cambiando el tamao, el color, el contraste y el brillo, o para 25
  • 26. comparar y analizar imgenes con caractersticas que el ojo humano no puede percibir.Esto ha abierto muchos campos nuevos de aplicaciones para el proceso de la imagen,pero el uso de este tipo de procesos plantea cuestiones sobre la fidelidad y autentic idadrespecto al original. Las caractersticas del proceso de la imagen incluyen, por ejemplo,el uso de filtros, curvas de reproduccin tonal y herramientas para el tratamiento delcolor.2.1.2.4 CompresinLa compresin se utiliza normalmente para reducir el tamao del fichero con el fin deprocesar, almacenar y transmitir las imgenes digitales. Los mtodos utilizados son,por ejemplo, la eliminacin de informacin repetida o la de difcil visin para el ojohumano. De este modo la calidad de una imagen puede verse afectada por las tcnicasde compresin utilizadas y por el nivel de compresin aplicado. Las tcnicas decompresin pueden ser tanto sin prdida, lo que significa que una imagendescomprimida ser idntica a su estado original debido a que no se ha perdidoninguna informacin cuando se ha reducido el tamao del fichero, como de prdidacuando la informacin menos significativa se reduce o desecha en este proceso.En general, la compresin sin perdida se utiliza para los ficheros maestros y lastcnicas de compresin con prdida para los archivos de acceso. Es importante teneren cuenta que las imgenes pueden responder a la compresin de diferentes modos.Algunos tipos concretos de caractersticas visuales como leves variaciones de tonopueden producir efectos visuales no deseados.Las imgenes digitales reproducidas a partir de formatos fotogrficos que tienen unamplio nivel tonal, normalmente dan lugar a grandes ficheros. Otra tcnica, adems dela compresin, que se puede us ar para reducir el tamao del fichero es reducir ladimensin espacial de la imagen digital (para la resolucin espacial, ver Seccin 2.2).Esto puede llevarse a cabo cuando se pretende que la imagen sea una reproduccin dearchivo ms que un facsmil que sustituya al original.2.1.2.5 El equipo utilizado y su funcionamientoEl equipo utilizado y su funcionamiento tiene un importante impacto en la calidad de laimagen. Equipos de diferentes fabricantes pueden funcionar de modo diferente, inclusosi ofrecen las mismas capacidades tcnicas.2.1.2.6 Criterio y cuidado del tcnicoEl criterio y cuidado del tcnico siempre tiene un considerable impacto sobre la calidadde la imagen. En definitiva son las decisiones tomadas por las personas las quedeterminan la calidad que se consiga. 26
  • 27. Recomendaciones para la conversinGua de diez pasos para asegurar un buen proceso de conversin 1. Utilice escneres que puedan adecuarse a : las dimensiones fsicas de los documentos originales el tipo de soporte implicado (transparente o reflectante) el nivel de los detalles, tonos y colores presentes en los documentos el estado fsico de los documentos. 2. Examine cuidadosamente si existe algn requisito para una manipulacin concreta o de conservacin de los documentos originales antes de escanearlos. 3. Elija una resolucin que sea suficiente para capturar los ms sutiles detalles requeridos por el grupo de documentos originales que se van a escanear. Compruebe que la resolucin no limitar el uso que se pretende conseguir para las imgenes digitales. Establezca la resolucin en el nivel elegido para todo el grupo de documentos originales con el objetivo de evitar la revisin de documento por documento. 4. Elija una profundidad de bit que est en consonancia con las caractersticas de los documentos originales y con el nivel necesario para transferir el contenido informativo: escaneo binario para documentos textuales que consistan en imgenes en negro sobre papel blanco; escaneo en escala de grises (8 bits) para documentos que contengan informacin significativa en escala de grises (incluidas las anotaciones a lpiz en el texto) y para materiales fotogrficos; escaneo en color para documentos que contengan informacin en color, especialmente cuando se necesiten copias facsmiles de gran calidad. 5. Utilice los procedimientos de optimizacin de las imgenes y los documentos cuidadosamente siempre que este tipo de procesos se lleven a cabo. 6. Utilice las tcnicas de compresin normalizadas sin prdida para los ficheros de conservacin y seguridad (maestros) y para los ficheros de acceso cuando sea necesario. Esto significa, por ejemplo: para la compresin: ITU grupo 3 o 4 y JBIG (imgenes binarias), JPEG/JPEG 2000 or LZW (imgenes multi-bit ) sin prdida para el intercambio: JPEG/JPEG 2000 sin prdida, TIFF 5 o versiones superiores 7. Lleve a cabo cuidadosamente ensayos de acceso a los ficheros con el fin de encontrar un equilibrio entre una calidad visual aceptable para el usuario y el 27
  • 28. tamao del fichero de modo que el ordenador pueda acceder al mismo en un tiempo aceptable. 8. Para obtener un buen rendimiento de los equipos utilizados, investigue cuidadosamente las declaraciones de los fabricantes acerca de las potencialidades del sistema y confrmelas mediante pruebas y referencias. 9. Utilice estndares para la evaluacin de calidad de la imagen digital (ver a continuacin 2.2. Control de calidad) 10. Desarrolle un programa continuo de control de calidad para verificar la consistencia de la produccin de los distintos tcnicos durante el proceso del escaneo (ver a continuacin 2.2. Control de calidad)2.2. Control de calidadEl control de calidad es un elemento importante en cada una de las etapas de unproyecto de digitalizacin. Sin este trabajo no ser posible garantizar la integridad yconsistencia de los ficheros de imgenes.Deben tomarse medidas para minimizar las variaciones entre los diferentes operadoresas como entre los distintos escneres que se utilicen. Los escners deben, adems,revisarse regularmente para verificar su precisin y la calidad.Es necesario un programa de control de la calidad tanto para proyectos propios comopara aquellos, o parte de los mismos, que se contratan externamente. Una diferenciaimportante es que en un proyecto contratado externamente de forma total o parcial losrequisitos de calidad a menudo tienen que formularse antes de la firma del contrato,debido a su naturaleza legal vinculante. En los proyectos propios se pueden ir creandopoco a poco los programas de control de calidad como parte de las tareas del proyecto.Aunque el control de calidad es un factor crucial para asegurar los mejores resultadosno existe un modo normalizado para asegurar una determinada calidad de la imagendurante su captura. Los diferentes documentos originales requieren diferentes procesosde escaneo, lo que debe tenerse en cuenta cuando se desarrollan programas de controlde calidad.2.2.1. Principios bsicos de un programa de control de calidad2.2.1.1 ObjetivoUna cuestin importante en un programa de control de calidad es si incluir: 28
  • 29. la coleccin completa de imgenes o una muestra? todo tipo de ficheros (ficheros de conservacin, ficheros de acceso, ficheros de miniaturas?) otros productos intermedios como facsmiles en papel y microformas ?La respuesta depende del objetivo del proyecto de digitalizacin, de los productosrequeridos y de los niveles de calidad y puntos de referencia elegidos. Si el programade digitalizacin es muy limitado o los requisitos de calidad son extraordinariamentealtos, tendr ms sentido examinar la coleccin completa imagen por imagen. Sinembargo, en la mayora de los programas es suficiente con establecer un plan demuestreo que cubra por ejemplo el 10% de las imgenes producidas por cadadispositivo de escner durante un determinado periodo de tiempo (un da, una semana,un mes). Si un porcentaje previamente especificado de las imgenes elegidas esincorrecto, entonces deber revisarse el grupo completo de imgenes.Un programa de control de calidad siempre incluye los ficheros de conservacin que seproducen y en la mayora de los casos tambin tendr en cuenta otros productos comolos ficheros de acceso, microformas y copias en papel.2.2.1.2 MtodosLas herramientas automticas de evaluacin de la imagen de las que disponemosactualmente no son, por lo general, suficientes para materiales que se requieren parafines culturales y cientficos. Por lo tanto, la evaluacin de la calidad visual debellevarse a cabo: o desde la pantalla o en los productos impresos basada en una mezcla de evaluacin en pantalla y en los productos impresos (pelculas o impresiones)Deben tenerse en cuenta las limitaciones tcnicas que pueden afectar a la evaluacin,comenzando con las posibilidades de conseguir una buena calidad de las copiasimpresas de las imgenes en escala de grises y en color. Los mtodos recomendadosson para la evaluacin en pantalla - visualizacin de las imgenes escaneadas a 1:1 (ampliados al 100%) - uso de objetivos para evaluar la reproduccin en escala de grises y color - uso de objetivos de resolucin e histogramas para evaluar la resolucin espacial y la reproduccin tonal. - utilizacin de mtodos para la medida del ruido y herramientas de deteccin de objetos para la evaluacin de los productos impresos 29
  • 30. - examinar por medio del ojo humano las copias creadas a partir de las imgenes para comprobar si se ajustan a los requisitos de calidad. - comparar los productos impresos con los documentos originales2.2.2 Control de calidad del escnerAntes de comprar un escner, se debera exigir a los vendedores que presentenresultados digitales evaluables por medio de tests de evaluacin de la calidad deimgenes digitales relevantes. Cuando un proyecto de digitalizacin est en marcha,deben establecerse medidas de control de calidad del escaneado que permitan a losoperadores estar seguros de que los dispositivos de escaneo estn operando dentrode los parmetros previstos. Las cuestiones que ms conciernen a los resultados son:resolucin espacial, reproduccin tonal, reproduccin del color, ruido y deteccin deobjetos. En los proyectos en los que se digitalizan materiales de gran formato, comomapas y planos, la precisin geomtrica es tambin un factor importante.2.2.2.1 Resolucin espacialUna definicin muy comn de resolucin espacial es la capacidad de capturar yreproducir detalles espaciales. Esto se refiere tanto a los dispositivos de entrada comode salida y esta es probablemente la nica razn por la que el concepto de resolucines una de las especificaciones tcnicas peor comprendidas y utilizadas en relacin conlos equipos de digitalizacin. La resolucin se define a menudo en trminos de ppp(puntos por pulgada). Sin embargo, los ppp deberan usarse normalmente solo para lasimpresoras puesto que p se refiere siempre a puntos impresos (por ejemploimpresoras de chorro de tinta e impresoras lser). Para la resolucin en la entrada dedatos (es decir, escneres y cmaras digitales) y para la resolucin en pantalla (esdecir, monitores) s uele usarse normalmente la relacin pxels por pulgada (ppi). Engeneral, un pxel es una unidad fsica mucho ms pequea que un punto.Cuando se dice que un escner tiene una resolucin mxima de por ejemplo 600 ppp,significa en la prctica que el escner muestra ptimamente un mximo de 600 pxelspor pulgada (ppi). Pero la proporcin de muestreo ptico de un escner slo define laresolucin ptica mxima posible en el sentido de la capacidad de la unidad CCD. Estono garantiza que el escner en realidad pueda resolver espacialmente detalles en elmismo grado que supondra el nivel de muestreo ptico. El motivo es que la proporcinde muestreo ptico de un dispositivo de entrada es slo uno de los componentes delconcepto de resolucin. Otros componentes de importancia son por ejemplo la calidad,el nivel del enfoque y la estabilidad mecnica del sistema ptico (lentes, espejos yfiltros, el nmero de bits de los datos de entrada y de los productos, las variaciones deldocumento original y el CCD y el nivel de proceso de las imgenes aplicado a laimagen.Existen varios mtodos para evaluar la resolucin. Los ms comunes son lossiguientes: 30
  • 31. Modelos de resolucin, que nacieron originalmente para su uso en las industrias microgrficas y fotogrficas. Se usan normalmente para medir la reproduccin de los detalles, para la uniformidad de la captura de las diferentes partes de un documento fuente, para la nitidez de la imagen, etc. A veces los resultados pueden no ser totalmente fidedignos, pero los modelos de resolucin siguen siendo todava herramientas prcticas para utilizar especialmente en la conversin binaria. La funcin de la modulacin de la transferencia (MTF), donde se mide la intensidad de la luz en el proceso de la imagen (calibracin de la luz). Este es un mtodo ms fiable y objetivo para evaluar el modo en el que se preservan los detalles y cuales son los sistemas de escala de grises y color ms apropiados. Respuesta de la frecuencia espacial (SFR), que significa la capacidad del escner para transmitir informacin de alta frecuencia por medio de una funcin especfica de transmisin (en la prctica equivalente a MTF)Ejemplos de modelos que se utilizan para la resolucin son: Test de prueba de facsmil normalizado del IEE (Institute of Electrical and Electronic Engineers) Test de prueba n. 2 para escneres de AIIM Modelo de resolucin PM-189 (A&P International) Modelo de escner SFR y OECF n. 2 (Applied Image Inc)La norma para la evaluacin de la resolucin es la ISO 12233 de Fotografa, Cmarasde fotos electrnicas, medidas de resolucin.2.2.2.2 Reproduccin tonalLa reproduccin tonal es el ms importante de todos los indicadores de calidad de laimagen, porque nos da la pauta para la evaluacin de otros parmetros de calidad dedicha imagen. De hecho, la efectividad de estos parmetros implica una satisfactoriareproduccin tonal. En la prctica la reproduccin tonal determina el grado de oscuridado claridad de una imagen as como su contraste.Debido a los diversos ruidos electrnicos en el escner siempre habr prdidas en laprofundidad del bit durante el proceso del escaneado. Por esto es importante capturarla imagen con una resolucin mayor de la necesaria para el producto digital final, porejemplo, al menos entre 12 y 14 niveles de canal por bit para conseguir una resolucinde salida de 8 (en escala de grises)La reproduccin tonal se evala mediante una curva de reproduccin de tono querelaciona la densidad ptica de un documento en papel o una reproduccin de microfilm 31
  • 32. con el correspondiente valor digital (valor tonal) en la reproduccin digital. En lossistemas digitales esta curva se llama Funcin de conversin opto-electrnica (OECF).Los valores tonales tambin pueden evaluarse por medio de un histograma quemuestra en modo grfico la distribucin de los tonos en una imagen as como el gradotonal de la misma. La disminucin en la claridad u oscuridad comparados con losvalores tonales del documento original pueden indicar que hay limitaciones en el nivelde fuerza del equipo del escner. El nivel de fuerza puede definirse como el grado dediferencia tonal entre la claridad y la oscuridad ms intensas y su valor muestra deeste modo la capacidad del escner para distinguir las variaciones extremas en laintensidad. Normalmente, el nivel de fuerza de un escner debera conseguir o superarlos extremos de intensidad de los documentos originales.Es importante que no se efecte ninguna compresin tonal en la captura de la imagenescaneada. Si efectuamos una compresin tonal en este momento del proceso deconversin, nunca podremos restaurar de nuevo la imagen a su valor tonal completo.As, la gama de valores del escner (el parmetro de brillo siempre deberaestablecerse en 1.0 en el programa del escner. Es to se define a menudo comoreproduccin tonal.2.2.2.3 Reproduccin del colorEl mayor desafo de la digitalizacin de documentos originales en color es sureproduccin manteniendo la representacin del color en la pantalla y en lasimpresiones. El principal problema es que tanto los monitores como los sistemasoperativos y el sistema de aplicaciones representan el color de diferentes modos. Lapercepcin humana del color tambin difiere entre las distintas personas.Existen varios modelos de color para definir las propiedades de la gama de colores. Losms usados son: RGB y CMYKRGB son las siglas en ingls de rojo, verde y azul y es el modelo que se utiliza enmonitores y escneres. Se trata de simular una amplia gama de colores mediante lacombinacin de diferentes cantidades de luz roja, verde y azul. Cada uno de estos trescolores se define como un canal de color y sobre un monitor de 24-bit, cada canal tiene8 bits que representan 256 tonalidades. En 1996 se cre para Internet un estndarespecial de RGB, llamado sRGB y es el que se utiliza a menudo tanto para losmonitores como para los escneres, cmaras digitales e impresoras. Si embargo, se hacriticado que sea un sistema demasiado limitado y que no pueda reproducir todos loscolores. Por esto, es importante antes de adquirir un sistema de reproduccin digital(cmara o escner) tener en cuenta si esta limitacin es de vital importancia en relacincon los resultados que queremos obtener en el proyecto de digitalizacin.El modelo CMYK se basa en los colores cin, magenta, amarillo y negro. Se basa en elprincipio de que todos los objetos absorben una cierta longitud de onda a partir delespectro de la luz y que siempre reflejan una longitud de onda opuesta. Los sistemas 32
  • 33. de impresin y fotografa se basan en el modelo CMYK que tambin se conoce comosubtractivoA principios de los aos 90 un consorcio de empresas crearon el ICC (ConsorcioInternacional del Color) con el objetivo de desarrollar sistemas de gestin del colorconsensuado y normalizado. El perfil normalizado del ICC se puede utilizar condiferentes sistemas operativos e implementarse en imgenes de color. Sin embargo, notodos los sistemas de gestin de imgenes de color soportan el sistema deimplementacin de ICC.Ejemplos de modelos en uso para la reproduccin en color y escala de grises Kodak Color Separation Guide and Gray Scale (Q13 an Q 14) Kodac Q-60 Color input Target (IT8) RIT Process Ink Garmut Chart2.2.2.4 RuidoEn el contexto que nos ocupa el ruido puede asemejarse a las fluctuaciones de laintensidad de la luz en una imagen que no se encuentran en el documento fuente. Enlos sistemas de digitalizacin el ruido, a menudo, tiene su origen en la unidad de CCD yen los componentes electrnicos asociados. El ruido se mid e normalmente calculandola desviacin normal de los valores del nmero de pxels sobre cierta parte deldocumento como una ratio del nivel de ruido. El aumento de la desviacin y el aumentodel ruido reduce la calidad de la imagen. En la actualidad existen programas de gestinde la imagen que miden el ruido.2.2.2.5 ObjetosEl polvo, los rayajos y las manchas constituyen ejemplos de elementos que puedentener un impacto en la calidad de una imagen. Todos ellos crean una visible fluctuacinno aleatoria en la intensidad de la luz, aunque el modo en el que esto afecta a la calidadde la imagen difiere dependiendo del resultado que se quiera obtener. En la mayora delos casos es suficiente con usar programas que detectan estos elementos, aunque aveces es necesario examinarlos visualmente.2.2.3 Control de la calidad del monitorExisten muchos elementos particulares que pueden influir en la calidad de la imagencuando esta se visualiza. En primer lugar, la pureza del color y el brillo varan entre elcentro y las esquinas de la pantalla. En segundo lugar, la eleccin de una pantalla LCD(pantalla de cristal lquido) o CRT (tubo de rayos catdicos) puede tener sus efectos;esta ltima se considera todava la mejor cuando visualizamos la imagen. En tercerlugar, la gestin del color necesita una regulacin continua del monitor de acuerdo conalgn estandar (el perfil normalizado ICC, vase ms arriba). Las herramientas decalibrado estn a menudo incluidas en los programas de aplicacin. Calibrar un monitor 33
  • 34. significa ajustar dos valores: la intensidad de la luz del monitor (gama) y el llamadopunto blanco (cuando los tres canales de color rojo, verde y azul estn iluminados). Elvalor de la gama debe ajustarse en 1.8-2.2 y el punto blanco (temperatura color) serun blanco fro (5000 kelvin). Deberamos tener en cuenta que el ajuste de los citadosvalores, que son los ideales para la evaluacin de la calidad de la imagen, quizs nosean los ptimos para la visualizacin por parte de los usuarios.2.2.3.1 Condiciones de visualizacinLa evaluacin de las imgenes siempre necesita un sistema de control. Tambin esimportante adaptar este sistema a los requisitos de visualizacin, que difieren entre lasnecesidades del monitor y de los documentos originales. Los monitores se ven mejorcon una luz tenue, aunque no en habitaciones oscuras, y los documentos originales conuna luz ms intensa. Los efectos adicionales como los reflejos pueden afectar a laevaluacin y por consiguiente deben ser minimizados, por ejemplo utilizando un fondoneutro (gris) y colores neutros (gris, negro, blanco) en la vestimenta de los operadores.Recomendaciones para el control de calidadLas condiciones para la calidad de la imagen digital se pueden describir en tres etapas Identific acin de los productos finales deseados y de los propios fines de la digitalizacin. Decida qu es lo que quiere producir y cundo Establecimiento de normas. Defina niveles aceptables de calidad de las imgenes digitales basados tanto en las caractersticas de los documentos originales como en las prestaciones del sistema de digitalizacin de imgenes que se vaya a utilizar Decisin sobre los puntos de referencia. Decida con qu se van a comparar los productos de salida del proceso de digitalizacinDependiendo de estas decisiones, hay que seleccionar lo que deberan incluir losprogramas de control de calidad (imgenes aisladas o la coleccin completa deimgenes; todo tipo de ficheros; facsmiles en papel, otros productos intermedios).Decida sobre los m todos de evaluacin de los productos digitales que se obtengan,utilizando tanto la evaluacin en pantalla como en los productos impresos y empleandolos modelos de referencia disponibles para el color y la escala de grises, la resolucin,los modelos par a la evaluacin del ruido y los sistemas de deteccin de objetos.Calibre regularmente los monitores sobre los que se va a llevar a cabo la evaluacin yminimice los efectos adicionales en el entorno de visualizacin2.3 Gestin de la coleccin 34
  • 35. La posibilidad de poder utilizar una coleccin de imgenes digitales de la maneraprevista no solo depende de las normas de conversin y de los controles de calidadsino tambin de cmo se gestione la coleccin. Si el objetivo no es solo satisfacer lasnecesidades a corto plazo sino adems proporcionar acceso a lo largo del tiempo,deben tomarse medidas para satisfacer tanto el uso actual como las expectativas de losfuturos usuarios.Deben hacerse planes, por ejemplo, para:- escanear las imgenes de la manera adecuada para el ltimo uso previsto- actualizar la distribucin de imgenes y la funcionalidad de la interfaz de usuario.- transferir las imgenes a nuevas plataformas tcnicas para conseguir una capacidad de procesamiento y manejo creciente de la informacin digital.- migrar las imgenes digitales a nuevos formatos de fichero o a nuevos soportes fsicos para asegurar el acceso a largo plazo.Para que puedan utilizarse las imgenes escaneadas debe prestarse mucha atencin asu almacenamiento. Todos los ficheros de imgenes producidos como resultado de unproyecto de digitalizacin deben organizarse, nombrarse y describirse de maneraadecuada a los objetivos del proyecto.2.3.1 Organizacin de las imgenesAntes de tomar en consideracin un nombre y una descripcin de un fichero de imagendebe decidirse cmo va a almacenarse. Por lo general, los documentos originales quese escanean se organizan fsicamente de acuerdo con principios de ordenacinarchivstica o bibliotecaria. Los fondos de los documentos se suelen dividir en series,volmenes y publicaciones y las colecciones de manuscritos y las fotografas estnnumeradas.La manera ms fcil de manejar esta cuestin es trasladar los principios fundamentalesde la organizacin fsica de los documentos originales a una jerarqua lgica del discodel ordenador. Esto deber llevarse a cabo hasta donde sea posible de acuerdo con lossistemas normalizados existentes. Es importante asegurar que las estructuras de losnombres de los ficheros de las diferentes plataformas tcnicas sean compatibles.Tambin ha de ser posible el crecimiento de la coleccin de los ficheros de imgenes y,adems, la manera de organizarlos debe ser escalable.2.3.2 Nombres de las imgenesLos ordenadores no son capaces por s solos de interpretar las relaciones lgicas deuna coleccin de documentos originales como, por ejemplo, las secuencias de las 35
  • 36. carpetas y de las pginas. Por tanto, debe reflejarse el modo por el que se nombran losficheros de las imgenes escaneadas. Existen dos procedimientos para ello: (1) utilizarun esquema de numeracin que refleje los nmeros que se hayan usado en un sistemade catalogacin previo, o (2) utilizar nombres de ficheros significativos. Ambosprocedimientos son vlidos y debe elegirse el que mejor convenga a una coleccin ogrupo determinados de documentos originales.Un proyecto de digitalizacin tambin debe adoptar convenciones para los nombres,para las tablas de signos y para las reglas relativas, por ejemplo, a la puntuacin y aluso de letras maysculas. Es importante que estas convenciones sean uniformes. Unvocabulario normalizado es una de las piedras angulares de la gestin de una coleccinde imgenes digitales.Cuando se nombran los ficheros de imgenes tambin son importantes las extensionesdel fichero. Muchas de ellas tienen significados normalizados y su uso se encuentrageneralizado, pero debe tenerse cuidado si se trata de extensiones no normalizadas.Puede encontrarse una lista de las extensiones ms comunes en Webopedia, unaenciclopedia en lnea relacionada con la tecnologa informtica.http://webopedia.internet.com/TERM/f/file_extension.html2.3.3 Descripcin de las imgenesPara describir imgenes digitales son necesarios lo metadatos que son datosestructurados acerca de los datos. Los metadatos tambin pueden definirse como datosque facilitan la gestin y el uso de otros datos. Esto no es algo nuevo para archiveros ybibliotecarios. El uso de metadatos se e ncuentra estrechamente relacionado con lasreglas de descripcin y catalogacin de publicaciones impresas , documentos dearchivos y artefactos. La diferencia es que en el mundo digital se necesitan categorasadicionales de metadatos para soportar la navegacin y la gestin de los ficheros dedatos. Los metadatos para la descripcin de imgenes digitales pueden incluir distintostipos de informacin. El proyecto Making of America II de la Biblioteca del Congresoidentificaba en 1998 tres categoras de metadatos: Metadatos descriptivos para la descripcin e identificacin de los recursos de informacin Metadatos estructurales para la navegacin y la presentacin Metadatos administrativos para la gestin y el procesoEstas categoras no siempre tienen lmites claramente definidos y con frecuencia sesolapan. La Universidad de Cornell en su tutorial de imgenes digitales Moving theoryinto practice presenta para cada categora objetivos sumarios, elementos y ejemplosque aparecen en un ndice que ofrece u buena visin del concepto de metadatos. naVase en:http://www.library.cornell.edu/preservation/tutorial/metadata/metadata-01.htmlNo obstante, cada proyecto de digitalizacin debe elegir una solucin de metadatosbasada en sus propios objetivos. 36
  • 37. 2.3.4 Uso de los metadatosDos son los principales procedimientos para las soluciones de metadatos: las tcnicasde gestin de datos y la codificacin del documento.2.3.4.1 Tcnicas de gestin de datosEl nivel de los metadatos descriptivos determina siempre el nivel o las posibilidades derecuperacin. Adems, tiene una importancia crucial desde el mismo momento en quese inicia un proyecto de digitalizacin decidir el nivel ms profundo al que podrnbuscarse las imgenes digitales. Adems, deben tenerse en cuenta los metadatosexistentes como instrumentos de bsqueda, ndices, etc. y, si se consideraconveniente, deben vincularse a los ficheros de imgenes.Tambin debe considerarse, si se pueden adaptar los metadatos generados en elproceso de conversin digital y cmo. Actualmente, el formato TIFF (Tagged image fileformat) es el formato de fichero ms comn para almacenar los master de las imgenesdigitales. En TIFF, y tambin en otros formatos grficos como GIF, el software utilizadopor el escner genera de manera automtica unas etiquetas con informacin tcnica yadministrativa que se registra en la cabecera del fichero o, dicho en otros trminos,directamente en el propi o fichero. La informacin de la cabecera TIFF se almacena enformato ASCII y, en este sentido, constituye una plataforma independiente.La prctica de registrar los metadatos en la cabecera del formato TIFF se encuentramuy extendida y sus ventajas son obvias: asegura una estrecha relacin entre eldocumentooriginal, el proceso de conversin y el fichero de la imagen resultante de laconversin.La construccin de colecciones de imgenes digitales significa igualmente que debellevarse a cabo un esfuerzo para hacerlas accesibles a los usuarios. Las bibliotecas detodo el mundo han utilizado durante dcadas el formato MARC (Machine ReadableCataloging) como un estndar de metadatos, pero otros sectores culturales no lo hanadoptado. La Dublin Core Metadata Initiative present, a principios de los aos 90, unconjunto de 15 elementos de metadatos descriptivos para satisfacer las nuevasdemandas de recuperacin, inicialmente para la Web. Se pretende que estos elementossean simples, internacionales e intersec toriales. Dublin Core es actualmente uno de losestndares de metadatos ms ampliamente aceptados en el mundo.2.3.4.2 Codificacin del documentoActualmente muchos proyectos y programas digitales utilizan SGML (StandardGeneralized General Markup Language) o partes de SGML como XML (eXtensibleMarkup Language). El objetivo es agrupar las imgenes y proporcionar acceso aelementos estructurales de objetos individuales o de colecciones completas. Lacodificacin de documentos tambin puede utilizarse en aquellos sistemas en los quelos datos se toman de bases de datos de menor nivel y se transforman enrepresentaciones normalizadas para el intercambio. 37
  • 38. SGML presenta algunas desventajas. Por ejemplo, muchas aplicaciones de software nolo soportan y XML se utiliza cada vez ms como lenguaje de marcado. Una iniciativabien conocida que utiliza SGML es TEI (Text Encoding Initiative) que ha desarrolladoDTDs (Document Type Definitions) para codificar textos individales en el campo de lashumanidades. La iniciativa Encoded Archival Description (EAD) ha desarrollado unaDTD para codificar instrumentos de bsqueda que permiten codificar colecciones dearchivo completas o ejemplare.Recomendaciones para la gestin de la coleccinOrganice jerrquicamente los ficheros de las imgenes escaneadas en undisco que corresponda lgicamente a la organizacin fsica de los documentosNombre los ficheros escaneados de una manera estrictamente controlada querefleje sus relaciones lgicasDescriba los ficheros de las imgenes escaneadas internamente (utilizando laimagen de la cabecera del fichero) y externamente (utilizando ficheros demetadatos descriptivos vinculados) 38
  • 39. Construccin de un entorno de trabajo para un proyecto de digitalizacinLlevar a cabo un proyecto de digitalizacin significa establecer un equilibrioentre las necesidades de los usuarios reales y potenciales, la infraestructuratecnolgica utilizada por el proyecto y los recursos financieros y humanosdisponibles. Adems, las posibilidades tecnolgicas de las estaciones detrabajo y dispositivos de captura de imgenes (escneres o cmaras digitales,sistemas operativos, memoria interna, almacenamiento, calidad devisualizacin, capacidad de las redes y velocidad) deben estar claras antes deiniciar el proyecto as como los medios para presentar los datos de lasimgenes a los usuarios.El anlisis de las necesidades tcnicas de un proyecto de digitalizacin se llevaa cabo por lo general en el marco de un proyecto piloto o estudio. Esteproporciona al proyecto la posibilidad de investigar a pequea escala laviabilidad de 1) realizar sus planes y 2) introducir la tecnologa digital en unabiblioteca o en un archivo si se trata del primer proyecto de digitalizacin de lainstitucin.Las necesidades tcnicas se centran fundamentalmente en el hardware y en elsoftware, factores ambos dinmicos en el desarrollo del futuro previsible.Aunque cualquier lista de requisitos mnimos se queda casi inmediatamenteobsoleta y adems debe ser bastante general, el siguiente paquete bsico detecnologas de la informacin y de la comunicacin debera ser suficiente parallevar a cabo un proyecto de digitalizacin a un nivel bsico:- Un PC de nivel normal (Procesador Intel Pentium o similar) con las siguientes caractersticas adicionales:- como mnimo memoria de acceso aleatorio (RAM) dos veces mayor que la recomendada para los requisitos de oficina habituales. El tipo de memoria RAM debe ser tambin como mnimo Dinmica Sincronizada (SDRAM)- como mnimo 1 Gigabyte libre de espacio adicional en la memoria del disco duro al que se necesita para el software y el sistema operativo instalado (Windows o similar). El procesado de imgenes necesita mucha memoria y largos retrasos afectan negativamente a la productividad- Un CD-Writer, perifrico esencial para proporcionar el soporte para copiar el producto digital en CD-ROMs, especial