1. DIRECTRICES PARA PROYECTOS DE DIGITALIZACIN de colecciones y
fondosde dominio publico, en particular para aquellos custodiados
en bibliotecas yarchivos Marzo de 2002Estas directrices son el
resultado del trabajo de un grupo de expertos de IFLA e
ICA(International Council on Archives) invitados a elaborarlas por
la UNESCOLos miembros del grupo de trabajo fueron:. John MacIlwaine
(IFLA, Presidente). Jean-Marc Comment (ICA). Clemens de Wolf
(IFLA). Dale Peters (IFLA). Borje Justrell (ICA). John MacIlwaine
(IFLA). Marie-Thrse Varlamoff (IFLA). Sjoerd Koopman (IFLA,
Secretario)Traducidas por el grupo de trabajo de colecciones
digitales de las ComunidadesAutnomas y el Ministerio de Cultura:.
Ana Isabel Cmara (Asturias). Alejandro Carrin (Castilla y Len).
Laura Cerezo (Andaluca). Jaime Chiner (Valencia). Beln Daz
(Extremadura). Elena Garca-Puente (Ministerio de Cultura). Juan
Francisco Elizari (Navarra). Jos Luis Gonzlez (Xunta de Galicia).
Carmen Jimnez Martnez (La Rioja). Mara Luisa Martnez -Conde
(Ministerio de Cultura). ngel Pealver (Murcia). Elvira Permanyer
(Catalua). Mara de la Villa (Madrid) 1
2. DIRECTRICES PARA PROYECTOS DE DIGITALIZACIN de colecciones y
fondosde dominio publico, en particular para aquellos custodiados
en bibliotecas yarchivosTabla de contenidosPrlogoINTRODUCCIN1.
SELECCIN 1.1 Principales razones para la digitalizacin 1.1.1 Para
mejorar el acceso 1.1.2 Para facilitar nuevas formas de acceso y
uso 1.1.3 Para la preservacin 1.2 Criterios de seleccin 1.2.1
Contenido 1.2.2 Demanda 1.2.3 Estado fsico2. REQUISITOS TCNICOS E
IMPLEMENTACIN 2.1 Conversin 2.1.1 Los atributos de los documentos
2.1.2 Calidad de la imagen 2.1.2.1 Resolucin 2.1.2.2 Profundidad
del bit 2.1.2.3 Procesos de optimizacin de la imagen 2.1.2.4
Compresin 2.1.2.5 El equipo utilizado y su funcionamiento 2.1.2.6
Criterio y cuidado del tcnico 2.2 Control de calidad 2.2.1
Principios bsicos de un programa de control de calidad 2.2.1.1
Objetivo 2.2.1.2 Mtodos 2.2.2 Control de calidad del escner 2.2.2.1
Resolucin espacial 2.2.2.2 Reproduccin tonal 2.2.2.3 Reproduccin
del color 2.2.2.4 Ruido 2.2.2.5 Objetos 2
3. 2.2.3 Control de calidad del monitor 2.2.3.1 Condiciones de
visualizacin2.3 Gestin de la coleccin2.3.1 Organizacin de las
imgenes2.3.2 Nombres de las imgenes2.3.3 Descripcin de las
imgenes2.3.4 Uso de los metadatos2.3.4.1 Tcnicas de gestin de
datos2.3.4.2 Codificacin del documento3. ASPECTOS LEGALES 3.1
Derechos de autor 3.2 Autenticidad 3.3 Gestin de la propiedad
intelectual 3.4 Depsito legal4. PRESUPUESTO 4.1 Recuperacin de los
costes 4.2 reas de gasto 4.2.1 Formacin del personal 4.2.2 Gestin
de las instalaciones 4.2.3 Gastos operativos 4.2.3.1 Seleccin y
preparacin de los materiales originales para la digitalizacin
4.2.3.2 Conversin digital 4.2.3.3 Captura de los metadatos 4.2.3.4
Gestin de los datos 4.2.4 Gestin de almacenamiento y sistemas de
entrega5. PLANIFICACIN DE LOS RECURSOS HUMANOS 5.1 Gestin del
cambio 5.2 Formacin de la capacidad 5.3 El compromiso social 3
4. 6. DESARROLLO Y MANTENIMIENTO DE LAS INTERFACES WEB 6.1
Desarrollo del contenido digital 6.2 Formacin de un equipo web 6.3
Produccin y gestin de la web 6.3.1 Directrices para la produccin de
la web 6.3.1.1 Estructura de los ficheros y carpetas 6.3.1.2
Convenciones para nombrar ficheros 6.3.1.3 Disposicin y diseo de la
pgina 6.3.1.4 Grficos adaptados a la web 6.3.1.5 Requisitos mnimos
6.3.1.6 Mantenimiento de la web 6.4 Introduccin de servicios
basados en la web 6.4.1 Indizacin del contenido digital 6.4.2
Gestin del acceso 7. PRESERVACIN DEL CONTENIDO DIGITAL 7.1 Retos de
la preservacin 7.1.1 Apoyo tcnico 7.1.2 Obsolescencia tecnolgica
7.2 Desarrollo de la poltica desde el punto de vista de la captura
7.3 Normativa internacional 7.4 Modelos no propietarios 7.5 Gestin
de un fichero consolidado 7.6 Repositorio digital fiable8. GESTIN
DEL PROYECTO8.1 Redaccin de la propuesta8.1.1 Introduccin8.1.2
Visin y misin8.1.3 Evaluacin de las necesidades8.1.4
Actividades8.1.5 Indicadores de rendimiento8.1.6 Personal
responsable8.1.7 Calendario 4
5. 8.2 Estimacin de costes8.2.1 Costes operativos8.2.2 Costes
organizativos8.2.3 Costes de personal8.3 Gestin del ciclo de
digitalizacin8.3.1 Material original8.3.2 Gestin de datos8.3.3
Estndares para las imgenes8.3.4 Alcance de los metadatos8.3.5
Sistemas de presentacin8.4 Gestin de los flujos de
actividadAPNDICES A. Bibliografa B. Organizaciones significativas
relacionadas con la normativa y las buenas prcticas C. Glosario de
trminos y abreviaturasAPNDICES A LA TRADUCCIN ESPAOLA A. Borrador
de pliego de prescripciones tcnicas para la digitalizacin de
colecciones de patrimonio bibliogrfico B. Borrador de pliego de
prescripciones tcnicas para la digitalizacin de prensa histrica C.
Borrador de pliego de prescripciones tcnicas para la digitalizacin
de prensa moderna D. Ejemplos de proyectos digitales existentes en
EspaaPRLOGOEstas pautas han sido elaboradas por un grupo de trabajo
que representa a IFLA e ICAal que la UNESCO encarg establecer unas
directrices para programas de digitalizacinde colecciones y fondos
de dominio pblico. El contrato especificaba que las
directricesdeberan ser, en la medida de lo posible, especialmente
aplicables por las instituciones 5
6. de los pases en vas de desarrollo. Los miembros del grupo
fueron designados porIFLA e ICA y sus actividades fueron
coordinadas por Sjoerd Koopman, Coordinador deActividades
Profesionales de IFLA.El grupo fue consciente desde el principio de
que ya existen muchas publicaciones ysitios web que ofrecen
informacin y recomendaciones en el campo de la digitalizacin.Los
han producido instituciones pblicas y privadas o de forma
cooperativa, bibliotecas,archivos, organismos de normalizacin,
fabricantes comerciales, etc. Algunos son decarcter general en
cuanto a sus objetivos, otros consisten bsicamente en una relacinde
las decisiones tomadas por una institucin determinada as como de
los programasseguidos por dicha institucin. Son pocos los que han
surgido en los pases en vas dedesarrollo, o los que prestan mayor
atencin a las cuestiones especficas de dichospases.La lgica seguida
por el grupo de trabajo fue la de no duplicar los textos
existentes, sinoms bien ofrecer una sntesis de la informacin
disponible, basndose tanto en lasfuentes publicadas como en las
actuaciones de proyectos especficos, avalados por laexperiencia
personal de los miembros del grupo por su implicacin en dichos
deproyectos. Se trata de un resumen de los mejores conocimientos y
prcticas existentesa nivel internacional.Por lo tanto, estas
directrices identifican y discuten las cuestiones clave relativas a
laconceptualizacin, planificacin e implementacin de un proyecto de
digitalizacin, conrecomendaciones de buenas prcticas que deben
seguirse en cada una de las etapasdel proceso. Se ha hecho un
esfuerzo especial para tomar en consideracin lascircunstancias
especficas de los pases en vas de desarrollo. Cada una de las
ochosecciones comprende una introduccin que presenta el contexto e
identifica lascuestiones relevantes, seguido de un texto que
discute con ms detalle las cuestiones yactuaciones que deben
llevarse a cabo y termina con una o ms secciones de texto enun
recuadro que incluye un resumen de las principales recomendaciones.
Como seindica en la introduccin, su alcance solo se refiere al
patrimonio documental basado enpapel, esto es, manuscritos, libros
impresos y fotografas. No incluye las cuestionesespeciales
relativas a los registros sonoros o pelculas, que se tratarn en
otro conjuntode directrices patrocinadas por el Programa Memoria
del Mundo de la UNESCO.Desde luego el grupo reconoce que es posible
que ningn conjunto nico derecomendaciones sea capaz de satisfacer
plenamente las necesidades y circunstanciasespecficas de cada
institucin. Es tambin muy consciente de que se trata de uncampo que
cambia muy rpidamente por los nuevos desarrollos que
experimentanconstantemente las tecnologas correspondientes y por la
consiguiente respuesta de losprofesionales a dichos desarrollos.
Por consiguiente, el grupo espera que estasdirectrices no se
consideren simplemente como un compartimento estanco sino
querepresentan una pasarela a informacin complementaria. En cada
seccin seproporcionan extensas listas de referencias que se
consolidan en una lista ms ampliaen los Apndices, junto con URLs de
listas de discusin abiertas y otras fuentes deinformacin
actualizada. Hay tambin URLs de instituciones relevantes en los
campos 6
7. de las bibliotecas, los archivos, de las comunicaciones y de
la normalizacin y deproyectos actuales de digitalizacin.Los
miembros del grupo de trabajo fueron:Jean-Marc CommentClemente de
WolfDale PetersBorje JustrellJohn McIlwaineMarie-Thrse
VarlamoffJohn McIlwaine, Presidente, marzo de 2002 7
8. INTRODUCCINLa tecnologa digital abre una perspectiva
totalmente nueva. La www mantiene millonesde sitios web e Internet
es el lugar de mercado para la investigacin, la enseanza,
laexpresin, la publicacin y la comunicacin de la informacin. Las
bibliotecas y losarchivos son proveedores de informacin primaria
para la sociedad y fueron usuarios dela nueva tecnologa digital
primero en relacin con la catalogacin y la gestin de losprocesos, y
ms tarde para proporcionar informacin sobre sus colecciones a
lacomunidad de la www. Adems de preservar y proporcionar acceso al
material nacidodigital, en la actualidad un gran nmero de archivos
y bibliotecas han iniciado tambinla creacin de copias digitales de
sus recursos ya existentes. Para dichas bibliotecas yarchivos se
han redactado estas directricesDefinicinEstas son Directrices para
emprender proyectos de digitalizacin de colecciones yfondos de
dominio pblico, en particular para aquellas colecciones custodiadas
enbibliotecas y archivos. Tratan del patrimonio documental en
papel, manuscritos, librosimpresos y fotografas, y no de registros
sonoros ni de pelculas, objetos omonumentos. Hacen referencia a la
planificacin y establecimiento de proyectos, esdecir, a la
seleccin, gestin y procesos de produccin implicados en dichos
proyectosen actividades bien definidas, financiadas
independientemente y que se llevan a cabonormalmente a corto plazo,
y no a programas que forman parte de la misin oestrategia de una
institucin.Por qu unas directrices? Muchas bibliotecas y archivos
desearan planificar proyectos de digitalizacin pero carecen de
experiencia. Es necesaria una gua prctica como herramienta de
trabajo para la planificacin de proyectos de digitalizacin. Esta
necesidad es particularmente importante en los pases en vas de
desarrolloUNESCOEstas Directrices se enmarcan en de la estrategia
de la UNESCO del conocimiento paratodos. Tambin tienen una estrecha
relacin con el Programa Memoria del Mundo dela UNESCO cuyo objetivo
es la salvaguarda del patrimonio documental internacional, elacceso
democrtico a dicho patrimonio, el conocimiento creciente de su
significado y lanecesidad de preservarlo. 8
9. Pblico objetivoEstas Directrices se dirigen a quienes toman
decisiones, a los gestores de bibliotecas yarchivos, conservadores
y personal tcnico, en particular a aquellos de las institucionesde
los pases en vas de desarrollo.Por qu digitalizar?La razn de la
implementacin de un proyecto de digitalizacin, o ms exactamente
dela conversin digital de documentos originales no digitales son
variadas y puedensolaparse. La decisin de digitalizar puede tomarse
con objeto de: Incrementar el acceso: esta es razn principal y la
ms obvia, cuando se sabe que hay una alta demanda por parte de los
usuarios y la biblioteca o el archivo desean mejorar el acceso a
una determinada coleccin Mejorar los servicios para un grupo
creciente de usuarios proporcionando un acceso de mayor calidad a
los recursos de la institucin en relacin con la educacin y la
formacin continua Reducir la manipulacin y el uso de materiales
originales frgiles o utilizados intensivamente y crear una copia de
seguridad para el material deteriorado como libros o documentos
quebradizos Ofrecer a la institucin oportunidades para el
desarrollo de su infraestructura tcnica y para la formacin tcnica
de su personal Impulsar el desarrollo de recursos cooperativos,
compartiendo intereses comunes con otras instituciones para crear
colecciones virtuales e incrementar el acceso a nivel internacional
Buscar intereses comunes con otras instituciones para rentabilizar
las ventajas econmicas de un enfoque compartido. Aprovechar las
oportunidades financieras, como, por ejemplo, la posibilidad de
asegurar una inversin para implementar un programa, o un proyecto
concreto capaz de generar un beneficio significativo.Debe estar
claro por qu se embarca uno en un proyecto de digitalizacin: el
objetivodeterminar el proceso y los costes. Puesto que la
digitalizacin supone un trabajointenso y caro (vase el captulo 4)
es importante capturar una imagen de modo quesea posible utilizarla
para satisfacer diferentes necesidades 9
10. Antes de empezar, pregnteseEst el proyecto? Dirigido por el
usuario: alta demanda de acceso (mejorado) Dirigido por la
oportunidad: dinero disponible y por tanto puede llevarse a cabo
Dirigido por la preservacin: alta demanda de materiales frgiles
Dirigido por los beneficios: podemos obtener dinero de el. Tenemos?
El dinero Las herramientas La capacidad La infraestructura tcnica
Lleve a cabo Un estudio de rendimiento Un estudio de los derechos
de propiedad intelectual Un estudio de viabilidad Un estudio tcnico
pilotoElementosLos elementos clave de un proyecto de digitalizacin
son: Poltica de seleccin Conversin Programa de control de calidad
Gestin de la coleccin 10
11. Presentacin Mantenimiento del acceso a largo plazoTodos
estos elementos tienen la misma importancia -la cadena no es ms
fuerte que sueslabn son ms dbil.Tomar la decisinLas tecnologas
digitales estn sometidas a un rpido y continuo desarrollo y
muchascuestiones no estn resueltas suscitando una engaosa confianza
en el enfoqueesperar y mirar. La base para emprender la
digitalizacin es el reconocimiento de quela tecnologa cambiar y que
cambiar con frecuencia. Por lo tanto la decisin crucialno tiene que
ver con cuando comenzar o si comenzar. Ms bien es cuestin de si
lainstitucin puede permitirse despreciar la oportunidad de
conseguir una ms ampliaaudiencia en una comunidad global, de la
manera que permite la tecnologa paramejorar el acceso y la
preservacin de los recursos culturales y de investigacin.La
digitalizacin ser una tarea costosa, que requiere una planificacin
detallada y elestablecimiento de una infraestructura que asegure el
acceso continuo a los ficherosdigitalizados. En especial las
instituciones de los pases en vas de desarrollo tendrnque
considerar si el coste y el tiempo invertido se compensarn con los
beneficios.Dichas instituciones deberan estar preparadas, por
ejemplo, para oponerse al apoyode la implementacin de un proyecto
de digitalizacin por parte de organismosdonantes externos, cuando
los anlisis muestren, por ejemplo, que el uso del microfilmpodra
ser adecuado, incluso preferible.UsuariosObviamente el usuario
juega un papel importante en la decisin de poner en marcha
unproyecto, pero con mucha frecuencia es difcil definir cul es ese
papel. De hecho lasnecesidades especficas de los usuarios pueden
ser difciles de conocer. En la mayorade los casos existe un
supuesto grupo de usuarios, y el objetivo de la institucin
esincrementar sus servicios y extender su enfoque e influencia. El
grupo de usuariospuede diferir, dependiendo del tipo de institucin
y de la misin de la organizacin. Lasinstituciones de educacin
superior satisfacen las necesidades de su personal docentey de los
estudiantes. Las instituciones pblicas y nacionales deben
satisfacer a unapoblacin mayor y ms diversificada. Esto influye no
slo en la seleccin sino tambinen las formas de presentacin y acceso
(la interfaz del usuario).PreservacinDigitalizacin no es lo mismo
que preservacin: la digitalizacin no es ms barata, mssegura, ni ms
fiable que la microfilmacin. A diferencia de un fotograma de
unmicrofilm de alta calidad, una imagen digital no es un master de
preservacin. La nicamanera en la que la conversin digital
contribuye positivamente a la preservacin escuando la copia digital
reduce el desgaste y la rotura del original, o cuando los ficheros
11
12. estn escritos como salida de ordenador en microfilm, que
cumple los estndares depreservacin de calidad y perdurabilidad. Por
lo tanto, un proyecto de digitalizacin nosustituye a un programa de
preservacin basado en la conversin a microfilm (o
dedesacidificacin, de un tratamiento de conservacin o de mejora de
las condiciones dealmacenamiento).En general todo ello es cierto.
Pero puede haber circunstancias especficas, porejemplo en los pases
en vas de desarrollo, que pueden cambiar la base de
esteplanteamiento. Si una institucin sin ninguna experiencia ni
facilidad para laconservacin quiere preservar una determinada
coleccin, puede decidir invertir enequipos de digitalizacin en
lugar de en equipos de microfilmacin, evitando de estemodo el
elevado gasto en cmaras y procesadores de microfilmacin y
reconociendoque este equipamiento digital y el desarrollo de los
conocimientos de su personalsatisfarn igualmente otros objetivos.
Este cambio de la microfilmacin como mtodogeneralmente recomendado
de preservacin por el de la digitalizacin con sus riesgosa largo
plazo no es quizs la solucin ideal para el problema de la
descomposicin delpapel de los siglos XIX y XX, pero puede servir
como un modo prctico de proporcionarproteccin a ciertos
documentos.Las tecnologas digitales ofrecen un nuevo paradigma de
preservacin. Ofrecen laoportunidad de preservar el original
proporcionando acceso a la copia digital; deseparar el contenido
informativo de la degradacin del soporte fsico. Adems lastecnologas
digitales liberan la gestin de la preservacin de las limitaciones
de lasprecarias condiciones medioambientales de almacenamiento
tpicas de los climastropicales y subtropicales en los que se sitan
muchos pases en vas de desarrollo.Ahorrar costesLa digitalizacin no
produce un ahorro del coste de la gestin de la coleccin. Una
copiadigital nunca puede sustituir al documento u objeto original.
Si una institucin quiereahorrar espacio no permitiendo el acceso a
la prensa deteriorada, hara mejor creandouna copia en microfilm que
imgenes digitales (e incluso mejor no desechando nuncalas copias de
la prensa microfilmada).El proceso completo, seleccin, escaneo,
creacin de registros, etc. requiere una graninversin y el
mantenimiento a largo plazo de los equipos digitales tiene sus
propiosaltos costes. Una institucin puede desear investigar las
posibilidades de recuperar lainversin realizada mediante la
comercializacin de las copias digitales. (vanse lasSecciones 3 y
4)Urgencia de construir depsitos digitalesLa conservacin de la
informacin digital es indudablemente cara y requiere un granequipo
tcnico de profesionales y equipamiento. 12
13. Las bibliotecas que se embarcan en solitario en proyectos
de digitalizacin deberanbuscar la cooperacin mediante acuerdos
regionales, nacionales e internacionales ydeberan concertar
acuerdos con depsitos adecuados (vase la Seccin 7)Otras decisiones
a tener en cuentaSi se utiliza un procedimiento de digitalizacin
que reproduzca la imagen o se utilizaOCR (reconocimiento ptico de
caracteres) o se teclea el texto original. Es probableque los
usuarios quieran textos recuperables, y esto significa OCR o
tecleado (en lamayora de los casos lo segundo ser ms barato que lo
primero, pero no hay ningunaregla fija y puede ser adecuada la
combinacin de ambos mtodos). Por otro lado,dependiendo del tipo de
usuarios y del tipo de texto muchos usuarios querrn tambinver las
imgenes de la pgina, y la experiencia del aspecto del original.
Esto puedellevarnos a la conclusin de usar ambos mtodos aunque en
la mayora de los casoseso puede suponer un coste prohibitivo. As,
la mejor solucin es elegir las imgenes dela pgina.Si se producen
ficheros digitales capaces de llevar a cabo el trabajo que
realizabantradicionalmente los servicios convencionales de
fotografa (como por ejemploimgenes para publicaciones
profesionales, muestras para exposiciones, etc.)Si se digitaliza
desde el original o desde el microfilm. La segunda opcin representa
elllamado sistema hbrido investigado particularmente por la
Universidad de Cornell y porel proyecto Open Book en la Universidad
de Yale.Lecturas recomendadasCOMMISSION ON PRESERVATION AND ACCESS.
Digiting imaging and preservationmicrofilm: the future of the
hybrid approach for the preservation of the books.Washington, DC,
1999. http://www.clir.org/pubs/archives/hybridintro.htmlCOUNCIL ON
LIBRARY & INFORMATION RESOURCES (2001). Building andsustaining
digital collections: models for libraries and museums. Washington,
DC.(Publication 100)
http://www.clir.org/pubs/reports/pub103/contents.htmlCOUNCIL ON
LIBRARY & INFORMATION RESOURCES (2001). The evidence inhand:
Report of the Task Force on the Artifact in Library Collections.
Washington DC.(Publication 103)
http://www.clir.org/pubs/reports/pub103/contents.htmlKENNEY, A. R.
& RIEGER, O. (2000). Moving theory into practice : digital
imaging forlibraries and archives . Mountain View, VA, Research
Libraries Group (RLG)SMITH, Abby (2001). Strategies for building
digitized collections . Washington, DC,Council on Library &
Information Resources (Publication
101)http://www.clir.org/pubs/reports/pub101/contents.html 13
14. SMITH, Abby (1999). Why digitise?. Washington, DC, Council
on Library & InformationResources (Publication 80)
http://www.clir.org/pubs/reports/pub80-smith/pub80.htmlRecursos
relacionadosBritish Library, U.K. Objectives of
digitisationhttp://www.bl.uk/about/policies/digital.htmCORNELL
UNIVERSITY. DEPARTMENT OF PRESERVATION 6 CONSERVATION.Moving theory
into practice: Digital Imaging
Tutorialhttp://www.library.cornell.edu/preservation/publications.html
(To accompany KENNEY, A. R.& RIEGER, O. (2000). Moving theory
into practice : digital imaging for libraries andarchives. Mountain
View, VA, Research Libraries Group (RLG) vase ms arriba)DIGITAL
LIBRARY FEDERATION. Digital Library Standards and
Practiceshttp://www.diglib.org/standardspv.htmLibrary of Congress.
American Memory una pasarela a materiales originales
primariosrelativos a la historia y a la cultura de los Estados
Unidos. El sitio ofrece ms de 7millones de documentos digitales de
ms de 100 colecciones histricas.http://memory.loc.govMemoria del
Mundo de la UNESCO
http://www.unesco.org/webworld/mdm/index.2htmlMemoria Virtual del
Mundo de la UNESCOhttp:///www.unesco.org/webworld/en/memoire.html
14
15. SELECCINAntecedentesEs importante entender la digitalizacin
como una serie de opciones en las queconcurren demandas y
requisitos que deben equilibrarse. Cuando se seleccionanmateriales
originales para su digitalizacin se presentan tres cuestiones
bsicas: si elmaterial original Necesita convertirse Debe
convertirse Puede convertirsePor lo tanto, la seleccin tiene que
orientarse de modo que se asegure que no solo seconsideren
cuestiones como el valor del material seleccionado y el inters de
sucontenido, sino tambin cuestiones relacionadas con la viabilidad
tcnica, los aspectoslegales y las circunstancias de las
instituciones.Las cuestiones implicadas en la seleccin de los
materiales que se van a digitalizar seexaminarn desde dos puntos de
vista: Principales razones para digitalizar (para mejorar el acceso
y/o la preservacin) Criterios de seleccin (basados en el contenido
o en las demandas)1.1 Principales razones para la
digitalizacin1.1.1 Para mejorar el accesoComo se ha indicado en la
Introduccin puede haber varias razones para incrementarel acceso:
La mejora del acceso a un fondo concreto de material de
investigacin La creacin de un nico punto de acceso a documentos de
distintas instituciones que se refieren a una determinada materia
La implementacin de una reunificacin virtual de colecciones y
fondos de procedencia nica, pero que en la actualidad se encuentran
muy dispersos (vase tambin, ms abajo, Colecciones virtuales) El
apoyo a consideraciones democrticas mediante la creacin de
registros pblicos ms ampliamente accesibles La ampliacin de la
disponibilidad de los materiales como apoyo a la educacin y a otros
proyectos de investigacin. 15
16. La clave est en evaluar qu puede aportar un acceso
generalizado a una comunidadde usuarios concretos. Si la institucin
que planifica un proyecto de digitalizacin esprivada, es normal que
lo enfoque a sus necesidades especficas y al grupo de usuariosque
es su objetivo. Sin embargo, si se trata de una institucin pblica
deber satisfacera una poblacin mayor y demandas ms
diversificadas.La manera en que se pretenda utilizar la
digitalizacin es de vital importancia para ladeterminacin de los
requisitos tcnicos. Por ejemplo, la cantidad de informacincapturada
en la conversion digital limitar la usabilidad de las imgenes
digitales (vasela Seccin 2)1.1.2 Para facilitar nuevas formas de
acceso y usoEl propsito principal en este caso es posibilitar el
uso de materiales (manuscritos yarchivos, mapas, objetos musestic
os, libros raros originales, etc.): Cuyos originales solo pueden
consultarse visitando sus depsitos especficos. que se han
deteriorado y necesitan apoyo tecnolgico para mostrar su contenido
o forma (recuperacin de datos) de un modo ms fcil y productivo que
utilizando herramientas avanzadas de ordenador como OCR
(Reconocimiento ptico de Caracteres) o codificacin del texto para
textos convertidos.En estos casos el inters debe centrarse
principalmente en como aadir valor almaterial original y no en la
digitalizacin como tal. A veces los costes y las
limitacionestcnicas facilitarn la utilizacin de soluciones
distintas a la digitalizacin o solucioneshbridas en las que
intervengan ambas, la digitalizacin y la microfilmacin.1.1.3 Para
la preservacinSi se trata de la conversin digital de materiales que
estn en peligro o daados, elobjetivo es, en primer lugar, la
creacin de reproducciones exactas de estos originalesen un soporte
de larga duracin y no la seleccin de materiales de a cuerdo con
lademanda. Estas reproducciones deben satisfacer tanto a los
usuarios actuales como alos potenciales usuarios del futuro, y por
tanto deben ser de una gran calidad y poseeruna gran estabilidad
fsica de modo que puedan mantenerse a lo largo del tiempo:Un mtodo
de seleccin de materiales originales para su preservacin es
clasificarlosen tres categoras: Documentos raros, nicos o frgiles,
archivos y otros objetos de valor material que necesiten
conservarse en su forma original: La conversin digital puede crear
copias de gran calidad con un acceso rpido y amplio que en 16
17. muchos casos proteger estos materiales de la manipulacin.
Esto puede ser difcil de conseguir utilizando determinados tipos de
microforma. Materiales originales con u importante valor
intelectual pero con un valor n material relativamente bajo,
utilizados intensivamente y daados o frgiles: Las imgenes
digitalizadas son normalmente una buena alternativa para satisfacer
las demandas inmediatas. Si los materiales originales estn
deteriorados, y, por tanto, necesitan ser sustituidos
permanentemente, los archivos y las bibliotecas a veces prefieren
utilizar el microfilm para fines de preservacin y las copias
digitales para el acceso (solucin hbrida). Materiales origi nales
muy deteriorados de un alto valor intelectual pero de un bajo valor
material y con un bajo nivel de uso. Este no es un material que
interese digitalizar en primer lugar. Si es un material deteriorado
que se necesita sustituir por copias que permitan su uso, el
microfilm sigue siendo todava la opcin habitual en muchos pases,
por ser estable, barata y fcil de almacenar (aunque hay que tener
en cuenta los comentarios sobre la situacin en algunos pases en vas
de desarrollo tal y como se ha expresado ms arriba, en la
Introduccin). En el futuro, cuando los investigadores descubran
estos materiales originales microfilmados y quizs los utilicen con
ms frecuencia, siempre existir la posibilidad de digitalizar el
microfilm.Muchas instituciones no han aceptado todava que la
tecnologa digital essuficientemente estable para la preservacin a
largo plazo. Con frecuencia las razonesson que sienten el peligro
de la obsolescencia tcnica del medio digital e incertidumbretanto
sobre el estatus legal de los documentos electrnicos como sobre los
futuroscostes de la preservacin de este tipo de documentos (vanse
las Secciones 3 y 7). Ala espera de que se resuelva el problema de
la longevidad digital, muchas institucionesestn creando archivos de
imgenes (vese ms arriba) que pueden considerarse consuficiente
calidad de preservacin. Esto significa que: pueden utilizarse para
diferentes fines se crean con un nivel de calidad que reducir las
necesidades de un nuevo escaneo (vese la Seccin 2)El hecho de que
se haya creado una copia ciertamente no es suficiente para
justificar laeliminacin del original. Incluso para que el lector
acepte la copia digital como textopreferible al original, las
imgenes digitales deben: tener una autenticidad garantizada (vase
Seccin 3) formar parte de un plan de preservacin (vase Seccin 8)La
eliminacin de los documentos originales despus de la conversin
digital se utiliza aveces en programas de gestin de archivos pero
solo para aquellos documentos que 17
18. se han evaluado previamente y cuya eliminacin estaba
prevista y que se handigitalizado para facilitar un uso masivo
durante su tiempo de vida.1.2 Criterios de seleccinCuando se
planifica un proyecto de digitalizacin es til tener en cuenta las
polticasestablecidas por otras instituciones para sus propios
proyectos. Muchos de estosproyectos estn actualmente disponibles
para su consulta en la Web. Un ejemplo es elde la Universidad de
Columbia que ha desarrollado un conjunto de criterios deseleccin
para la digitalizacin de imgenes dividido en seis categoras:
desarrollo de lacoleccin, valor aadido, derechos de propiedad
intelectual, preservacin, viabilidadtcnica y control intelectual.
Otro ejemplo es la Biblioteca del Congreso donde laseleccin para la
preservacin de la reconversin digital se basa en el valor, el uso,
lascaractersticas del documento original y la conveniencia de la
reproduccin digital parael uso y el acceso. (Vese Lecturas
recomendadas al final de esta Seccin parareferencias sobres estos y
otros programas establecidos).1.2.1 ContenidoCualquiera que sea el
objetivo de la implementacin de un proyecto de digitalizacin,
laseleccin de los materiales originales se basar siempre, en mayor
o menor medida, enel contenido. De hecho el valor intelectual es la
cuestin bsica en toda clase deseleccin: justifica el contenido de
este documento (su valor para el posible lector)todos los
esfuerzos, costes y otros recursos que sern necesarios?. Por lo
tanto, todoproyecto o programa de digitalizacin debera tener sus
propios principios de valorbasados en los objetivos que intenta
conseguir. Colecciones virtualesDurante los diez ltimos aos los
investigadores han comenzado a crear coleccionesvirtuales de
documentos, libros, objetos musesticos, etc. escaneados. La
seleccin sebasa normalmente en el contenido intelectual del
material, pero podra basarse tambinen el aspecto fsico o en otros
factores como la antigedad, etc. Los objetivos de lacreacin de
colecciones virtuales pueden ser diferentes. Un motivo puede ser,
porejemplo, la reunificacin de colecciones y fondos dispersos (vase
ms arriba) o lamejora de la investigacin mediante la integracin de
diferentes materiales originalesque de otro modo habran quedado
como documentos aislados, localizados endiferentes partes del
mundo. En este sentido las posibilidades de acceso generalizado
atravs de Internet juegan un papel fundamental. Reunir una masa
crtica de informacinLlevar a cabo un proyecto de digitalizacin que
merezca la pena requiere contar con unvolumen mnimo de informacin.
De no ser as su valor para la investigacin serdemasiado bajo para
atraer lo suficiente a usuarios reales o potenciales. Por lo
tanto,una cuestin importante si la seleccin se basa en el contenido
es si debera incluirse lacoleccin completa o solo una parte de la
misma. Normalmente, el valor de los 18
19. documentos de archivos, colecciones fotogrficas, etc. es
mayor en su conjunto quecomo partes individuales sacadas del
contexto, aunque si los objetos o documentosindividuales tienen un
valor significativo para la investigacin, incluso una partepequea
de ellos pueden constituir una masa crtica de informacin.1.2.2
DemandaEl nivel de demanda es, por supuesto, de gran inters en el
proceso de seleccin de losmateriales para la digitalizacin. Si el
objetivo prioritario es mejorar el acceso, elproceso de seleccin se
regir seguramente por las probabilidades de uso delcontenido del
material digitalizado. Por tanto, la implicacin de los
especialistas y otrosinvestigadores en la toma de decisiones es una
metodologa tradicional de seleccin.Sin embargo, hay una cuestin
bsica y es con qu tipo de usuarios quiere interactuarla institucin
que digitaliza o, al menos, a qu usuarios quiere dar prioridad.
Larespuesta depende de la misin de la institucin en cuestin, aunque
a veces tambindepende de objetivos polticos y de lo que la sociedad
espera de sus institucionesculturales.A veces, un activo grupo de
usuarios de un determinado tipo de materiales puedenencontrarse
dispersos por todo el mundo y precisamente por esto puede ser
difcil dedefinir o identificar. Los documentos incluidos en
colecciones especiales corren elriesgo de que se consideren como
documentos de bajo uso, lo cual no esnecesariamente cierto puesto
que un pequeo grupo de especialistas puede generaruna importante
investigacin.Para equilibrar las demandas de los diferentes grupos
de usuarios muchas institucionesdisponen de equipos de
especialistas y otros investigadores que les ayudan aseleccionar
aquel material que es prioritario digitalizar. Cuando las
actividades dedigitalizacin de instituciones se desarrollan desde
objetivos generales hacia proyectosconcretos que cubren colecciones
completas o tipos de documentos u objetos, estosequipos asesores
pueden ser estratgicamente importantes.Para instituciones
culturales que comienzan su primer proyecto de digitalizacin,
unbuen mtodo de trabajo es seleccionar las partes ms intensamente
utilizadas de suscolecciones a las que, por lo general, darn el
mayor valor aadido porque satisfarnlas necesidades de la mayora de
las personas a las que quieren servir.1.2.3 Estado fsicoLa seleccin
del material que se va a digitalizar se ver afectada tanto por el
estadofsico del material como por la calidad de las descripciones
bibliogrficas existentessobre el mismo. El material que es frgil,
est daado o en condiciones precarias puedepresentar demasiados
riesgos de daarse todava ms a causa de su manipulacin sise permite
su escaneo sin un especial cuidado o sin un tratamiento bsico
deconservacin. Esto implica costes adicionales, y la institucin
tendr que considerar sidebe dar prioridad a otras colecciones en
mejor estado, o si el coste de la preparacin y 19
20. conservacin debera incluirse en el coste total del proyecto
de digitalizacin (Vase ladiscusin ms adelante en la Seccin 4,
Presupuestos)De forma similar, si el material que se ha considerado
candidato par a la digitalizacintiene lagunas en su catalogacin o
en la descripcin de sus datos, es fundamental parael futuro acceso
a dichos materiales crear esos datos, y, por tanto, ser
necesarioconsiderar si los costes adicionales de este trabajo
pueden incluirse en el presupuestototal del proyecto de
digitalizacin.RecomendacionesFormule una poltica de seleccin del
material que se va a digitalizar comoprimera etapa del
proyecto.Identifique las principales razones que animan el
proyecto. Se trata demejorar el acceso, de apoyar la preservacin, o
de ambas?.Las decisiones sobre los requisitos tcnicos, la indizacin
y la bsqueda y lapreservacin de los ficheros digitales que se
creen, dependen delplanteamiento del proyecto.Cree un conjunt o de
criterios de seleccin.Considere la creacin de un equipo asesor de
especialistas y otrosinvestigadores que representen a usuarios
potenciales de estos archivosdigitales y que ayuden a seleccionar
lo que es prioritario digitalizar.Capturar una imagen de modo que
sea posible utilizarla para satisfacerdistintas necesidades y
almacenarla como una imagen de archivo off line en unsoporte de
almacenamiento barato y seguro (copia maestra). Las
copiassustitutas de esta imagen se pueden utilizar para el acceso
(ficheros deacceso). A veces las copias de seguridad se hacen con
una mayor compresiny se usan solo como imgenes de muestreo para dar
una idea del contenido(archivos de miniaturas)Lecturas
recomendadasAYRIS, P. (1998). Guidance for selecting material for
digitization, in NATIONALPRESERVATION OFFICE/RESEARCH LIBRARIES
GROUP (1998). Guidelines for 20
21. digital imaging: papers given at the joint NPO/RLG
Preservation Conference,
1998.Londonhttp://www.rlg.org/preserv/joint/ayris.htmCOLUMBIA
UNIVERSITY LIBRARIES. Selection criteria for digital
imaginghttp://www.columbia.edu/cul/web/projects/digital/criteria.htmlCOMMISSION
ON PRESERVATION ACCESS (1999). Digital imaging and
preservationmicrofilm: the future of the hybrid approach for the
preservation of books. Washington,DC.http://www.clir.or
g/pubs/archives/hybridintro.htmlDe STEFANO, R. (2000). Selection
for digital conversion in KENNEY, A.R. & RIEGER,O. Movin theory
into practice: digital imaging for libraries and archives .
Mountain View,VA, Research Libraries Group (RLG)GERTZ, J. (1998).
Selecting guidelines for preservation in NATIONAL
PRESERVATIONOFFICE/RESEARCH LIBRARIES GROUP (1998). Guidelines for
digital imaging: :papers given at the joint NPO/RLG Preservation
Conference, 1998.
Londonhttp://www.rlg.org/preserv/joint/gertz.htmHARVARD UNIVERSITY
LIBRARY. Selection for digitization. A decision- making
matrixhttp://preserve.harvard.edu/bibliographies/matrix.pdfHAZEN,
D. et al. (1998). Selecting research collections for digitization.
Washington, DC,Council on Library & Information Resources.
(Publication 74)http://www.clir.org/pubs/abstract/pub74.htmlKENNEY,
A.R. & RIEGER, O. (2000). Moving theory into practice: digital
imaging forlibraries and archives . Mountain View, VA, Research
Libraries Group (RLG)MENNE-HARITZ, A. & BRBACH, N. (1997). The
intrinsic value of archive and librarymaterial: list of criteria
for imaging and textual conversion for preservation.
Marburg,Archivschule.http://www.uni-marburg.de/archivschule/intrinsengl.htmlNATIONAL
PRESERVATION OFFICE (1997). Preservation and digitisation:
principles,practices and policies: papers given at the NPO 1996
Annual Conference. Londonhttp://www.rlg.org/preserv/jointSMITH,
Abby (2001). Strategies for building digitized collections .
Washington, DC,Council on Library & Information Resources
(Publication
101)http://www.clir.org/pubs/reports/pub101/contents.htmlUNIVERSITY
OF CALIFORNIA (UCLA) LIBRARY. Digital projects. Guidelines
andstandards. http://www.digitallibrary.ucla.edu (en particular
Guidelines for ChoosingMetadata and Standards Reference Guide)
21
22. WEBER, H, & DRR, M. (1997). Digitisation as a method of
preservation? Amsterdam,European Council on Preservation &
Accesshttp://www.clir.org/pubs/reports/digpres/digpres.htm 22
23. 2. REQUISITOS TCNICOS E IMPLEMENTACIN2.1 ConversinUna
imagen digital es una fotografa electrnica convertida en un
conjunto deelementos pictricos (pxels) y ordenada de acuerdo con
una relacin predefinida decolumnas y filas. El nmero de pxels en
una tabla dada define la resolucin de laimagen. Cada pxel tiene un
determinado valor tonal que depende de la intensidad de laluz
reflejada desde el documento original al dispositivo de carga
acoplado (CCD)mediante diodos sensibles a la luz. Cuando los
documentos se exponen a la luz creanuna carga elctrica
proporcional, que genera, a travs de una conversinanalgica/digital,
una serie de seales digitales representadas por un cdigo binario.
Launidad ms pequea de informacin almacenada en un ordenador se
denomina bit(acrnimo de binary digit). El nmero de bits utilizados
para representar cada pxel enuna imagen determina el nmero de
colores o escala de grises que se puedenrepresentar en una imagen
digital. Esto se llama profundidad del bit.Las imgenes digitales se
conocen tambin como imgenes representadas por bits oimgenes raster
para diferenciarlas de otros tipos de ficheros electrnicos como
losficheros vectoriales en los que la informacin grfica se codifica
mediante frmulasmatemticas que representan lneas y curvas.Los
documentos originales se transforman en imgenes convertidas en bits
por mediode un escner o cmara digital. Durante la captura de la
imagen dichos documentos seleen o escanean a una resolucin y a una
profundidad predefinidas. Los ficherosdigitales resultantes que
incluyen los bits para cada pxel, se formatean y etiquetan demanera
que se facilite a un ordenador su almacenamiento y recuperacin. A
partir deestos ficheros el ordenador puede realizar
representaciones analgicas para suvisualizacin en pantalla o
impresin. Debido a que los ficheros con imgenes de altaresolucin
son muy grandes puede ser necesario reducir el tamao de los
archivos(compresin) para hacerlos ms manejables tanto para el
ordenador como para elusuario.Cuando un documento fuente se ha
escaneado, todos los datos se convierten a undeterminado formato de
fichero para su almacenamiento. Existe una variedad deformatos de
imgenes ampliamente utilizados en el mercado. Algunos de ellos
estnpensados tanto para el almacenamiento como para la compresin.
Los ficheros deimgenes tambin incluyen informacin tcnica que se
almacena en el rea del ficherollamada cabecera de la imagen.El
objetivo de cualquier programa de digitalizacin debera ser capturar
y presentar enformatos digitales el contenido informativo ms
significativo de un nico documentooriginal o de una coleccin de
tales documentos. Para capturar las partes significativas,las
valoraciones de la calidad de las imgenes digitales deben basarse
en lacomparacin entre esas imgenes digitales y los documentos
originales que se van aconvertir, y no sobre algn concepto
vagamente definido acerca de lo que bastara parasatisfacer las
necesidades inmediatas. Sin embargo, la solucin no es capturar una
23
24. imagen con la mayor calidad posible, sino comparar el
proceso de conversin con elcontenido informativo del original- ni
ms ni menos. Esto plantea dos cuestiones: lascaractersticas de los
documentos originales que se van a digitalizar y la calidad de
laimagen.2.1.1 Los atributos de los documentos originalesAl
capturar, se deben tomar en consideracin tanto los procesos tcnicos
implicados enla digitalizacin como los atributos de los documentos
originales. Estos atributospueden ser de distintas dimensiones y
nivel tonal (color o blanco y negro). Losdocumentos originales
tambin pueden caracterizarse por el modo en que se hanproducido: a
mano (tinta), mecanografiados o impresos, o por mtodos fotogrficos
oelectrnicos.La condicin fsica de los documentos originales puede
influir de diferentes maneras enla conversin. Los textos
descoloridos, las manchas de tinta, las pginas quemadas yotro tipo
de daos, a veces destruyen el contenido informativo, pero de forma
msfrecuente imponen limitaciones fsicas a las posibilidades de
capturar informacindurante el escaneo. Por tanto, se debe
identificar la posible necesidad de untratamiento previo de los
documentos originales antes de escanearlos. Despreciar estacuestin
puede ser no slo una amenaza para los propios documentos sino
quetambin puede limitar los beneficios y resultados de la
digitalizacin e incrementar elcoste. Los pasos ms comunes para
prevenir este problema son, por ejemplo, llevar acabo tratamientos
bsicos de conservacin previos y usar atriles para los
volmenesencuadernados, y rutinas para controlar la luz y otras
condiciones ambientales duranteel escaneo . Si los documentos
originales tiene un valor material necesitarn, por logeneral, que
los examine un conservador antes de escanearlos.Cuando los riesgos
de dao de los documentos originales sean altos y los
documentostengan un valor especial o estn en malas condiciones, a
veces puede ser mejorescanear a partir de ficheros intermedios de
microfilm y no a partir de los documentosoriginales, si se dispone
de dichos microfilm s.2.1.2 Calidad de la imagenLa calidad de la
imagen durante la captura depende de la suma de resultados de
laresolucin aplicada al escaneo, la profundidad del bit de la
imagen escaneada, losprocesos de mejora y el nivel de compresin
aplicada, el dispositivo de escaneoutilizado o tcnicas usadas, y la
preparacin del operador del escner.2.1.2.1 ResolucinLa resolucin
viene determinada por el nmero de pxels utilizados para presentar
laimagen, expresada en puntos por pulgada (ppp) o pxels por pulgada
(ppi). Ladiferencia entre ppp y ppi se describe a continuacin en la
Seccin 2.2. 24
25. Aumentar el nmero de pxels utilizados para captar una
imagen dar como resultadouna resolucin ms alta y una mayor
capacidad para definir los detalles ms precisos,pero continuar
incrementando la resolucin no proporcionar una mejor
calidad,nicamente ficheros de tamao mayor. La cuestin clave es
determinar el nivel deresolucin suficiente para capturar todos los
detalles significativos del documentooriginal.El tamao fsico del
documento original es importante a la hora de determinar
laresolucin. Cuanto ms grande es un documento mayor ser el nmero de
pxels quese necesitan para captar los detalles requeridos de la
imagen, as como el tamao delfichero. Los ficheros muy grandes
pueden causar problemas a los usuarios al visualizarlas imgenes en
pantalla o al enviarlas a travs de las redes, debido a que el
tamaodel fichero tiene una importante incidencia en el tiempo que
se tarda en mos trar unaimagen. Una manera de disminuir el tamao
del fichero es disminuir la resolucin. Estaes una decisin crtica,
especialmente si el documento original tiene tanto un grantamao
fsico como un alto nivel de detalle, como puede ser el caso de los
dibujos y losmapas de gran tamao.2.1.2.2 Profundidad del bitLa
profundidad del bit es la medida del nmero de bits utilizados para
definir cada pxel.A mayor profundidad del bit, pueden representarse
mayor nmero de tonos en grises ycolor. Existen tres modos: escaneo
binario, utilizando un bit por pxel para representar el blanco o el
negro escaneo en escala de grises, utilizando mltiples bits por
pxel para representar las escalas de grises. El mejor nivel de
escala de grises es de ocho bits por pxel, y en este nivel la
imagen que se muestra puede seleccionar hasta 256 diferentes
niveles de grises escaneo en color utilizando mltiples bits por
pxel para representar el color; se considera un buen nivel de color
24 bits por pxel y permite una seleccin de hasta 16.7 millones de
colores.La eleccin de la profundidad de los bits afecta a las
posibilidades de captura, tanto dela apariencia fsica del documento
original como de su contenido informativo. De estomodo, las
decisiones sobre la profundidad de los bits deben tener en cuenta
si elaspecto fsico del documento, o de sus partes, tienen un valor
informativo aadido quees necesario reflejar. Este puede ser el caso
de los proyectos de digitalizacin quetienen como objetivo la
realizacin de facsmiles de los documentos originales.2.1.2.3
Procesos de optimizacin de la imagenLos procesos de optimizacin de
la imagen se pueden aplicar para modificar o mejorarla imagen
captada, cambiando el tamao, el color, el contraste y el brillo, o
para 25
26. comparar y analizar imgenes con caractersticas que el ojo
humano no puede percibir.Esto ha abierto muchos campos nuevos de
aplicaciones para el proceso de la imagen,pero el uso de este tipo
de procesos plantea cuestiones sobre la fidelidad y autentic
idadrespecto al original. Las caractersticas del proceso de la
imagen incluyen, por ejemplo,el uso de filtros, curvas de
reproduccin tonal y herramientas para el tratamiento
delcolor.2.1.2.4 CompresinLa compresin se utiliza normalmente para
reducir el tamao del fichero con el fin deprocesar, almacenar y
transmitir las imgenes digitales. Los mtodos utilizados son,por
ejemplo, la eliminacin de informacin repetida o la de difcil visin
para el ojohumano. De este modo la calidad de una imagen puede
verse afectada por las tcnicasde compresin utilizadas y por el
nivel de compresin aplicado. Las tcnicas decompresin pueden ser
tanto sin prdida, lo que significa que una imagendescomprimida ser
idntica a su estado original debido a que no se ha perdidoninguna
informacin cuando se ha reducido el tamao del fichero, como de
prdidacuando la informacin menos significativa se reduce o desecha
en este proceso.En general, la compresin sin perdida se utiliza
para los ficheros maestros y lastcnicas de compresin con prdida
para los archivos de acceso. Es importante teneren cuenta que las
imgenes pueden responder a la compresin de diferentes modos.Algunos
tipos concretos de caractersticas visuales como leves variaciones
de tonopueden producir efectos visuales no deseados.Las imgenes
digitales reproducidas a partir de formatos fotogrficos que tienen
unamplio nivel tonal, normalmente dan lugar a grandes ficheros.
Otra tcnica, adems dela compresin, que se puede us ar para reducir
el tamao del fichero es reducir ladimensin espacial de la imagen
digital (para la resolucin espacial, ver Seccin 2.2).Esto puede
llevarse a cabo cuando se pretende que la imagen sea una
reproduccin dearchivo ms que un facsmil que sustituya al
original.2.1.2.5 El equipo utilizado y su funcionamientoEl equipo
utilizado y su funcionamiento tiene un importante impacto en la
calidad de laimagen. Equipos de diferentes fabricantes pueden
funcionar de modo diferente, inclusosi ofrecen las mismas
capacidades tcnicas.2.1.2.6 Criterio y cuidado del tcnicoEl
criterio y cuidado del tcnico siempre tiene un considerable impacto
sobre la calidadde la imagen. En definitiva son las decisiones
tomadas por las personas las quedeterminan la calidad que se
consiga. 26
27. Recomendaciones para la conversinGua de diez pasos para
asegurar un buen proceso de conversin 1. Utilice escneres que
puedan adecuarse a : las dimensiones fsicas de los documentos
originales el tipo de soporte implicado (transparente o
reflectante) el nivel de los detalles, tonos y colores presentes en
los documentos el estado fsico de los documentos. 2. Examine
cuidadosamente si existe algn requisito para una manipulacin
concreta o de conservacin de los documentos originales antes de
escanearlos. 3. Elija una resolucin que sea suficiente para
capturar los ms sutiles detalles requeridos por el grupo de
documentos originales que se van a escanear. Compruebe que la
resolucin no limitar el uso que se pretende conseguir para las
imgenes digitales. Establezca la resolucin en el nivel elegido para
todo el grupo de documentos originales con el objetivo de evitar la
revisin de documento por documento. 4. Elija una profundidad de bit
que est en consonancia con las caractersticas de los documentos
originales y con el nivel necesario para transferir el contenido
informativo: escaneo binario para documentos textuales que
consistan en imgenes en negro sobre papel blanco; escaneo en escala
de grises (8 bits) para documentos que contengan informacin
significativa en escala de grises (incluidas las anotaciones a lpiz
en el texto) y para materiales fotogrficos; escaneo en color para
documentos que contengan informacin en color, especialmente cuando
se necesiten copias facsmiles de gran calidad. 5. Utilice los
procedimientos de optimizacin de las imgenes y los documentos
cuidadosamente siempre que este tipo de procesos se lleven a cabo.
6. Utilice las tcnicas de compresin normalizadas sin prdida para
los ficheros de conservacin y seguridad (maestros) y para los
ficheros de acceso cuando sea necesario. Esto significa, por
ejemplo: para la compresin: ITU grupo 3 o 4 y JBIG (imgenes
binarias), JPEG/JPEG 2000 or LZW (imgenes multi-bit ) sin prdida
para el intercambio: JPEG/JPEG 2000 sin prdida, TIFF 5 o versiones
superiores 7. Lleve a cabo cuidadosamente ensayos de acceso a los
ficheros con el fin de encontrar un equilibrio entre una calidad
visual aceptable para el usuario y el 27
28. tamao del fichero de modo que el ordenador pueda acceder al
mismo en un tiempo aceptable. 8. Para obtener un buen rendimiento
de los equipos utilizados, investigue cuidadosamente las
declaraciones de los fabricantes acerca de las potencialidades del
sistema y confrmelas mediante pruebas y referencias. 9. Utilice
estndares para la evaluacin de calidad de la imagen digital (ver a
continuacin 2.2. Control de calidad) 10. Desarrolle un programa
continuo de control de calidad para verificar la consistencia de la
produccin de los distintos tcnicos durante el proceso del escaneo
(ver a continuacin 2.2. Control de calidad)2.2. Control de
calidadEl control de calidad es un elemento importante en cada una
de las etapas de unproyecto de digitalizacin. Sin este trabajo no
ser posible garantizar la integridad yconsistencia de los ficheros
de imgenes.Deben tomarse medidas para minimizar las variaciones
entre los diferentes operadoresas como entre los distintos escneres
que se utilicen. Los escners deben, adems,revisarse regularmente
para verificar su precisin y la calidad.Es necesario un programa de
control de la calidad tanto para proyectos propios comopara
aquellos, o parte de los mismos, que se contratan externamente. Una
diferenciaimportante es que en un proyecto contratado externamente
de forma total o parcial losrequisitos de calidad a menudo tienen
que formularse antes de la firma del contrato,debido a su
naturaleza legal vinculante. En los proyectos propios se pueden ir
creandopoco a poco los programas de control de calidad como parte
de las tareas del proyecto.Aunque el control de calidad es un
factor crucial para asegurar los mejores resultadosno existe un
modo normalizado para asegurar una determinada calidad de la
imagendurante su captura. Los diferentes documentos originales
requieren diferentes procesosde escaneo, lo que debe tenerse en
cuenta cuando se desarrollan programas de controlde calidad.2.2.1.
Principios bsicos de un programa de control de calidad2.2.1.1
ObjetivoUna cuestin importante en un programa de control de calidad
es si incluir: 28
29. la coleccin completa de imgenes o una muestra? todo tipo de
ficheros (ficheros de conservacin, ficheros de acceso, ficheros de
miniaturas?) otros productos intermedios como facsmiles en papel y
microformas ?La respuesta depende del objetivo del proyecto de
digitalizacin, de los productosrequeridos y de los niveles de
calidad y puntos de referencia elegidos. Si el programade
digitalizacin es muy limitado o los requisitos de calidad son
extraordinariamentealtos, tendr ms sentido examinar la coleccin
completa imagen por imagen. Sinembargo, en la mayora de los
programas es suficiente con establecer un plan demuestreo que cubra
por ejemplo el 10% de las imgenes producidas por cadadispositivo de
escner durante un determinado periodo de tiempo (un da, una
semana,un mes). Si un porcentaje previamente especificado de las
imgenes elegidas esincorrecto, entonces deber revisarse el grupo
completo de imgenes.Un programa de control de calidad siempre
incluye los ficheros de conservacin que seproducen y en la mayora
de los casos tambin tendr en cuenta otros productos comolos
ficheros de acceso, microformas y copias en papel.2.2.1.2 MtodosLas
herramientas automticas de evaluacin de la imagen de las que
disponemosactualmente no son, por lo general, suficientes para
materiales que se requieren parafines culturales y cientficos. Por
lo tanto, la evaluacin de la calidad visual debellevarse a cabo: o
desde la pantalla o en los productos impresos basada en una mezcla
de evaluacin en pantalla y en los productos impresos (pelculas o
impresiones)Deben tenerse en cuenta las limitaciones tcnicas que
pueden afectar a la evaluacin,comenzando con las posibilidades de
conseguir una buena calidad de las copiasimpresas de las imgenes en
escala de grises y en color. Los mtodos recomendadosson para la
evaluacin en pantalla - visualizacin de las imgenes escaneadas a
1:1 (ampliados al 100%) - uso de objetivos para evaluar la
reproduccin en escala de grises y color - uso de objetivos de
resolucin e histogramas para evaluar la resolucin espacial y la
reproduccin tonal. - utilizacin de mtodos para la medida del ruido
y herramientas de deteccin de objetos para la evaluacin de los
productos impresos 29
30. - examinar por medio del ojo humano las copias creadas a
partir de las imgenes para comprobar si se ajustan a los requisitos
de calidad. - comparar los productos impresos con los documentos
originales2.2.2 Control de calidad del escnerAntes de comprar un
escner, se debera exigir a los vendedores que presentenresultados
digitales evaluables por medio de tests de evaluacin de la calidad
deimgenes digitales relevantes. Cuando un proyecto de digitalizacin
est en marcha,deben establecerse medidas de control de calidad del
escaneado que permitan a losoperadores estar seguros de que los
dispositivos de escaneo estn operando dentrode los parmetros
previstos. Las cuestiones que ms conciernen a los resultados
son:resolucin espacial, reproduccin tonal, reproduccin del color,
ruido y deteccin deobjetos. En los proyectos en los que se
digitalizan materiales de gran formato, comomapas y planos, la
precisin geomtrica es tambin un factor importante.2.2.2.1 Resolucin
espacialUna definicin muy comn de resolucin espacial es la
capacidad de capturar yreproducir detalles espaciales. Esto se
refiere tanto a los dispositivos de entrada comode salida y esta es
probablemente la nica razn por la que el concepto de resolucines
una de las especificaciones tcnicas peor comprendidas y utilizadas
en relacin conlos equipos de digitalizacin. La resolucin se define
a menudo en trminos de ppp(puntos por pulgada). Sin embargo, los
ppp deberan usarse normalmente solo para lasimpresoras puesto que p
se refiere siempre a puntos impresos (por ejemploimpresoras de
chorro de tinta e impresoras lser). Para la resolucin en la entrada
dedatos (es decir, escneres y cmaras digitales) y para la resolucin
en pantalla (esdecir, monitores) s uele usarse normalmente la
relacin pxels por pulgada (ppi). Engeneral, un pxel es una unidad
fsica mucho ms pequea que un punto.Cuando se dice que un escner
tiene una resolucin mxima de por ejemplo 600 ppp,significa en la
prctica que el escner muestra ptimamente un mximo de 600 pxelspor
pulgada (ppi). Pero la proporcin de muestreo ptico de un escner slo
define laresolucin ptica mxima posible en el sentido de la
capacidad de la unidad CCD. Estono garantiza que el escner en
realidad pueda resolver espacialmente detalles en elmismo grado que
supondra el nivel de muestreo ptico. El motivo es que la
proporcinde muestreo ptico de un dispositivo de entrada es slo uno
de los componentes delconcepto de resolucin. Otros componentes de
importancia son por ejemplo la calidad,el nivel del enfoque y la
estabilidad mecnica del sistema ptico (lentes, espejos yfiltros, el
nmero de bits de los datos de entrada y de los productos, las
variaciones deldocumento original y el CCD y el nivel de proceso de
las imgenes aplicado a laimagen.Existen varios mtodos para evaluar
la resolucin. Los ms comunes son lossiguientes: 30
31. Modelos de resolucin, que nacieron originalmente para su
uso en las industrias microgrficas y fotogrficas. Se usan
normalmente para medir la reproduccin de los detalles, para la
uniformidad de la captura de las diferentes partes de un documento
fuente, para la nitidez de la imagen, etc. A veces los resultados
pueden no ser totalmente fidedignos, pero los modelos de resolucin
siguen siendo todava herramientas prcticas para utilizar
especialmente en la conversin binaria. La funcin de la modulacin de
la transferencia (MTF), donde se mide la intensidad de la luz en el
proceso de la imagen (calibracin de la luz). Este es un mtodo ms
fiable y objetivo para evaluar el modo en el que se preservan los
detalles y cuales son los sistemas de escala de grises y color ms
apropiados. Respuesta de la frecuencia espacial (SFR), que
significa la capacidad del escner para transmitir informacin de
alta frecuencia por medio de una funcin especfica de transmisin (en
la prctica equivalente a MTF)Ejemplos de modelos que se utilizan
para la resolucin son: Test de prueba de facsmil normalizado del
IEE (Institute of Electrical and Electronic Engineers) Test de
prueba n. 2 para escneres de AIIM Modelo de resolucin PM-189
(A&P International) Modelo de escner SFR y OECF n. 2 (Applied
Image Inc)La norma para la evaluacin de la resolucin es la ISO
12233 de Fotografa, Cmarasde fotos electrnicas, medidas de
resolucin.2.2.2.2 Reproduccin tonalLa reproduccin tonal es el ms
importante de todos los indicadores de calidad de laimagen, porque
nos da la pauta para la evaluacin de otros parmetros de calidad
dedicha imagen. De hecho, la efectividad de estos parmetros implica
una satisfactoriareproduccin tonal. En la prctica la reproduccin
tonal determina el grado de oscuridado claridad de una imagen as
como su contraste.Debido a los diversos ruidos electrnicos en el
escner siempre habr prdidas en laprofundidad del bit durante el
proceso del escaneado. Por esto es importante capturarla imagen con
una resolucin mayor de la necesaria para el producto digital final,
porejemplo, al menos entre 12 y 14 niveles de canal por bit para
conseguir una resolucinde salida de 8 (en escala de grises)La
reproduccin tonal se evala mediante una curva de reproduccin de
tono querelaciona la densidad ptica de un documento en papel o una
reproduccin de microfilm 31
32. con el correspondiente valor digital (valor tonal) en la
reproduccin digital. En lossistemas digitales esta curva se llama
Funcin de conversin opto-electrnica (OECF).Los valores tonales
tambin pueden evaluarse por medio de un histograma quemuestra en
modo grfico la distribucin de los tonos en una imagen as como el
gradotonal de la misma. La disminucin en la claridad u oscuridad
comparados con losvalores tonales del documento original pueden
indicar que hay limitaciones en el nivelde fuerza del equipo del
escner. El nivel de fuerza puede definirse como el grado
dediferencia tonal entre la claridad y la oscuridad ms intensas y
su valor muestra deeste modo la capacidad del escner para
distinguir las variaciones extremas en laintensidad. Normalmente,
el nivel de fuerza de un escner debera conseguir o superarlos
extremos de intensidad de los documentos originales.Es importante
que no se efecte ninguna compresin tonal en la captura de la
imagenescaneada. Si efectuamos una compresin tonal en este momento
del proceso deconversin, nunca podremos restaurar de nuevo la
imagen a su valor tonal completo.As, la gama de valores del escner
(el parmetro de brillo siempre deberaestablecerse en 1.0 en el
programa del escner. Es to se define a menudo comoreproduccin
tonal.2.2.2.3 Reproduccin del colorEl mayor desafo de la
digitalizacin de documentos originales en color es sureproduccin
manteniendo la representacin del color en la pantalla y en
lasimpresiones. El principal problema es que tanto los monitores
como los sistemasoperativos y el sistema de aplicaciones
representan el color de diferentes modos. Lapercepcin humana del
color tambin difiere entre las distintas personas.Existen varios
modelos de color para definir las propiedades de la gama de
colores. Losms usados son: RGB y CMYKRGB son las siglas en ingls de
rojo, verde y azul y es el modelo que se utiliza enmonitores y
escneres. Se trata de simular una amplia gama de colores mediante
lacombinacin de diferentes cantidades de luz roja, verde y azul.
Cada uno de estos trescolores se define como un canal de color y
sobre un monitor de 24-bit, cada canal tiene8 bits que representan
256 tonalidades. En 1996 se cre para Internet un estndarespecial de
RGB, llamado sRGB y es el que se utiliza a menudo tanto para
losmonitores como para los escneres, cmaras digitales e impresoras.
Si embargo, se hacriticado que sea un sistema demasiado limitado y
que no pueda reproducir todos loscolores. Por esto, es importante
antes de adquirir un sistema de reproduccin digital(cmara o escner)
tener en cuenta si esta limitacin es de vital importancia en
relacincon los resultados que queremos obtener en el proyecto de
digitalizacin.El modelo CMYK se basa en los colores cin, magenta,
amarillo y negro. Se basa en elprincipio de que todos los objetos
absorben una cierta longitud de onda a partir delespectro de la luz
y que siempre reflejan una longitud de onda opuesta. Los sistemas
32
33. de impresin y fotografa se basan en el modelo CMYK que
tambin se conoce comosubtractivoA principios de los aos 90 un
consorcio de empresas crearon el ICC (ConsorcioInternacional del
Color) con el objetivo de desarrollar sistemas de gestin del
colorconsensuado y normalizado. El perfil normalizado del ICC se
puede utilizar condiferentes sistemas operativos e implementarse en
imgenes de color. Sin embargo, notodos los sistemas de gestin de
imgenes de color soportan el sistema deimplementacin de
ICC.Ejemplos de modelos en uso para la reproduccin en color y
escala de grises Kodak Color Separation Guide and Gray Scale (Q13
an Q 14) Kodac Q-60 Color input Target (IT8) RIT Process Ink Garmut
Chart2.2.2.4 RuidoEn el contexto que nos ocupa el ruido puede
asemejarse a las fluctuaciones de laintensidad de la luz en una
imagen que no se encuentran en el documento fuente. Enlos sistemas
de digitalizacin el ruido, a menudo, tiene su origen en la unidad
de CCD yen los componentes electrnicos asociados. El ruido se mid e
normalmente calculandola desviacin normal de los valores del nmero
de pxels sobre cierta parte deldocumento como una ratio del nivel
de ruido. El aumento de la desviacin y el aumentodel ruido reduce
la calidad de la imagen. En la actualidad existen programas de
gestinde la imagen que miden el ruido.2.2.2.5 ObjetosEl polvo, los
rayajos y las manchas constituyen ejemplos de elementos que
puedentener un impacto en la calidad de una imagen. Todos ellos
crean una visible fluctuacinno aleatoria en la intensidad de la
luz, aunque el modo en el que esto afecta a la calidadde la imagen
difiere dependiendo del resultado que se quiera obtener. En la
mayora delos casos es suficiente con usar programas que detectan
estos elementos, aunque aveces es necesario examinarlos
visualmente.2.2.3 Control de la calidad del monitorExisten muchos
elementos particulares que pueden influir en la calidad de la
imagencuando esta se visualiza. En primer lugar, la pureza del
color y el brillo varan entre elcentro y las esquinas de la
pantalla. En segundo lugar, la eleccin de una pantalla LCD(pantalla
de cristal lquido) o CRT (tubo de rayos catdicos) puede tener sus
efectos;esta ltima se considera todava la mejor cuando visualizamos
la imagen. En tercerlugar, la gestin del color necesita una
regulacin continua del monitor de acuerdo conalgn estandar (el
perfil normalizado ICC, vase ms arriba). Las herramientas
decalibrado estn a menudo incluidas en los programas de aplicacin.
Calibrar un monitor 33
34. significa ajustar dos valores: la intensidad de la luz del
monitor (gama) y el llamadopunto blanco (cuando los tres canales de
color rojo, verde y azul estn iluminados). Elvalor de la gama debe
ajustarse en 1.8-2.2 y el punto blanco (temperatura color) serun
blanco fro (5000 kelvin). Deberamos tener en cuenta que el ajuste
de los citadosvalores, que son los ideales para la evaluacin de la
calidad de la imagen, quizs nosean los ptimos para la visualizacin
por parte de los usuarios.2.2.3.1 Condiciones de visualizacinLa
evaluacin de las imgenes siempre necesita un sistema de control.
Tambin esimportante adaptar este sistema a los requisitos de
visualizacin, que difieren entre lasnecesidades del monitor y de
los documentos originales. Los monitores se ven mejorcon una luz
tenue, aunque no en habitaciones oscuras, y los documentos
originales conuna luz ms intensa. Los efectos adicionales como los
reflejos pueden afectar a laevaluacin y por consiguiente deben ser
minimizados, por ejemplo utilizando un fondoneutro (gris) y colores
neutros (gris, negro, blanco) en la vestimenta de los
operadores.Recomendaciones para el control de calidadLas
condiciones para la calidad de la imagen digital se pueden
describir en tres etapas Identific acin de los productos finales
deseados y de los propios fines de la digitalizacin. Decida qu es
lo que quiere producir y cundo Establecimiento de normas. Defina
niveles aceptables de calidad de las imgenes digitales basados
tanto en las caractersticas de los documentos originales como en
las prestaciones del sistema de digitalizacin de imgenes que se
vaya a utilizar Decisin sobre los puntos de referencia. Decida con
qu se van a comparar los productos de salida del proceso de
digitalizacinDependiendo de estas decisiones, hay que seleccionar
lo que deberan incluir losprogramas de control de calidad (imgenes
aisladas o la coleccin completa deimgenes; todo tipo de ficheros;
facsmiles en papel, otros productos intermedios).Decida sobre los m
todos de evaluacin de los productos digitales que se
obtengan,utilizando tanto la evaluacin en pantalla como en los
productos impresos y empleandolos modelos de referencia disponibles
para el color y la escala de grises, la resolucin,los modelos par a
la evaluacin del ruido y los sistemas de deteccin de
objetos.Calibre regularmente los monitores sobre los que se va a
llevar a cabo la evaluacin yminimice los efectos adicionales en el
entorno de visualizacin2.3 Gestin de la coleccin 34
35. La posibilidad de poder utilizar una coleccin de imgenes
digitales de la maneraprevista no solo depende de las normas de
conversin y de los controles de calidadsino tambin de cmo se
gestione la coleccin. Si el objetivo no es solo satisfacer
lasnecesidades a corto plazo sino adems proporcionar acceso a lo
largo del tiempo,deben tomarse medidas para satisfacer tanto el uso
actual como las expectativas de losfuturos usuarios.Deben hacerse
planes, por ejemplo, para:- escanear las imgenes de la manera
adecuada para el ltimo uso previsto- actualizar la distribucin de
imgenes y la funcionalidad de la interfaz de usuario.- transferir
las imgenes a nuevas plataformas tcnicas para conseguir una
capacidad de procesamiento y manejo creciente de la informacin
digital.- migrar las imgenes digitales a nuevos formatos de fichero
o a nuevos soportes fsicos para asegurar el acceso a largo
plazo.Para que puedan utilizarse las imgenes escaneadas debe
prestarse mucha atencin asu almacenamiento. Todos los ficheros de
imgenes producidos como resultado de unproyecto de digitalizacin
deben organizarse, nombrarse y describirse de maneraadecuada a los
objetivos del proyecto.2.3.1 Organizacin de las imgenesAntes de
tomar en consideracin un nombre y una descripcin de un fichero de
imagendebe decidirse cmo va a almacenarse. Por lo general, los
documentos originales quese escanean se organizan fsicamente de
acuerdo con principios de ordenacinarchivstica o bibliotecaria. Los
fondos de los documentos se suelen dividir en series,volmenes y
publicaciones y las colecciones de manuscritos y las fotografas
estnnumeradas.La manera ms fcil de manejar esta cuestin es
trasladar los principios fundamentalesde la organizacin fsica de
los documentos originales a una jerarqua lgica del discodel
ordenador. Esto deber llevarse a cabo hasta donde sea posible de
acuerdo con lossistemas normalizados existentes. Es importante
asegurar que las estructuras de losnombres de los ficheros de las
diferentes plataformas tcnicas sean compatibles.Tambin ha de ser
posible el crecimiento de la coleccin de los ficheros de imgenes
y,adems, la manera de organizarlos debe ser escalable.2.3.2 Nombres
de las imgenesLos ordenadores no son capaces por s solos de
interpretar las relaciones lgicas deuna coleccin de documentos
originales como, por ejemplo, las secuencias de las 35
36. carpetas y de las pginas. Por tanto, debe reflejarse el
modo por el que se nombran losficheros de las imgenes escaneadas.
Existen dos procedimientos para ello: (1) utilizarun esquema de
numeracin que refleje los nmeros que se hayan usado en un sistemade
catalogacin previo, o (2) utilizar nombres de ficheros
significativos. Ambosprocedimientos son vlidos y debe elegirse el
que mejor convenga a una coleccin ogrupo determinados de documentos
originales.Un proyecto de digitalizacin tambin debe adoptar
convenciones para los nombres,para las tablas de signos y para las
reglas relativas, por ejemplo, a la puntuacin y aluso de letras
maysculas. Es importante que estas convenciones sean uniformes.
Unvocabulario normalizado es una de las piedras angulares de la
gestin de una coleccinde imgenes digitales.Cuando se nombran los
ficheros de imgenes tambin son importantes las extensionesdel
fichero. Muchas de ellas tienen significados normalizados y su uso
se encuentrageneralizado, pero debe tenerse cuidado si se trata de
extensiones no normalizadas.Puede encontrarse una lista de las
extensiones ms comunes en Webopedia, unaenciclopedia en lnea
relacionada con la tecnologa
informtica.http://webopedia.internet.com/TERM/f/file_extension.html2.3.3
Descripcin de las imgenesPara describir imgenes digitales son
necesarios lo metadatos que son datosestructurados acerca de los
datos. Los metadatos tambin pueden definirse como datosque
facilitan la gestin y el uso de otros datos. Esto no es algo nuevo
para archiveros ybibliotecarios. El uso de metadatos se e ncuentra
estrechamente relacionado con lasreglas de descripcin y catalogacin
de publicaciones impresas , documentos dearchivos y artefactos. La
diferencia es que en el mundo digital se necesitan
categorasadicionales de metadatos para soportar la navegacin y la
gestin de los ficheros dedatos. Los metadatos para la descripcin de
imgenes digitales pueden incluir distintostipos de informacin. El
proyecto Making of America II de la Biblioteca del
Congresoidentificaba en 1998 tres categoras de metadatos: Metadatos
descriptivos para la descripcin e identificacin de los recursos de
informacin Metadatos estructurales para la navegacin y la
presentacin Metadatos administrativos para la gestin y el
procesoEstas categoras no siempre tienen lmites claramente
definidos y con frecuencia sesolapan. La Universidad de Cornell en
su tutorial de imgenes digitales Moving theoryinto practice
presenta para cada categora objetivos sumarios, elementos y
ejemplosque aparecen en un ndice que ofrece u buena visin del
concepto de metadatos. naVase
en:http://www.library.cornell.edu/preservation/tutorial/metadata/metadata-01.htmlNo
obstante, cada proyecto de digitalizacin debe elegir una solucin de
metadatosbasada en sus propios objetivos. 36
37. 2.3.4 Uso de los metadatosDos son los principales
procedimientos para las soluciones de metadatos: las tcnicasde
gestin de datos y la codificacin del documento.2.3.4.1 Tcnicas de
gestin de datosEl nivel de los metadatos descriptivos determina
siempre el nivel o las posibilidades derecuperacin. Adems, tiene
una importancia crucial desde el mismo momento en quese inicia un
proyecto de digitalizacin decidir el nivel ms profundo al que
podrnbuscarse las imgenes digitales. Adems, deben tenerse en cuenta
los metadatosexistentes como instrumentos de bsqueda, ndices, etc.
y, si se consideraconveniente, deben vincularse a los ficheros de
imgenes.Tambin debe considerarse, si se pueden adaptar los
metadatos generados en elproceso de conversin digital y cmo.
Actualmente, el formato TIFF (Tagged image fileformat) es el
formato de fichero ms comn para almacenar los master de las
imgenesdigitales. En TIFF, y tambin en otros formatos grficos como
GIF, el software utilizadopor el escner genera de manera automtica
unas etiquetas con informacin tcnica yadministrativa que se
registra en la cabecera del fichero o, dicho en otros
trminos,directamente en el propi o fichero. La informacin de la
cabecera TIFF se almacena enformato ASCII y, en este sentido,
constituye una plataforma independiente.La prctica de registrar los
metadatos en la cabecera del formato TIFF se encuentramuy extendida
y sus ventajas son obvias: asegura una estrecha relacin entre
eldocumentooriginal, el proceso de conversin y el fichero de la
imagen resultante de laconversin.La construccin de colecciones de
imgenes digitales significa igualmente que debellevarse a cabo un
esfuerzo para hacerlas accesibles a los usuarios. Las bibliotecas
detodo el mundo han utilizado durante dcadas el formato MARC
(Machine ReadableCataloging) como un estndar de metadatos, pero
otros sectores culturales no lo hanadoptado. La Dublin Core
Metadata Initiative present, a principios de los aos 90, unconjunto
de 15 elementos de metadatos descriptivos para satisfacer las
nuevasdemandas de recuperacin, inicialmente para la Web. Se
pretende que estos elementossean simples, internacionales e
intersec toriales. Dublin Core es actualmente uno de losestndares
de metadatos ms ampliamente aceptados en el mundo.2.3.4.2
Codificacin del documentoActualmente muchos proyectos y programas
digitales utilizan SGML (StandardGeneralized General Markup
Language) o partes de SGML como XML (eXtensibleMarkup Language). El
objetivo es agrupar las imgenes y proporcionar acceso aelementos
estructurales de objetos individuales o de colecciones completas.
Lacodificacin de documentos tambin puede utilizarse en aquellos
sistemas en los quelos datos se toman de bases de datos de menor
nivel y se transforman enrepresentaciones normalizadas para el
intercambio. 37
38. SGML presenta algunas desventajas. Por ejemplo, muchas
aplicaciones de software nolo soportan y XML se utiliza cada vez ms
como lenguaje de marcado. Una iniciativabien conocida que utiliza
SGML es TEI (Text Encoding Initiative) que ha desarrolladoDTDs
(Document Type Definitions) para codificar textos individales en el
campo de lashumanidades. La iniciativa Encoded Archival Description
(EAD) ha desarrollado unaDTD para codificar instrumentos de bsqueda
que permiten codificar colecciones dearchivo completas o
ejemplare.Recomendaciones para la gestin de la coleccinOrganice
jerrquicamente los ficheros de las imgenes escaneadas en undisco
que corresponda lgicamente a la organizacin fsica de los
documentosNombre los ficheros escaneados de una manera
estrictamente controlada querefleje sus relaciones lgicasDescriba
los ficheros de las imgenes escaneadas internamente (utilizando
laimagen de la cabecera del fichero) y externamente (utilizando
ficheros demetadatos descriptivos vinculados) 38
39. Construccin de un entorno de trabajo para un proyecto de
digitalizacinLlevar a cabo un proyecto de digitalizacin significa
establecer un equilibrioentre las necesidades de los usuarios
reales y potenciales, la infraestructuratecnolgica utilizada por el
proyecto y los recursos financieros y humanosdisponibles. Adems,
las posibilidades tecnolgicas de las estaciones detrabajo y
dispositivos de captura de imgenes (escneres o cmaras
digitales,sistemas operativos, memoria interna, almacenamiento,
calidad devisualizacin, capacidad de las redes y velocidad) deben
estar claras antes deiniciar el proyecto as como los medios para
presentar los datos de lasimgenes a los usuarios.El anlisis de las
necesidades tcnicas de un proyecto de digitalizacin se llevaa cabo
por lo general en el marco de un proyecto piloto o estudio.
Esteproporciona al proyecto la posibilidad de investigar a pequea
escala laviabilidad de 1) realizar sus planes y 2) introducir la
tecnologa digital en unabiblioteca o en un archivo si se trata del
primer proyecto de digitalizacin de lainstitucin.Las necesidades
tcnicas se centran fundamentalmente en el hardware y en elsoftware,
factores ambos dinmicos en el desarrollo del futuro
previsible.Aunque cualquier lista de requisitos mnimos se queda
casi inmediatamenteobsoleta y adems debe ser bastante general, el
siguiente paquete bsico detecnologas de la informacin y de la
comunicacin debera ser suficiente parallevar a cabo un proyecto de
digitalizacin a un nivel bsico:- Un PC de nivel normal (Procesador
Intel Pentium o similar) con las siguientes caractersticas
adicionales:- como mnimo memoria de acceso aleatorio (RAM) dos
veces mayor que la recomendada para los requisitos de oficina
habituales. El tipo de memoria RAM debe ser tambin como mnimo
Dinmica Sincronizada (SDRAM)- como mnimo 1 Gigabyte libre de
espacio adicional en la memoria del disco duro al que se necesita
para el software y el sistema operativo instalado (Windows o
similar). El procesado de imgenes necesita mucha memoria y largos
retrasos afectan negativamente a la productividad- Un CD-Writer,
perifrico esencial para proporcionar el soporte para copiar el
producto digital en CD-ROMs, especial