METADATOS MÍNIMOS Y FORMATOS PARA LA … · Cuando esto no es posible, dado que algunos tipos...
Transcript of METADATOS MÍNIMOS Y FORMATOS PARA LA … · Cuando esto no es posible, dado que algunos tipos...
METADATOS MÍNIMOS Y FORMATOS PARA LA
TRANSFERENCIAS DE DOCUMENTOS
ELECTRÓNICOS DESDE LAS INSTITUCIONES
PÚBLICAS AL ARCHIVO NACIONAL
-PRIMERA ENTREGA-
Gabriela Andaur – Pilar Díaz – Karin Pereira
Archiveras
Diciembre 2018
2
Versión Fecha Autor(es) Cambios
0.1 Agosto 2018 Gabriela Andaur, Pilar Díaz, Karin
Pereira
-
0.2 Diciembre 2018 Gabriela Andaur, Pilar Díaz, Karin
Pereira
-
3
Aclaración
Estos documentos se encuentran en su primera fase de elaboración y podrán ser
modificados en el transcurso de este proyecto. Recogen buenas prácticas archivísticas a
nivel internacional y están enfocados inicialmente al trabajo con las primeras instituciones
que transferirán documentos electrónicos al Archivo Nacional.
4
Relación entre procedimientos archivísticos
Este documento es parte una serie de procedimientos elaborados por el Archivo Nacional en el
contexto de su Proyecto de Modernización, el cual forma parte del Programa de Modernización del
Sector Público del Ministerio de Hacienda.
El orden recomendado de lectura y aplicación de estos documentos se grafica en la siguiente figura:
Este documento en particular es parte del set de Documentos Complementarios que tiene como
finalidad apoyar aspectos específicos del manejo de documentos electrónicos.
Procedimiento para elaborar Cuadros de Clasificación
Procedimiento de Valoración Documental
Procedimiento para elaborar Tablas de
Retención Documental
Procedimiento de Eliminación
de Documentos
Instructivo de Transferencia de
Documentos Electrónicos
Metadatos y Formatos para la transferencia
Estándares para la digitalización
5
TABLA DE CONTENIDOS
Relación entre procedimientos archivísticos ................................................................................4
Presentación ............................................................................................................................6
Consideraciones .......................................................................................................................6
I. Metadatos .....................................................................................................................7
a) Contexto y definición ..................................................................................................7
b) Listado de metadatos mínimos para el proceso de transferencia ......................................7
II. Formatos ..................................................................................................................... 15
a) Normalización de formatos ........................................................................................ 15
b) Listado de formatos para el proceso de transferencia ................................................... 15
i. Documentos textuales............................................................................................... 16
ii. Documentos gráficos ................................................................................................ 16
6
Presentación
El propósito de este documento es definir las características que deben poseer los documentos
electrónicos que son transferidos al Archivo Nacional, tanto desde el punto de vista de su formato,
como de los metadatos que los deben acompañar.
Para cumplir este propósito, el documento se organiza en dos secciones. En la primera, se presenta
una breve definición de metadatos para facilitar su comprensión y aplicación en el ámbito de la gestión
documental electrónica así como un listado de metadatos. La incorporación de estos metadatos en las
fases de gestión de los documentos administrativos es fundamental para permitir la transferencia de
estos documentos al Archivo Nacional para ser conservados de forma permanente.
En la segunda sección, se presentan los formatos que deben ser utilizados para los documentos que se
transfieren al Archivo Nacional, distinguiendo entre documentos textuales y gráficos, junto con la
descripción de los factores que han incidido en la selección de determinados formatos y su vinculación
con la preservación a largo plazo.
Consideraciones
En esta entrega, el documento está dirigido a la Secretaría General de la Presidencia para apoyar con
una descripción básica e inicial (en el concepto de producto mínimo viable) de metadatos, a la iniciativa
del “gestor documental para el Estado”. Esta primera versión otorga un marco de trabajo referencial
con relación a metadatos y formatos que es de carácter permanente aunque se aumentará con
mayores especificaciones a publicar en documentos posteriores.
7
I. Metadatos
a) Contexto y definición
Para propósitos del proyecto de Modernización y en el ámbito archivístico y de gestión de documentos,
la norma ISO 15489-1:2001 define a los metadatos como “datos que describen el contexto, el
contenido, y la estructura de los documentos y su gestión a lo largo del tiempo“. El Gobierno de Canadá
los define como “información estructurada sobre las características de un recurso análogo o digital
que ayuda a identificar y administrar ese recurso. Es información sobre un recurso construido para que
un propósito a cumplir una actividad.”1 Complementando lo anterior, señala que el uso de metadatos
ayuda a las instituciones públicas a identificar, autenticar, describir, localizar y gestionar sus recursos
de una manera sistemática y constante, para cumplir con los requerimientos del negocio, rendición de
cuentas y archivo.
La definición del Diccionario de Archivística de Cruz Mundet, agrega algunas particularidades a estas
definiciones al indicar que los metadatos archivísticos sirven para “identificar, autenticar y
contextualizar los documentos así como a las personas, los procesos y los sistemas que los producen,
gestionan, mantienen y utilizan”.
La incorporación de metadatos mínimos en la transferencia de los documentos electrónicos que se
generan y gestionan, nos da la posibilidad de registrar y mantener la información básica para permitir
su paso de un sistema a otro y que, a su vez, puedan aplicarse sobre estos documentos otros procesos
que puedan garantizar su conservación y acceso a largo plazo.
La lista que se presenta a continuación toma como referencia los principales metadatos que deben ser
utilizados para el proceso de transferencia que deben ser generados en las instituciones productoras
de los documentos. La mayoría de ellos pueden ser capturados en forma automática y, los que no son
capturados de esa forma, deben se registrados en forma manual sobre un esquema predefinido de
datos.
b) Listado de metadatos mínimos para el proceso de transferencia
En esta sección se presentan los metadatos mínimos que debe incorporar todo documento2
transferido al Archivo Nacional, por lo cual debiesen considerarse dentro de cualquier sistema de
gestión de documentos. No obstante, es importante recalcar que este conjunto no representa la
1 Records Management Metadata Standard. Gobierno de Canadá. 2006. 2 En este texto, cuando mencionamos el concepto de documento nos referimos a unidades documentales simples que quedan como registro de una función determinada de la institución, en el caso de los expedientes es diferente, ya que es el conjunto ordenado de documentos y actuaciones que sirven de antecedentes y fundamento a la resolución administrativa; por tanto el expediente está compuesto por diferentes documentos (incluso diferentes tipos documentales y fechas de creación) pero que tienen en común que se relacionan con una misma gestión administrativa. Para más información remitirse al documento Definiciones Normativas Archivísticas para la Implementación del Sistema de Transferencias Digitales al Archivo Nacional (Julio 2018).
8
totalidad de metadatos que pueden y/o deben generarse durante la gestión documental y que son
importantes para la gestión y la finalización correcta del expediente electrónico, sino aquellos
esenciales para el proceso de transferencia, dada su relevancia para la preservación del contenido,
contexto y estructura de los documentos en el largo plazo.
3 El manejo, creación y directrices generales para levantar el cuadro de clasificación en las instituciones productoras se describe en el documento Procedimiento para elaborar Cuadro de Clasificación y Definiciones Normativas Archivísticas para la Implementación del Sistema de Transferencias Digitales al Archivo Nacional (Julio 2018). 4 El código del productor, así como su nombre autorizado normalizado será entregado por el Archivo Nacional quien mantendrá un listado actualizado de instituciones con el respectivo código identificador único de cada institución pública del país. 5 Forma de ingreso se refiere a la forma en que los metadatos deben ser capturados por el sistema de gestión documental (SGD).
Metadato Descripción
Nombre Código
Definición Corresponde al código del documento, que se construye teniendo como base el cuadro de clasificación3 de la institución al SGD. Debe incorporar, al menos, el código del productor4, el código de la función asignada en el Cuadro de Clasificación y el código de la serie documental a la que pertenece.
Tipo de datos Alfanumérico
Forma de ingreso
Es registrado de forma automática por el sistema, al generar los documentos electrónicos.
Metadato Descripción del metadato
Nombre Identificador
Definición Combinación alfanumérica que se asigna automáticamente a un documento registrado en un Sistema de Gestión Documental (SGD). Es una unívoca referencia al documento dentro de un contexto determinado.
Tipo de datos Alfanumérico
Forma de ingreso5
Se completa de forma automática por el sistema, que debe asignar a cada documento ingresado un número único que permitirá recuperar el documento específico cuando se requiera.
9
Metadato Descripción
Nombre Nombre del documento
Definición Consiste en una palabra, frase o grupo de caracteres que se utiliza para denominar el documento / expediente con el que se está trabajando. Puede ser formal o atribuido.
Tipo de datos Texto
Forma de ingreso
Puede generarse de forma automática y/o manual.
El título formal es el título adjudicado por quien genera el documento al momento de su creación. Este título puede ser automatizable, dependiendo del tipo del documento.
Cuando esto no es posible, dado que algunos tipos documentales no consideran el uso de un título (por ejemplo, una carta o correo electrónico), existen casos en que la persona responsable debe atribuir uno. Esto se realiza mediante el uso de texto libre. Se sugiere que sea un título breve y representativo del acto administrativo.
Metadato Descripción
Nombre Productor
Definición Nombre de la institución que, en el cumplimiento de sus funciones, genera y/o gestiona los documentos y expedientes que son parte de su sistema de gestión documental y formarán parte de su archivo.
Tipo de datos Texto
Forma de ingreso
Se genera automáticamente. Cada sistema debe incorporar el código y el nombre del productor. Este código autorizado debe proceder de la lista única de códigos de institución que debe conservar en forma actualizada el Archivo Nacional.
Metadato Descripción
Nombre Fecha de creación
Definición Fecha en la que es generado el documento. Equivale igualmente a la fecha de apertura del expediente.
Tipo de datos Fecha (Date Time)
Forma de ingreso
Se genera automáticamente, según formato aaaa-mm-dd hh:mm:ss (ISO 8601)
10
Metadato Descripción
Nombre Fecha de finalización
Definición Fecha del último documento que compone el expediente.
Tipo de datos Fecha (Date Time)
Forma de ingreso
Se genera automáticamente, según formato aaaa-mm-dd hh:mm:ss (ISO 8601).
En caso de ser Unidad Documental Simple se repite el metadato anterior.
Metadato Descripción
Nombre Fecha de captura
Definición Fecha en la cual el documento ingresa al SGD.
Tipo de datos Fecha (Date time)
Forma de ingreso
Se genera automáticamente, según formato aaaa-mm-dd hh:mm:ss (ISO 8601)
Metadato Descripción
Nombre Nivel de Acceso
Definición Indicación relativa al acceso y disposición para consulta de los documentos.
Tipo de datos Texto
Forma de ingreso
Se ingresa manualmente, aunque el valor está basado en vocabulario controlado. En principio, los valores pueden ser Público – Secreto – Reservado. Debe quedar abierta la posibilidad de incorporar nuevos niveles, aunque siempre utilizando un vocabulario controlado.
Metadato Descripción
Nombre Relación
Definición Define la relación entre el expediente y los documentos que lo conforman.
Tipos de datos Alfanumérico
Forma de ingreso
Se registra de forma automática, una vez que el documento se ha relacionado con los otros documentos parte de un expediente específico. Aplica solo para expedientes.
11
Metadato Descripción
Nombre Nivel de agrupación
Definición Nivel de alcance de los metadatos incorporados, puede ser Documento o Expediente.
Tipos de datos Texto
Forma de ingreso
Se completa de forma manual por quien genere el documento (institución productora), estando el valor asociado a un vocabulario controlado. En principio, los valores pueden ser Documento – Expediente. Debe quedar abierta la posibilidad de incorporar nuevos niveles, aunque siempre utilizando un vocabulario controlado.
Metadato Descripción
Nombre Extensión
Definición Volumen y extensión del documento/expediente
Tipo de datos Texto
Forma de ingreso
Ambos datos se completan en forma automática.
Metadato Descripción
Nombre Formato
Definición Estructura utilizada para la transferencia, la conservación y la presentación de los datos. Corresponde a la extensión del archivo electrónico (ejemplo: .pdf .tiff )
Tipo de datos Texto
Forma de ingreso
Se completa de forma automática.
Metadato Descripción
Nombre Nombre del interesado
Definición Nombre de la persona natural o jurídica sobre la que versa el documento/expediente y los actos administrativos que ahí se registran.
Tipos de datos Texto
Forma de ingreso
Se completa en forma manual con la identificación y el registro de la persona que inicia la solicitud o sobre la que se resuelve en el expediente. Debe consignarse Apellido1 Apellido2, Nombre1. En caso de no contar con los nombres completos se
12
consignarán solamente los que se identifiquen en el documento6, evitando escribir solamente iniciales.
Este campo puede quedar sin completar en el caso que el documento no identifique
directamente un sujeto interesado.
Metadato Descripción
Nombre Rut del interesado
Definición Rut (Número de Cédula de identidad) de la persona sobre la que versa el documento/expediente y los actos administrativos que ahí se registran.
Tipos de datos Numérico
Forma de ingreso
Se completa en forma manual con el número de rut de la persona natural o jurídica que inicia la solicitud o sobre la que se resuelve en el expediente.
Este campo puede quedar sin completar en el caso que el documento no identifique
directamente un sujeto interesado o en el caso que no se cuente con un número de
rut asociado.
Metadato Descripción
Nombre Nombre y Versión del software
Definición Identificación de la versión del programa informático que se utilizó para la generación del documento.
Tipos de datos Texto
Forma de ingreso
Se completa en forma automática capturando la versión del software y el año del programa utilizado para generar el documento.
Metadato Descripción
Nombre Tipo de algoritmo
Definición Es el metadato necesario para validar la integridad del documento, el código generado por el resultado del cálculo del algoritmo para garantizar que el documento no será modificado una vez que se conforma el expediente (checksum).
Tipo de dato Numérico
Forma de ingreso
Este dato se registra de forma automática.
6 La definición del conjunto de caracteres (carácter encoding) se realizará en forma posterior.
13
Metadato Descripción
Nombre Cobertura geográfica
Definición Metadato descriptivo que registra el lugar geográfico al que hace referencia el acto del documento.
Tipos de datos Texto
Forma de ingreso
Este dato se completa de forma manual, basado en un vocabulario controlado con
las regiones y comunas del país.
Este campo puede quedar sin completar en el caso que el documento no identifique
una cobertura geográfica diferente al lugar de emisión del documento.
Metadato Descripción
Nombre Cobertura temporal
Definición Indica el metadato descriptivo que registra el tiempo (fechas) al que hace referencia el acto del documento.
Tipos de datos Fecha
Forma de ingreso
Este dato se completa de forma manual, consignando la o las fechas en el formato aaaa-mm-dd.
Este campo puede quedar sin completar en el caso que el documento no identifique una cobertura temporal diferente al lugar de emisión del documento.
Metadato Descripción
Nombre Autor
Definición Se refiere a la institución o persona natural que firma el documento.
Tipo de datos Texto
Forma de ingreso
En el caso que sea la misma Institución Productora, en este campo hay que consignar la Unidad Administrativa que lo firma y remite. Se utiliza este metadato solo a nivel de documento.
Metadato Descripción
Nombre Destinatario
Definición Se refiere a la institución o persona natural destinataria del documento.
Tipo de datos Texto
14
Forma de ingreso
Se completa con el nombre oficial de la institución o con el nombre de la persona natural a quien va dirigido el documento. Para instituciones, el nombre debe provenir de un vocabulario controlado (registro de autoridades). Se usa solo a nivel de documento.
Metadato Descripción
Nombre Disposición
Definición Destino planificado del documento bajo una normativa o cuerpo legal, resolución u oficio que es consecuencia del proceso de valoración documental.
Tipo de datos Texto
Forma de ingreso
Se ingresa de forma automática al momento que se carga el Cuadro de clasificación y la Tabla de Retención Documental.
Metadato Descripción
Nombre Firma Electrónica Avanzada
Definición Es aquella firma electrónica certificada por un prestador acreditado, que ha sido creada usando medios que el titular mantiene bajo su exclusivo control, de manera que se vincule únicamente al mismo y a los datos a los que se refiere, permitiendo la detección posterior de cualquier modificación, verificando la identidad del titular e impidiendo que desconozca la integridad del documento y su autoría (Ley 19799).
Tipo de datos Texto
Forma de ingreso
Se completa en forma automática.
Debe registrarse si contiene firma electrónica avanzada, siendo los valores SI – NO
Metadato Descripción
Nombre Asunto/Materia (si aplica)
Definición Materia o tema de que trata una unidad documental y/o expediente, y que es reflejo de los fines u objetivos perseguidos con su redacción.
Tipo de datos Texto
Forma de ingreso
Se ingresa de forma manual, con un texto proveniente de un vocabulario controlado generado por la misma institución. Se utiliza cuando la materia sobre la que versa el acto público es relevante de destacar y esa información no puede ser extraída de los otros metadatos existentes en el registro (ya sea de esta lista o los propios de la gestión documental de cada institución)
15
Formatos
a) Normalización de formatos
El escenario de constante desarrollo tecnológico ha tenido como una de sus consecuencias la
proliferación de una gran diversidad de formatos que, con diferentes características técnicas, codifican
la información contenida en documentos de diverso tipo (por ejemplo: textuales, fotográficos, sonoros
y audiovisuales).
No obstante, al abordar la preservación de los documentos en el largo plazo, esta diversidad genera
ciertas desventajas, siendo una de las principales la dependencia de todo formato a la disponibilidad
de un determinado software para su correcta interpretación y visualización. Dado el permanente
desarrollo de nuevos formatos, el surgimiento de nuevas versiones de software y la desaparición de
otras que caen en desuso, existen muchos formatos que se ven enfrentados al inminente riesgo de
volverse obsoletos. Este riesgo se ve acrecentado en aquellos casos en que el acceso y uso de un
documento depende de la adquisición de una determinada licencia de software.
La comunidad internacional dedicada a la gestión de información ha identificado las características que
hacen que un formato sea más sostenible en el tiempo. Así, se privilegia el uso de formatos no
propietarios y/o cuyas especificaciones técnicas estén disponibles de forma completa y abierta. Por
otra parte, es relevante la extensión de su uso dentro de determinadas comunidades de usuarios,
siendo importante su aceptación dentro de industria, su reconocimiento dentro de estándares
internacionales y la disponibilidad de alternativas de software compatibles que permitan su acceso y
uso. Finalmente, se considera el nivel de seguridad que ofrecen y las características técnicas que
permiten generar registros de mayor calidad.
Puesto que la permanencia de todos los formatos siempre está sujeta a la evolución tecnológica, es
importante que se monitoreen los cambios en el entorno que, en el largo plazo, podrían generar
cambios dentro del conjunto de formatos que se considera sostenible.
b) Listado de formatos para el proceso de transferencia
A continuación, se presentan los formatos que deberán utilizarse para transferir documentos al
Archivo Nacional. Estos formatos se organizan según el tipo de documento, diferenciando entre
documentos textuales y documentos gráficos (imágenes o fotografías).
Adicionalmente, y de acuerdo con las mejores prácticas internacionales en esta materia, se subdividen
en dos categorías: formatos preferidos y formatos aceptables. Los formatos preferidos corresponden
a aquellos que, de acuerdo con los parámetros mencionados en la sección anterior, cuentan con las
características necesarias para ser preservados en el largo plazo y que, por lo tanto, pueden ser
recibidos por el Archivo Nacional sin necesidad de ser modificados. Por otra parte, los formatos
aceptables son aquellos que, a pesar de ser ampliamente utilizados, no necesariamente cuentan con
las características necesarias para ser preservados en el largo plazo. Por este motivo, requieren
monitoreo constante y podrían ser transformados a formatos normalizados por el Archivo Nacional.
16
En principio, este listado es restrictivo, no obstante, la detección de necesidades específicas dentro de
las instituciones productoras podría llevar a su ampliación, tanto desde el punto de vista de la
incorporación de nuevos tipos de documentos (audiovisuales, de diseño, sonoros, etc.) como de la
aceptación de nuevos formatos dentro de la categoría “preferido” o “aceptable”, luego de la
evaluación correspondiente.
i. Documentos textuales
Formatos preferidos Especificación
Portable Document Format/Archival (PDF/A-1)
ISO 19005-1:2005, Document management – Electronic document file format for long-term preservation – Part 1:
Use of PDF 1.4 (PDF/A-1)
Portable Document Format/Archival (PDF/A-2)
ISO 19005-2:2011, Document management – Electronic document file format for long-term preservation – Part 2:
Use of ISO 32000-1 (PDF/A-2)
OpenDocument Text Format (ODF)
ISO/IEC 26300:2006 Information technology -- OpenDocument Format for Office
Formatos aceptables Especificación
Portable Document Format (PDF) ISO 32000-1:2008, Document management - Portable document format - Part 1: PDF 1.7
ii. Documentos gráficos
Formatos preferidos Especificación
JPEG 2000 ISO/IEC 15444-1:2004, Information technology – JPEG 2000 image coding system:
Tagged image file format TIFF Revision 6.0 Final — June 3, 1992, Adobe Systems Incorporated
Portable Document Format/Archival (PDF/A-1)
ISO 19005-1:2005, Document management – Electronic document file format for long-term preservation – Part 1:
Use of PDF 1.4 (PDF/A-1)
17
Portable Document Format/Archival (PDF/A-2)
ISO 19005-2:2011, Document management – Electronic document file format for long-term preservation – Part 2:
Use of ISO 32000-1 (PDF/A-2)
Formatos aceptables Especificación
JPEG File Interchange Format ISO/IEC 10918-1:1994, Information technology – Digital compression and coding of continuous-tone still images:
Requirements and guidelines
Portable Network Graphics (PNG) ISO/IEC 15948:2004 Information technology - Computer graphics and image