Informe Datos Cientificos en Esp
-
Upload
claudia-silvera -
Category
Documents
-
view
226 -
download
0
Transcript of Informe Datos Cientificos en Esp
-
7/22/2019 Informe Datos Cientificos en Esp
1/59
Diciembre 2012
-
7/22/2019 Informe Datos Cientificos en Esp
2/59
Edicin, Diseo y MaquetacinFundacin Espaola para la Ciencia y la Tecnologa, FECYT, 2012
ConclusionesFundacin Espaola para la Ciencia y la Tecnologa, FECYT.
AutoresGrupo de Trabajo de Depsito y Gestin de datos en Acceso Abierto del proyectoRECOLECTA.
CoordinacinCristina Gonzlez Copeiro (FECYT)Jordi Serrano-Muoz (UPC)
ParticipantesAlicia Garca-Garca (UCV)Antonia Ferrer-Sapena (UPV)
Fernanda Peset (UPV)Isabel Bernal (CSIC)Izaskun Lacunza (FECYT)Javier Gmez (UA)Lus Martnez-Uribe (Fundacin Juan March)Manuela Palafox (UCM)Mercedes de Miguel Estvez (FECYT)Paz Fernndez (Fundacin Juan March)Pilar Rico Castro (FECYT)Ricard de la Vega (CESCA)Victoria Rasero (UC3M)
ColaboradoresAgnes Ponsati (CSIC)Florencia Dieci (UPV)
Fecha de edicinDiciembre 2012
Cmo citar este documentoGrupo de Trabajo de Depsito y Gestin de datos en Acceso Abierto del proyectoRECOLECTA. La conservacin y reutilizacin de los datos cientficos en Espaa. Informe del
grupo de trabajo de buenas prcticas[en lnea] Madrid: Fundacin Espaola para la Ciencia y
la Tecnologa, FECYT (2012) [Consulta 14/01/2013]. Disponible enWWW.FECYT.ES
Este informe est bajo unaLicencia Creative CommonsAtribucin-NoComercial-SinDerivadas 3.0 Unported
http://www.fecyt.es/http://www.fecyt.es/http://www.fecyt.es/http://www.fecyt.es/http://www.fecyt.es/http://www.fecyt.es/http://creativecommons.org/licenses/by-nc-nd/3.0/deed.eshttp://creativecommons.org/licenses/by-nc-nd/3.0/deed.eshttp://creativecommons.org/licenses/by-nc-nd/3.0/deed.eshttp://creativecommons.org/licenses/by-nc-nd/3.0/deed.eshttp://creativecommons.org/licenses/by-nc-nd/3.0/deed.eshttp://www.fecyt.es/ -
7/22/2019 Informe Datos Cientificos en Esp
3/59
3/59
LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS
CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE
TRABAJO DE BUENAS PRCTICAS.
SUMARIO
Introduccin .............................................................................................................................................................................. 4
1. Los datos de investigacin ........................................................................................................................................... 5
2. Actores implicados en la gestin de los datos cientficos ............................................................................... 8
3. Qu son los datos de la investigacin? ............................................................................................................... 10
3.1 Definicin ........................................................................................................................................................................ 10
3.2 Tipos de datos ............................................................................................................................................................... 10
3.3 La gestin de los datos .............................................................................................................................................. 11
4. Infraestructura y Sostenibilidad ............................................................................................................................. 13
5. Buenas prcticas para la gestin de datos de investigacin ...................................................................... 155.1 Desarrollo de un plan de gestin de datos ....................................................................................................... 15
5.2 Formatos ......................................................................................................................................................................... 17
5.3 Metadatos ....................................................................................................................................................................... 17
5.4 Identificador digital de datos ................................................................................................................................. 19
5.5 Marco legal relacionado con la gestin y divulgacin de datos de investigacin ........................... 20
5.6 Preservacin .................................................................................................................................................................. 23
6. Ejemplos de buenas prcticas por disciplinas y actores .............................................................................. 24
6.1 Guas para la gestin de los datos: ....................................................................................................................... 24
6.2 Datos por disciplinas: ................................................................................................................................................ 247. Casos de estudio en Espaa ...................................................................................................................................... 26
7.1 Evolucin de las contribuciones espaolas. Gestin de datos cientficos .......................................... 27
7.1.1 Revisin bibliogrfica de literatura acadmica y profesional............................................. 27
7.1.2 Jornadas y conferencias relacionadas con la gestin de datos de investigacin............... 30
7.1.3 Proyectos relacionados con la gestin de datos y contacto con profesionales del sector 33
8. Caso de estudio: ODiSEA ............................................................................................................................................ 37
8.1 Antecedentes ................................................................................................................................................................. 37
8.2 Objetivo ............................................................................................................................................................................ 37
8.3 Equipo .............................................................................................................................................................................. 38
8.4 Metodologa ................................................................................................................................................................... 38
8.5 El producto: ODiSEA: International Registry on Research Data......................................................... 39
8.6 Lecciones aprendidas ................................................................................................................................................ 39
9. Buenas prcticas ............................................................................................................................................................ 41
10. Sobre los casos de estudio en Espaa .................................................................................................................. 42
11. Conclusiones .................................................................................................................................................................... 44
12. Bibliografa ....................................................................................................................................................................... 49
Sobre las instituciones participantes ......................................................................................................................... 56
http://c/Documents%20and%20Settings/ggonzalez/Escritorio/Informe_Datos%20_Cient%C3%ADficos_en_Espa%C3%B1a_14_Ene_2013%20(2).docx%23_Toc346029209http://c/Documents%20and%20Settings/ggonzalez/Escritorio/Informe_Datos%20_Cient%C3%ADficos_en_Espa%C3%B1a_14_Ene_2013%20(2).docx%23_Toc346029209http://c/Documents%20and%20Settings/ggonzalez/Escritorio/Informe_Datos%20_Cient%C3%ADficos_en_Espa%C3%B1a_14_Ene_2013%20(2).docx%23_Toc346029209http://c/Documents%20and%20Settings/ggonzalez/Escritorio/Informe_Datos%20_Cient%C3%ADficos_en_Espa%C3%B1a_14_Ene_2013%20(2).docx%23_Toc346029209 -
7/22/2019 Informe Datos Cientificos en Esp
4/59
4/59
LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS
CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE
TRABAJO DE BUENAS PRCTICAS.
Introduccin
Este informe surge para dar respuesta al reto que se abre dentro del movimiento de acceso abierto
sobre cmo incluir los datos de investigacin junto a las publicaciones cientficas dentro de los
repositorios. Contribuye de esta forma a la mejor aplicacin de la Ley 14/2011, de 1 de junio, de la
Ciencia, la Tecnologa y la Innovacin, en lo que se refiere al artculo 37 de difusin en abierto. Tiene por
objetivo ayudar a la normalizacin de la gestin de los datos en los repositorios con el fin de facilitar su
preservacin, acceso y distribucin. En su contenido se reflejan todos los aspectos importantes que
intervienen en la gestin de los datos, desde su definicin, tipos de datos, actores implicados, buenas
prcticas para la gestin y un panorama general de la situacin en Espaa.
La Fundacin Espaola para la Ciencia y la Tecnologa (FECYT), en colaboracin con Red de Bibliotecas
Universitarias (REBIUN) de la Conferencia de Rectores de las Universidades Espaolas (CRUE), gestiona
y coordina RECOLECTA, un proyecto para la creacin de una red de repositorios institucionales
interoperables y que puede ser considerado como la primera iniciativa nacional en la creacin de una
infraestructura que facilita la open scienceo ciencia en abierto. El objetivo es adems dotar de mayor
visibilidad y servicios a los resultados de la investigacin y de la produccin cientfica espaola.
En el marco de este proyecto en 2012 se puso en marcha un grupo de trabajo cuyo objetivo fue el estudio
del panorama general de la gestin de los datos cientficos de investigacin y su uso en el mbito de los
repositorios.
Nuestro agradecimiento a todas las instituciones participantes en el grupo de trabajo: la Universitat
Politcnica de Catalunya (UPC), la Universidad Carlos III de Madrid (UC3M), la Universidad Complutense
de Madrid (UCM), el Consejo Superior de Investigaciones Cientficas (CSIC), la Universidad de Alicante
(UA), el Centro de Servicios Cientficos y Acadmicos de Catalua (CESCA), el Instituto Juan March y la
Universidad Politcnica de Valencia (UPV).
Confiamos en que este estudio resulte de ayuda e inters para la gestin de los datos de investigacin.
-
7/22/2019 Informe Datos Cientificos en Esp
5/59
5/59
LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS
CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE
TRABAJO DE BUENAS PRCTICAS.
1.LOS DATOS DE INVESTIGACINEn los ltimos aos, el movimiento de Acceso Abierto a la informacin cientfica ha iniciado un debate sobre
nuevas tendencias en el acceso, uso y modelos de negocio de la informacin producida con fondos pblicos.
Este movimiento tiene una presencia importante en el acceso abierto a publicaciones cientficas publicadas
en revistas. En este sentido, mltiples agencias de financiacin e instituciones que realizan investigacin ya
disponen de polticas para garantizar el acceso abierto a publicaciones cientficas financiadas con fondos
pblicos.
El movimiento de acceso abierto y de creacin de e-infraestructuras que den apoyo al uso de informacin
cientfica por la comunidad cientfica ha comenzado a debatir tambin sobre la importancia de los datos de
investigacin. Estos datos de investigacin estn empezando a reconocerse como una fuente deconocimiento propia e independiente de las publicaciones que pueden emplearse en la validacin de los
resultados de investigacin publicados en artculos, para generar nuevo conocimiento y ser explotados por
humanos y mquinas de manera interdisciplinar.
Para asegurar esta explotacin de los datos, es necesario que estn disponibles y accesibles en la red, de la
misma manera que lo estn las publicaciones. Sin embargo, la naturaleza de los datos de investigacin es
muchsimo ms variable y dependiente de la disciplina y de su particular ciclo de vida. Adems, los
requisitos tcnicos y legales para garantizar el acceso son ms complejos que los de las publicaciones.
Existen ya disciplinas de la ciencia con tradicin de depsito y re-uso de datos disponibles en repositorios
temticos, pero muchas otras que no han incluido esta prctica en sus rutinas de investigacin. La gestin
adecuada de los datos requiere, adems, de inversin, personal especializado en la generacin de datos,
explotacin de los mismos y su posterior preservacin, coordinacin para garantizar la interoperabilidad de
los nodos de la infraestructura, cambio de cultura entre el personal investigador, etc.1.
Actualmente, existe ya un acuerdo internacional para considerar la creacin de una infraestructura
transnacional y multidisciplinar que garantice el acceso a los datos de investigacin, que contribuir a
mejorar la calidad de la ciencia, multiplicar sus resultados y evitar duplicidades2
3
. En este mbito, se handado mltiples pasos, particularmente desde agencias de financiacin, para estimular la cultura open
science que incluya a los datos de investigacin como parte de una e-infraestructura que d soporte a la
ciencia del siglo XXI.
1A surfboard for riding the wave: Towards a four country action programme on research data; Knowledge Exchange, 2011;http://www.knowledge-exchange.info/Default.aspx?ID=469 [Consulta 6/12/2012]
2High level expert group on scientific data: Riding the Wave: How Europe can gain from the rising tide of scientific data; European
Union, 2010; http://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdf [Consulta 6/12/2012]3 OECD Principles and Guidelines for Access to Research Data from Public Funding, OECD, 2007;http://www.oecd.org/dataoecd/9/61/38500813.pdf [Consulta 6/12/2012]
http://www.knowledge-exchange.info/Default.aspx?ID=469http://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469 -
7/22/2019 Informe Datos Cientificos en Esp
6/59
6/59
LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS
CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE
TRABAJO DE BUENAS PRCTICAS.
Sin tratar de ser exhaustivos, y a modo de muestra de las tendencias internacionales al respecto, se destacan
en esta introduccin algunos documentos y comunicaciones europeas que estn marcando las tendencias en
la redefinicin del acceso a la informacin cientfica, concebida como una e-infraestructura a disposicin de
la comunidad investigadora y el pblico en general y disponible en acceso abierto cuando el conocimiento
proceda de proyectos financiados con fondos pblicos.
En 2007, la Comisin Europea public una comunicacin sobre informacin cientfica en la era digital,
destacando las primeras acciones previstas por la Comisin para coordinar el paso de la era de la
informacin cientfica en papel al entorno digital4. Estas recomendaciones se centraban en facilitar el acceso
a las publicaciones cientficas, cofinanciar infraestructuras de investigacin (repositorios), y estimular el
debate para futuras polticas al respecto y el debate entre los diferentes actores.
A esta Comunicacin, le siguieron las conclusiones del Consejo sobre informacin cientfica 5que otorgan al
acceso rpido a las publicaciones y datos de investigacin el carcter de crucial para el desarrollo del
Espacio Europeo de Investigacin.
Fruto de estas conclusiones, la Comisin Europea lanz un proyecto piloto en el mbito del Sptimo
Programa Marco, que estimulaba a los beneficiarios de siete reas del programa a depositar sus artculos de
investigacin cientfica en repositorios temticos o institucionales, respetando un periodo de embargo de
entre 6 y 12 meses6
. Como apoyo a este piloto, se financi tambin el proyecto OpenAire, que dotaba deinfraestructura tecnolgica y apoyo tcnico para el cumplimiento del piloto7.
Tambin en 2007, la Organizacin para la Cooperacin y el Desarrollo Econmicos (OCDE) public una gua
para el acceso a los datos de informacin cientfica procedentes de financiacin pblica, que tena por
objetivo proveer de recomendaciones generales a los responsables de poltica cientfica y agencias de
financiacin de los estados miembros para estimular el acceso a los datos de investigacin8.
En 2010, la Comisin Europea encarg al Grupo de alto nivel en datos de investigacin un informe con su
visin sobre el acceso, uso, re-uso y calidad de los datos de investigacin cientfica en 20309. Este informe
4Communication on scientific information in the digital age: access, dissemination and preservation (Com 2007 56 Final);http://ec.europa.eu/research/science-society/document_library/pdf_06/communication-022007_en.pdf [Consulta 6/12/2012]
5Council Conclusions on scientific information in the digital age: access, dissemintation and preservation, European Union, 2007;
http://www.consilium.europa.eu/ueDocs/cms_Data/docs/pressData/en/intm/97236.pdf [Consulta 6/12/2012]6Commission Decision on the adoption and a modification of special clauses applicable to the model grant agreement of FP7
C(2008) 4408 finalhttp://ec.europa.eu/research/press/2008/pdf/decision_grant_agreement.pdf[Consulta 6/12/2012]
7OpenAire FP7 projecthttp://www.openaire.eu/ [Consulta 6/12/2012]
8 OECD Principles and Guidelines for Access to Research Data from Public Funding, OECD, 2007;
http://www.oecd.org/dataoecd/9/61/38500813.pdf [Consulta 6/12/2012]9High level expert group on scientific data: Riding the Wave: How Europe can gain from the rising tide of scientific data; EuropeanUnion, 2010; http://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdf [Consulta 6/12/2012]
http://ec.europa.eu/research/science-society/document_library/pdf_06/communication-022007_en.pdfhttp://www.consilium.europa.eu/ueDocs/cms_Data/docs/pressData/en/intm/97236.pdfhttp://ec.europa.eu/research/press/2008/pdf/decision_grant_agreement.pdfhttp://www.openaire.eu/http://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.oecd.org/dataoecd/9/61/38500813.pdfhttp://www.openaire.eu/http://ec.europa.eu/research/press/2008/pdf/decision_grant_agreement.pdfhttp://www.consilium.europa.eu/ueDocs/cms_Data/docs/pressData/en/intm/97236.pdfhttp://ec.europa.eu/research/science-society/document_library/pdf_06/communication-022007_en.pdf -
7/22/2019 Informe Datos Cientificos en Esp
7/59
7/59
LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS
CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE
TRABAJO DE BUENAS PRCTICAS.
est sirviendo como hoja de ruta europea en la consecucin de una e-infraestructura que maximice los
beneficios del acceso a la informacin cientfica.
En respuesta a este informe, Knowledge Exchange, una asociacin con miembros de instituciones
dedicadas a la creacin de e-infraestructuras para la investigacin y la enseanza superior de cuatro pases
europeos, ha elaborado una propuesta para la creacin de un plan de accin de Gran Bretaa, Dinamarca,
Holanda y Alemania sobre datos de investigacin10.
La Comisin Europea prepara para finales del ao 2012 unas nuevas recomendaciones sobre acceso abierto
y preservacin de la informacin cientfica, que previsiblemente ahondarn en el estmulo del contenido
cientfico en abierto (de publicaciones y datos), las infraestructuras abiertas e interoperables y la open
culture (para investigadores y pblico en general).
A nivel nacional, la recin aprobada Ley de la ciencia, la tecnologa y la innovacin11se suma al estmulo
de creacin de infraestructuras de apoyo a la informacin cientfica, con un artculo especialmente dedicado
al depsito en repositorios institucionales o temticos de artculos cientficos financiados con Presupuestos
Generales del Estado.
El presente informe surge del mbito del proyecto Recolecta y pone de manifiesto algunas consideraciones
importantes que han de tenerse en cuenta en el diseo e implementacin de una poltica de gestin de datosde investigacin, con especial nfasis en la situacin de Espaa con respecto a otros pases. A lo largo de
este informe, se define la variedad de tipos de datos de investigacin, los actores implicados en su gestin
(los repositorios institucionales y temticos, las agencias de financiacin, los centros de datos existentes,
investigadores, bibliotecarios y expertos en la gestin de datos, etc.). Asimismo, se reflexiona sobre los
aspectos econmicos derivados de la creacin de una infraestructura interoperable de gestin de datos. Por
ltimo, el informe pretende contribuir a futuras iniciativas que van a ser necesarias adoptar para la gestin
de los datos resultado de la investigacin, en el mbito de la nueva Ley de la Ciencia, Tecnologa e
Innovacin.
10A surfboard for riding the wave: Towards a four country action programme on research data; Knowledge Exchange, 2011;
http://www.knowledge-exchange.info/Default.aspx?ID=469 [Consulta 6/12/2012]11Ley 14/2011 de la Ciencia, la Tecnologa y la Innovacinhttp://www.boe.es/boe/dias/2011/06/02/pdfs/BOE-A-2011-9617.pdf [Consulta 6/12/2012]
http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.boe.es/boe/dias/2011/06/02/pdfs/BOE-A-2011-9617.pdfhttp://www.boe.es/boe/dias/2011/06/02/pdfs/BOE-A-2011-9617.pdfhttp://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469http://www.knowledge-exchange.info/Default.aspx?ID=469 -
7/22/2019 Informe Datos Cientificos en Esp
8/59
8/59
LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS
CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE
TRABAJO DE BUENAS PRCTICAS.
2.ACTORES IMPLICADOS EN LA GESTIN DE LOS DATOS CIENTFICOSLa e-ciencia ha cambiado las prcticas de la investigacin en todas las reas cientficas. El aumento de la
capacidad computacional permite a los investigadores procesar y compartir grandes cantidades de
informacin. Para facilitar la reutilizacin de los datos cientficos hay que adoptar los estndares utilizados
por la comunidad de datos de investigacin, desarrollar y promocionar guas de buenas prcticas que
ayuden a los investigadores a gestionar adecuadamente sus datos de investigacin, impulsar programas de
formacin que doten a la comunidad cientfica de las competencias necesarias, proteger la propiedad
intelectual de los productores de datos y establecer los mecanismos necesarios para asegurar la calidad.
Para ello, es fundamental alcanzar un alto grado de coordinacin entre los agentes implicados en la gestin
de los datos.
En este apartado se describe el papel que desempean los actores que intervienen en la gestin de los datos
cientficos y las responsabilidades asociadas12.
Investigadores/productores de datos
Proporcionan la evidencia y validacin cientfica de las investigaciones. Si bien esta categora se compone
fundamentalmente de investigadores, en algunos casos hay conjuntos de datos que ya existen y los
cientficos los utilizan para validar sus tesis. La comunidad investigadora puede ser considerada como
productores, autores, y usuarios de los datos de investigacin.
Universidades y Centros de Investigacin
Su principal responsabilidad es establecer la poltica interna de gestin de los datos cientficos. Establecen
los estndares para los distintos tipos de datos y la gua de buenas prcticas. Las instituciones deben asumir
la responsabilidad de promocin para que los resultados de la investigacin de sus investigadores se
depositen en los repositorios institucionales para su custodia y preservacin a corto plazo, proporcionando
la formacin adecuada.
Dentro de las Universidades y centros de Investigacin, cabe destacar aquellos servicios ms relevantes en
la gestin de datos como los servicios de Informtica, Bibliotecas y Servicios de Investigacin. Cada uno de
ellos tiene papeles complementarios (el de Informtica en almacenamiento; el de Biblioteca en metadatos,
apoyo a la publicacin y derechos; y los Servicios de Investigacin en polticas institucionales, planes de
gestin y temas de tica) y es necesario que se coordinen para poder dar un servicio institucional completo.
Repositorios institucionales
Desempean un papel bsico en el almacenamiento de los datos a corto plazo, frente al papel que tienen los
centros de datos de preservacin a largo plazo. Es bsico el uso de estndares que facilite la
interoperabilidad entre los repositorios y los centros de datos. Es muy importante la fiabilidad y robustez
de los enlaces y el establecimiento de mecanismos para la migracin de datos entre los repositorios, as
12Lyon, Liz (2007) Dealing with Data: Roles, Rights, Responsabilities and Relationships. Consultancy Report. UKOLNhttp://www.ukoln.ac.uk/ukoln/staff/e.j.lyon/reports/dealing_with_data_report-final.doc [Consulta 6/12/2012]
http://www.ukoln.ac.uk/ukoln/staff/e.j.lyon/reports/dealing_with_data_report-final.dochttp://www.ukoln.ac.uk/ukoln/staff/e.j.lyon/reports/dealing_with_data_report-final.doc -
7/22/2019 Informe Datos Cientificos en Esp
9/59
9/59
LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS
CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE
TRABAJO DE BUENAS PRCTICAS.
como el mantenimiento de las versiones de los datos si se encuentran en distintos espacios de
almacenamiento. La sostenibilidad del archivo de los datos de investigacin constituye uno de los desafos y
problemas clave.
Centros de datos
Establecen guas de buenas prcticas y la seleccin de los datos que deben preservarse a largo plazo,
facilitando su difusin. Protegen los derechos de propiedad de los productores de los datos y proporcionan
herramientas para su reutilizacin. Desarrollan planes de recuperacin de datos en caso de desastres.
Gestores de datos
El perfil profesional del gestor de datos requiere competencias informticas, conocimiento de la disciplina,
de las prcticas de investigacin y flujos de trabajo, comprensin de las normas tcnicas especficas,
esquemas de metadatos y vocabularios de uso habitual.
Tambin deben conocer cules son los centros de datos nacionales e internacionales de la investigacin en
la disciplina y disponer de un buen conocimiento de los requisitos de publicacin de datos de las revistas
acadmicas ms importantes13. La responsabilidad de los gestores de datos es gestionar y promocionar el
uso de datos desde su creacin para asegurar su uso y su disponibilidad para ser localizados y
reutilizados14.
Usuarios que reutilizan los datos
Deben cumplir las condiciones de la licencia y los permisos de utilizacin, reconociendo los derechos de
propiedad intelectual de los investigadores productores de los datos.
Agencias de financiacin
Las agencias de financiacin implementan las polticas de datos con los actores implicados, determinan las
fechas de preservacin, resuelven problemas de confidencialidad, proteccin de datos y uso de licencias.
Desde comienzos de 2000, las agencias de financiacin de algunos pases ( National Institutes of Health,
Welcome Trust, etc.) han comenzado a pedir la liberacin de datos en diversos grados y con diferentes
niveles de cumplimiento, con el fin de maximizar el retorno de la financiacin a la investigacin. Desde
2010, la National Science Foundationexige que las propuestas de financiacin vayan acompaadas de un
Plan de Gestin de Datos15.
Publicaciones cientficas
Del mismo modo que las agencias de financiacin, los editores de publicaciones cientficas estn enlazando
los artculos de las revistas con los datos de investigacin utilizados, con el fin de compartir esos datos con
lectores e investigadores.
13Lyon, Liz (2012) The Informatics Transform: Re-Engineering Libraries for the Data Decade. The International Journal of Digital
Curation. Volume 7, Issue 1, 2012http://www.ijdc.net/index.php/ijdc/article/view/210/279 [Consulta 6/12/2012]14
Martnez-Uribe, Luis, Macdonald, Stuart (2008). Un nuevo cometido para los bibliotecarios acadmicos: data curation. Elprofesional de la informacin, v.17, n. 3, mayo-junio 200815
Borgman, C.L. (2011). The conundrum of sharing research data. Journal of the American Society for Information Science and
Technologyhttp://papers.ssrn.com/sol3/papers.cfm?abstract_id=186915 [Consulta 6/12/2012]
http://www.ijdc.net/index.php/ijdc/article/view/210/279http://papers.ssrn.com/sol3/papers.cfm?abstract_id=186915http://papers.ssrn.com/sol3/papers.cfm?abstract_id=186915http://www.ijdc.net/index.php/ijdc/article/view/210/279 -
7/22/2019 Informe Datos Cientificos en Esp
10/59
10/59
LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS
CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE
TRABAJO DE BUENAS PRCTICAS.
3.QU SON LOS DATOS DE LA INVESTIGACIN?3.1 Definicin
Definir los datos de la investigacin no es tarea sencilla, los datos producidos por los investigadores forman
un grupo de materiales extremadamente heterogneo y complejo, creado para distintos propsitos y
mediante procesos tambin diferentes. Los datos son el alma de la investigacin, rara vez son objetos
sencillos que pueden ser fcilmente compartidos, sino que encarnan las perspectivas epistemolgicas de sus
creadores16.
La Universidad Australiana de Melbourne aporta la siguiente definicin en su poltica institucional de datos:
Los datos de la investigacin son hechos, observaciones o experiencias en que se basa el argumento, la teora o
la prueba. Los datos pueden ser numricos, descriptivos o visuales. Los datos pueden ser en estado bruto o
analizado, pueden ser experimentales u observacionales. Los datos incluyen: cuadernos de laboratorio,
cuadernos de campo, datos de investigacin primaria (incluidos los datos en papel o en soporte informtico),
cuestionarios, cintas de audio, videos, desarrollo de modelos, fotografas, pelculas, y las comprobaciones y las
respuestas de la prueba. Las colecciones datos para la investigacin pueden incluir diapositivas; diseos y
muestras. En la informacin sobre la procedencia de los datos tambin se podra incluir: el cmo, cundo,
donde se recogi y con que (por ejemplo, instrumentos). El cdigo de software utilizado para generar,
comentar o analizar los datos tambin pueden ser considerados datos.
3.2 Tipos de datos
La National Science Foundation (2007) propone la siguiente categorizacin de datos de investigacin
basada en su origen que ayuda a comprender mejor la variedad de tipos y sus distintas necesidades a la
hora de gestionarse:
Datos observacionales.Son registros histricos, se pueden obtener nicamente en un lugar y en un
momento en el tiempo. Esta caracterstica los hace especialmente importantes a la hora de
preservarlos ya que en caso de que se perdiesen no podran volver a reproducirse. Ejemplos: los
barmetros del Centro de Investigaciones Sociolgicas (CIS), son encuestas de opinin sobre diversos
temas que preocupan a los espaoles. El Banco Nacional de Datos Climatolgicos sera otro caso de
este tipo ya que posee informacin sobre precipitaciones registradas en Espaa desde hace 150 aos.
Datos experimentales. Son los datos que acompaan a los experimentos desde su planificacin y
preparacin hasta la obtencin de resultados. Los experimentos en muchos casos pueden repetirse
16Borgman, CL (2012) On Local or Global? Making Sense of the Data Sharing Imperative. Talk at University of Southern Carolinaon 9th April 2012
-
7/22/2019 Informe Datos Cientificos en Esp
11/59
11/59
LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS
CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE
TRABAJO DE BUENAS PRCTICAS.
para obtener los mismos datos sin embargo en ocasiones el coste de repetir el experimento hace que
no sea rentable repetirlo. Ejemplos: el acelerador de partculas del CERN en Ginebra produce una
cantidad desorbitada de datos experimentales capaz de llenar 100,000 DVDs al ao. En los laboratorios
de investigacin ya sean qumicos, biolgicos o en otras disciplinas tambin se producen gran cantidad
de datos con instrumentos especializados.
Datos computacionales.Estos son los datos que acompaan a las simulaciones que suelen incluir
datos de entrada, ciertos programas y resultados. Para este tipo de datos en la mayora de los casos no
se necesitan los resultados ya que con los datos de entrada, los programas y el ordenador que los
genera debiera de ser posible reproducirlos. Ejemplos: pueden ser datos producidos en centros de
computacin avanzada que simulan el funcionamiento de rganos del cuerpo humano, el movimiento
de los astros o predicen el tiempo.
De esta manera cada disciplina cientfica basar su investigacin en estas tipologas y en aquellas en las que
se puedan subdividir. Ya sean cualitativos, cuantitativos, geogrficos, espaciales, u otros, pertenecern a uno
o a varios de los ejes mencionados.
3.3 La gestin de los datos
La correcta gestin de los datos de investigacin es una parte fundamental de proceso de investigacin. Esta
gestin consiste en la toma de decisiones y acciones desde antes de la creacin de los datos, durante sucreacin y uso y a lo largo de su ciclo de vida. Algunas de las etapas que debe de incluir una correcta gestin
de datos son:
Un plan de gestin de datos como parte de la propuesta de financiacin que anticipe los retos de la
gestin y proponga soluciones a los mismos.
Tratar las cuestiones ticas y legales oportunas referentes a datos personales sensibles, copyright y
licencias de acceso y uso de los datos.
La organizacin y documentacin de los datos de acuerdo a estndares disciplinares e
internacionales que permitan conocer qu son los datos y como se crearon los datos para poder ser
reutilizados.
Mecanismos apropiados de almacenamiento, back-up y seguridad de la informacin que aseguren
la confidencialidad, integridad y disponibilidad de la informacin.
Compartir los datos de manera que se citen de forma estndar y as dar crdito a los creadores de
los mismos.
Archivo de una copia final de los datos en centros de datos especializados que tomen las medidas
necesarias para la preservacin y difusin de los datos.
-
7/22/2019 Informe Datos Cientificos en Esp
12/59
12/59
LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS
CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE
TRABAJO DE BUENAS PRCTICAS.
Para que sea posible gestionar los datos de este modo es necesario que existan polticas, a nivel de agencias
de financiacin e institucional, que definan y aclaren los papeles y responsabilidades de los distintos
actores. La responsabilidad de esta gestin a lo largo del ciclo de vida debe recaer en una variedad de
instituciones tales como las agencias de financiacin, las Universidades, las Bibliotecas, los Centros
Informticos y los propios investigadores. Pero ante todo han de ser los investigadores y sus necesidades el
punto de partida.
La Ligue des Bibliothques Europennes de Recherche - Association of European Research Libraries
(LIBER) cre en 2010 un grupo de trabajo sobre e-Ciencia (Working Group on e-Science), el resultado ha
sido un informe final17que incluye diez recomendaciones para las bibliotecas que se inicien en la gestin de
datos de investigacin, en las conclusiones se destaca que las bibliotecas pueden y deben desempear
tareas en el apoyo a los investigadores en la gestin y planificacin de los datos.
17Christensen-Dalsgaard, Birte et al (2012) Ten recommendations for libraries to get started with research data management:
Final report of the LIBER working group on E-Science / Research Data Management.http://www.libereurope.eu/sites/default/files/WGSC_20120801.pdf [Consulta 9/12/2012]
http://www.libereurope.eu/sites/default/files/WGSC_20120801.pdfhttp://www.libereurope.eu/sites/default/files/WGSC_20120801.pdf -
7/22/2019 Informe Datos Cientificos en Esp
13/59
13/59
LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS
CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE
TRABAJO DE BUENAS PRCTICAS.
4.INFRAESTRUCTURA Y SOSTENIBILIDADLos datos han de ser gestionados por una infraestructura fiable y estable que asegure la confiabilidad y su
integridad. El white paper Strategy for a European Data Infrastructure18recoge los principales requisitos
de infraestructura de diversas iniciativas de datos de algunas disciplinas y comunidades de investigacin a
nivel europeo. En resumen son:
Preservacin de datos a largo plazo incluyendo mecanismos de autenticidad y de control de calidad
de los datos.
Acceso a los datos (ciclo de vida de los datos), servicios de data curation y capacidad de
computacin en la infraestructura (data mining, data processing...).
Distribucin de los datos y federaciones, no solo por motivos de preservacin sino tambin para laoptimizacin y aumento del rendimiento del acceso.
A estos requisitos se les suma que los datos deben estar duplicados para conseguir la alta disponibilidad,
requisito comn de este tipo de sistemas.
Tres aspectos se han de tener en cuenta para dar solucin a estos requisitos:
Sistemas software capaces de gestionar el ciclo de vida de los datos.
Sistemas de almacenamiento masivo de datos. Existen diversas tecnologas para este propsito,
como la arquitectura NAS (Network Attached Storage) de crecimiento horizontal, que permite
escalar rpidamente mediante nodos de tipo comodity en funcin de la demanda. En relacin al
ciclo de vida de los datos, pueden existir muchos factores dependientes de su naturaleza o
disciplina, sin embargo, a nivel de flujos de bits que se almacenan en un soporte fsico, pueden ser
tratados de manera homognea.
Redes de alta capacidad para la transmisin de datos entre diferentes nodos. En Espaa la red
acadmica y de investigacin espaola (RedIRIS) proporciona estos servicios avanzados de
comunicaciones a la comunidad cientfica y universitaria nacional.
Estas infraestructuras han de ser tenidas en cuenta de cara a analizar la viabilidad de las iniciativas para la
gestin de datos, pues sus costes, tanto de adquisicin como de mantenimiento, son elevados. Se estima que
los costes de mantenimiento de repositorios de datos cientficos son de un orden de magnitud mayor que
los tradicionales repositorios de publicaciones19.
18Strategy for a European Data Infrastructure
http://www.csc.fi/english/pages/parade [Consulta 6/12/2012]19 Beagrie N, Chruszcz J and Lavoie B (2008). Keeping Research Data Safe 1. JISChttp://www.jisc.ac.uk/media/documents/publications/keepingresearchdatasafe0408.pdf [Consulta 12/12/12]
http://www.csc.fi/english/pages/paradehttp://www.jisc.ac.uk/media/documents/publications/keepingresearchdatasafe0408.pdfhttp://www.jisc.ac.uk/media/documents/publications/keepingresearchdatasafe0408.pdfhttp://www.csc.fi/english/pages/parade -
7/22/2019 Informe Datos Cientificos en Esp
14/59
14/59
LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS
CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE
TRABAJO DE BUENAS PRCTICAS.
Existen dos principios bsicos para rentabilizar mejor estos costes:
Procesos de seleccin de los datos. No todos los datos han/pueden ser enriquecidos (data
curation) o preservados. Una buena seleccin integrada dentro del ciclo de vida de los datos y
realizada desde el punto de vista del conocimiento especfico de los datos y pensando no slo en su
uso principal, sino tambin en cmo podrn estos datos ser re-usados a posteriori es esencial.
Uso de las economas de escala con respecto a las infraestructuras. Se trata de conseguir una capa
de datos que agrupe infraestructuras de manera transversal, tal y como se realiza por Geant,
RedIRIS o la Anella Cientfica en la capa de conectividad, o como los proyectos Driver hacen
interoperables distintos repositorios de investigacin. No slo se conseguira la comparticin de
costes, sino que adems se aumentaran las sinergias entre distintos grupos de investigacin o
incluso entre diferentes disciplinas.
En apartados anteriores se menciona que los datos pueden ser muy heterogneos, y dependiendo de ellos
los costes asociados a la infraestructura pueden variar sustancialmente. En un extremo de altos costes en
infraestructura se situaran proyectos con masivos datasets como los de los datos producidos por el Large
Hadron Collider o el European Bioinformatics Institute, mientras que en el otro extremo, por ejemplo, se
situara el Worldwide Protein Data Bank Archive, repositorio con ms de 80.000 estructuras en 3D de
molculas, pero que apenas ocupan 150GB de almacenamiento. En este ltimo caso, los costes de
infraestructura no son significativos comparados con las 69 FTE de personal que trabaja en el proyecto20
.
An slo gestionando aquellos datos que sean tiles o imprescindibles, hacindolo en infraestructuras
que aprovechen las economas de escala y sea cual sea el tamao de la infraestructura necesaria, para la
gestin de datos cientficos son necesarias polticas de financiacin de las infraestructuras a largo plazo,
pues los datos son acumulativos y se preservan tpicamente ms all de los ciclos tecnolgicos.
Como se ha mencionado antes, en las propuestas de financiacin de proyectos, se debera detallar un plan
de gestin de datos, incluyendo su viabilidad econmica.
20The Royal Society (2012). Science as an open enterprise http://royalsociety.org/policy/projects/science-public-enterprise/report[Consulta 12/12/12]
http://royalsociety.org/policy/projects/science-public-enterprise/reporthttp://royalsociety.org/policy/projects/science-public-enterprise/report -
7/22/2019 Informe Datos Cientificos en Esp
15/59
15/59
LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS
CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE
TRABAJO DE BUENAS PRCTICAS.
5.BUENAS PRCTICAS PARA LA GESTIN DE DATOS DE INVESTIGACINLos datos de investigacin constituyen uno de los principales activos en el proceso de investigacin
cientfica. Una ptima gestin de dichos datos favorece la innovacin y el desarrollo de la misma, puesto que
permitira la explotacin de datos de alta calidad (compartir reutilizar).
En el marco global de la E-Ciencia, el objeto especfico del control, organizacin, descripcin y preservacin
de datos cientficos es el dataset, que se define como una coleccin de datos reunidos durante la ejecucin
de un proyecto de investigacin. Los datasets son objetos digitales compuestos y heterogneos. Es decir,
pueden comprender diferentes elementos o tipos de datos: documentos de texto, hojas de clculo, ficheros
de operaciones matemticas, grficos, imgenes, etc. El dataset constituye la base de una investigacin y va
asociado a una publicacin cientfica como resultado de dicha investigacin. El dataset adquiere valoraadido si se integra con la publicacin relacionada (linking data: cita y enlace), independientemente de su
ubicacin.
Los datasets se almacenan y gestionan en repositorios interoperables en red integrados en una
infraestructura global de investigacin, desarrollados conforme a estndares internacionales.
Instituciones de educacin superior y agencias de financiacin de la investigacin de varios pases estn
llevando a cabo iniciativas para crear infraestructuras de gestin de datos que posibiliten la reutilizacin de
los datasets, mediante la adopcin de polticas que promueven el acceso abierto y la comparticin de los
datos, y garantizando la sostenibilidad y accesibilidad de los datos a largo plazo.
El movimiento Open Data, en el marco del Open Access, define los datos abiertos como aqullos que se
pueden usar, reutilizar y redistribuir sin otra restriccin que el requisito de atribucin o compartir igual21.
5.1 Desarrollo de un plan de gestin de datos
La responsabilidad de la gestin de los datos corresponde en primer lugar a los investigadores, pero las
instituciones deben proporcionar el soporte tcnico y organizativo a su comunidad. Organizativamente, enun servicio de gestin de datos de investigacin, es imprescindible la colaboracin entre los investigadores
y productores de los datos y los bibliotecarios de datos dentro de una institucin.
Los investigadores son los expertos que deben proporcionar la informacin contextual necesaria para
determinar el origen y el ciclo de vida de los datos. Los bibliotecarios son expertos en la gestin de
informacin y han de proporcionar apoyo especializado y personalizado a los investigadores, as como
21http://opendefinition.org/okd/ [Consulta 6/12/2012]
http://opendefinition.org/okd/http://opendefinition.org/okd/ -
7/22/2019 Informe Datos Cientificos en Esp
16/59
16/59
LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS
CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE
TRABAJO DE BUENAS PRCTICAS.
utilizar los medios tcnicos necesarios para que los datos sean comprendidos e interpretados por otros
investigadores.
Dada la diversidad de datos cientficos, por su naturaleza heterognea y por la cultura especfica de cada
comunidad cientfica, la institucin debe proporcionar a los investigadores un modelo de plan de gestin de
los datos para ahorrar tiempo y esfuerzo en el proceso de la investigacin 22. La planificacin conlleva una
serie de ventajas:
Se pueden encontrar y comprender los datos cuando se necesite utilizarlos.
Se garantiza la continuidad del proyecto independientemente de la participacin de los
investigadores.
Se evitan duplicaciones y tareas innecesarias.
El mantenimiento del conjunto de datos generados permite la validacin de los resultados.
Los datos se pueden compartir permitiendo un alto nivel de colaboracin y de avance en la
investigacin.
Si los datos se ofrecen en abierto tendrn una gran visibilidad.
Otros investigadores que utilicen los datos pueden citarlos y la investigacin obtendr ms
prestigio.
La descripcin mnima de los datos debe tratar los siguientes aspectos:
Contexto, descripcin del proyecto y propsito de la investigacin, metodologa utilizada;
Naturaleza de los datos, historia de los datos, contenido y estructura, terminologa, software, fecha
de creacin y fechas de modificacin, versiones, responsables y participantes;
Formatos de ficheros, estructura y nomenclatura de los ficheros, sistema de almacenamiento,
procedimiento para copias de seguridad;
Aspectos legales, polticas de acceso y seguridad;
El paradigma tecnolgico de un sistema de gestin de datos cientficos incluye los siguientes
requerimientos:
El modelo lgico de datos (relacional) y su sistema de gestin (base de datos) han de permitir su
descripcin, su representacin y su recuperacin;
El sistema de gestin deber permitir una ptima organizacin de los datos, documentarlos,
preservarlos y hacerlos accesibles;
22Existen herramientas para la elaboracin de planes de este tipo, como por ejemplo DMPTool (https://dmp.cdlib.org/ [Consulta
6/12/2012])
https://dmp.cdlib.org/https://dmp.cdlib.org/https://dmp.cdlib.org/https://dmp.cdlib.org/https://dmp.cdlib.org/https://dmp.cdlib.org/https://dmp.cdlib.org/https://dmp.cdlib.org/https://dmp.cdlib.org/ -
7/22/2019 Informe Datos Cientificos en Esp
17/59
17/59
LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS
CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE
TRABAJO DE BUENAS PRCTICAS.
Un software que sea capaz de analizar gran cantidad de datos, procesarlos, tratarlos y obtener
diferentes productos secundarios (Data Mining).
5.2 Formatos
El formato en el que se archivan los datos es un factor primordial para asegurar su preservacin y su
accesibilidad. La evolucin de las tecnologas son la causa de que tanto el hardware como el software se
vuelvan obsoletos. Los investigadores utilizaran el formato y software adecuado a sus necesidades, pero
para garantizar el acceso y la preservacin a largo plazo, habra que tener en cuenta las siguientes
consideraciones:
Deben utilizarse, en la medida de lo posible, formatos abiertos, no propietarios.
El formato utilizado ha de permitir la indizacin del contenido para su potencial recuperacin.Un formato de compresin de datos utiliza menos espacio de almacenamiento.
El formato elegido deber ser estndar (IANA mime types), o estndar de facto para la comunidad
investigadora.
Los ficheros y las carpetas deben estar bien organizados con una estructura ordenada. El sistema de
nomenclatura es importante para identificar los contenidos.
Es necesario llevar un control de versiones de los ficheros para que puedan localizarse las sucesivas
versiones y pueda conocerse los cambios de una con respecto a otra.
5.3 Metadatos
Los metadatos son un conjunto de informacin estructurada que ha de recoger el origen, propsito,
referencia temporal, localizacin geogrfica, creador, condiciones de acceso y trminos de uso de un
dataset. Los metadatos cumplen diferentes funciones relacionadas entre s: la gestin y administracin, la
preservacin, la descripcin, la diseminacin de los datos y la recuperacin de los datos. La documentacin
y descripcin de los datos facilita su localizacin, su comprensin y su utilizacin.
La documentacin del dataset facilitada por el investigador se incluir en el registro de metadatos. Los
metadatos deben incluir al menos la siguiente informacin:
Ttulo: Nombre del proyecto del conjunto de datos o de investigacin que lo produjo
Nombres de los creadoresy las direccionesde la organizacin o personas que han creado los datos.
Cdigo de identificacin de los datos, incluso si es una referencia de uso interno.
Palabras o frases que describen el tema o el contenido de los datos.
Patrocinadores: Las organizaciones o agencias que financiaron la investigacin.
Derechos: Cualquier tipo de derechos de propiedad intelectual de los datos.
Acceso a la informacin: Dnde y cmo sus datos pueden ser accesibles por otros investigadores?
-
7/22/2019 Informe Datos Cientificos en Esp
18/59
18/59
LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS
CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE
TRABAJO DE BUENAS PRCTICAS.
Idioma del contenido.
Fechas clave asociadas a los datos , incluyendo: inicio del proyecto y la fecha de finalizacin, fecha de
lanzamiento, perodo de tiempo cubierto por los datos, y otras fechas relacionadas con la vida til
de datos, por ejemplo, el ciclo de mantenimiento, actualizacin del programa.
Lugar al que hacen referencia los datos(p.e, una ubicacin fsica, cobertura espacial etc).
Metodologa: Cmo se generaron los datos, incluidos los equipos o el software utilizado, el
protocolo experimental, etc?
Procesamiento de datos: toda la informacin acerca de cmo los datos se han alterado o procesado.
Fuentes: Citas a los materiales para los datos procedentes de otras fuentes, incluidos los detalles de
los datos de origen.
Lista de nombres de archivo de la lista de todos los archivos de datos asociados con el proyecto, con
sus nombres y extensiones de archivo (por ejemplo, 'stone.mov').
Formatos de archivo de los datos , por ejemplo, FITS, SPSS, HTML, JPEG, RIF-CS y el software
necesario para leer los datos.
Organizacin de archivos: estructura del archivo de datos (s) y la disposicin de las variables,
cuando sea aplicable.
Lista de variablesen los archivos de datos.
Explicacin de los cdigos o abreviaturas utilizadas en cualquiera de los nombres de los archivos o
las variables en los archivos de datos.
Versionesde fecha / fecha y hora para cada archivo, y usar un ID diferente para cada versin (ver laorganizacin de sus archivos).
Operaciones de comprobacin para verificar si los archivos han cambiado a lo largo del tiempo.
(Algoritmo Checksum para proteger la integridad de los datos).
Los metadatos se estructuran en registros conforme a esquemas normalizados. Los criterios de adopcin de
un esquema u otro dependern de los objetivos que se plantee la organizacin para la gestin de los datos.
Para lograr la interoperabilidad con otros sistemas de gestin de datos es prioritaria la normalizacin. Con
objeto de cumplir todas las funciones antes mencionadas, se suelen combinar diferentes esquemas demetadatos mediante la declaracin del espacio de nombres correspondiente a cada esquema.
Existen varios estndares de metadatos, aunque aqu citaremos aqullos cuyo uso est ms extendido:
Dublin Core Metadata Terms23. Es un esquema muy simple de carcter universal, que puede ser
aplicado a recursos de todo tipo y procedencia.
23http://dublincore.org/documents/dcmi-terms/ [Consulta 6/12/2012]
http://dublincore.org/documents/dcmi-terms/http://dublincore.org/documents/dcmi-terms/ -
7/22/2019 Informe Datos Cientificos en Esp
19/59
19/59
LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS
CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE
TRABAJO DE BUENAS PRCTICAS.
Data Documentation Initiative (DDI)24. Es un esquema diseado especficamente para la
descripcin de conjuntos de datos de ndole social y econmico. Permite documentar el ciclo de
vida completo de los datos.
General International Standard Archival Description(ISAD(G))25. Es un conjunto de elementos
para describir archivos con varios niveles de agregacin. Los procesos descriptivos pueden ser
simultneos a la produccin de los documentos y continuar a lo largo de todo su ciclo vital.
Metadata Encoding and Transmission Standard (METS)26. Se trata de una norma para la
codificacin y agrupacin de metadatos administrativos, tcnicos, de preservacin y descriptivos,
que permite la representacin de objetos digitales complejos con gran exhaustividad. Tambin
permite expresar las relaciones entre las partes de un objeto digital, as como las relaciones entre
distintos objetos.
ISO 19115 for geographic information27. Esquema utilizado para la descripcin de informacin y
servicios geogrficos. Es aplicable a los datasets geogrficos.
Los registros de metadatos se agrupan en sistemas de bsqueda y recuperacin de informacin, y podrn
ser recolectados a travs del protocolo OAI-PMH.
5.4 Identificador digital de datos
El dataset almacenado debe asociarse a un identificador digital nico y persistente que facilite la
verificacin de los datos, la reutilizacin, la diseminacin y el impacto, y el acceso a largo plazo. Losidentificadores conforme a los preceptos de la web semntica deben tener forma de URI. La URI es una
cadena de caracteres que condensa la direccin URL (Uniform Resource Location) y el nombre URN
(Uniform Resource Name) del recurso28.
Hay muchos sistemas diferentes, como por ejemplo:
PURL Uniform Resource Locator. Funcionalmente, un PURL es una URL. Sin embargo, en lugar de
apuntar directamente a la ubicacin de un recurso de Internet, algunos puntos PURL apuntan a unservicio de resolucin intermedia. El servicio de resolucin de PURL asocia el PURL con la direccin
URL real y devuelve la URL para el cliente.
DOI Digital Object Identifier. Es un nombre para una entidad en las redes digitales. Proporciona un
sistema de identificacin permanente y viable y el intercambio interoperable de la informacin
manejada en las redes digitales.
24http://www.ddialliance.org/what [Consulta 6/12/2012]
25http://www.icacds.org.uk/eng/ISAD(G)es.pdf [Consulta 6/12/2012]
26http://www.loc.gov/standards/mets [Consulta 6/12/2012]
27 http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020[Consulta 6/12/2012]28
http://www.w3.org/TR/uri-clarification/ [Consulta 6/12/2012]
http://www.ddialliance.org/whathttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.loc.gov/standards/metshttp://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.w3.org/TR/uri-clarification/http://www.w3.org/TR/uri-clarification/http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020http://www.loc.gov/standards/metshttp://www.loc.gov/standards/metshttp://www.loc.gov/standards/metshttp://www.loc.gov/standards/metshttp://www.loc.gov/standards/metshttp://www.loc.gov/standards/metshttp://www.loc.gov/standards/metshttp://www.loc.gov/standards/metshttp://www.loc.gov/standards/metshttp://www.loc.gov/standards/metshttp://www.loc.gov/standards/metshttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.icacds.org.uk/eng/ISAD(G)es.pdfhttp://www.ddialliance.org/what -
7/22/2019 Informe Datos Cientificos en Esp
20/59
20/59
LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS
CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE
TRABAJO DE BUENAS PRCTICAS.
ACCESSION29Nmeros usados por el National Center for Biotechnology Information (NCBI) son
nicos y citables.
InChI30La IUPAC International Chemical Identifier (InChITM) es un identificador no propietario de
las sustancias qumicas que pueden ser utilizados en las fuentes de datos impresos y electrnicos,
permitiendo as una vinculacin ms fcil de las compilaciones de datos diversos.
5.5 Marco legal relacionado con la gestin y divulgacin de datos de investigacin
La produccin, gestin y diseminacin de datos debe ajustarse a un marco legal en el que existen derechos y
acuerdos que deben ser respetados. Las cuestiones clave al respecto seran:
Qu derechos legales existen sobre los datos y datasets?
A quin pertenecen estos derechos?Qu restricciones legales se han de aplicar para la diseminacin de los datos y datasets?
Qu contratos, permisos y licencias hay que utilizar para cumplir con la legalidad vigente?
Hay que tener en consideracin los siguientes derechos:
Los derechos de propiedad intelectual
La confidencialidad, privacidad y proteccin de datos
Acceso y datos: Teniendo en cuenta las restricciones legales, es necesario identificar qu datos sernaccesibles, identificar quin puede acceder a los datos y con qu propsito. Segn la naturaleza de los datos
debemos atender a las siguientes categoras:
Datos pblicos: pueden ponerse sin restricciones a disposicin de cualquier usuario en acceso
abierto.
Datos restringidos: slo pueden ser consultados por determinados usuarios.
Datos privados: no se pueden hacer pblicos. Son confidenciales.
Privacidad y confidencialidad: Cualquier investigacin que contenga datos de carcter personal tiene quecumplir los preceptos de la legislacin de proteccin de datos. En Espaa la norma que regula estos
aspectos es la Ley Orgnica 15/1999, de 13 de diciembre, de Proteccin de Datos de Carcter Personal, cuyo
objeto es garantizar y proteger en lo que concierne al tratamiento de los datos personales, las libertades
pblicas y los derechos fundamentales de las personas fsicas, y especialmente de su honor e intimidad
personal y familiar. La ley es de aplicacin a los datos de carcter personal registrados en cualquier soporte
fsico. El tratamiento de los datos cubre las actividades de recoleccin, registro, almacenamiento,
29http://www.ncbi.nlm.nih.gov/ [Consulta 6/12/2012]30
http://www.iupac.org/home/publications/e-resources/inchi.html [Consulta 6/12/2012]
http://www.iupac.org/inchihttp://www.iupac.org/inchihttp://www.ncbi.nlm.nih.gov/http://www.iupac.org/home/publications/e-resources/inchi.htmlhttp://www.iupac.org/home/publications/e-resources/inchi.htmlhttp://www.ncbi.nlm.nih.gov/http://www.iupac.org/inchi -
7/22/2019 Informe Datos Cientificos en Esp
21/59
21/59
LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS
CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE
TRABAJO DE BUENAS PRCTICAS.
recuperacin, consulta, uso y diseminacin. Para garantizar el derecho a la proteccin de datos, es necesario
informar a las personas implicadas y solicitar su consentimiento para el tratamiento de sus datos.
Propiedad intelectual y datos: En Espaa la norma principal que regula los derechos de propiedad
intelectual es la Ley de Propiedad Intelectual (Real Decreto Legislativo 1/1996 de 12 de abril por el que se
aprueba el Texto Refundido de la LPI) que ha sufrido varias modificaciones, entre ellas la operada por la Ley
23/2006 de 7 de julio con el objeto de adaptar la normativa espaola a las nuevas circunstancias creadas
por la sociedad de la informacin.
Las colecciones de datos y las bases de datos estn protegidas por propiedad intelectual, segn el art. 12 del
mencionado TRLPI mediante el denominado derecho sui generis, en cuanto que constituyen creaciones
intelectuales. La proteccin se refiere nicamente a su estructura en cuanto forma de expresin de la
seleccin o disposicin de contenidos, no a los datos mismos. Los derechos de autor pertenecen a sus
creadores, siempre que se trate de trabajos originales.
Los derechos morales son derechos de carcter personal que pertenecen exclusivamente a los autores y son
irrenunciables. En virtud de estos derechos corresponde a los autores fundamentalmente, el decidir si su
obra ha de ser divulgada y en qu forma, y exigir el reconocimiento de la autora.
Los derechos de explotacin o copyright son transferibles. El titular de estos derechos posee su ejercicioexclusivo y no pueden ser realizados sin su autorizacin, salvo en los lmites que establece la ley. Los
derechos de explotacin constituyen una serie de actos como el de reproduccin, distribucin,
comunicacin pblica y transformacin.
Existen excepciones al ejercicio de los actos de explotacin, como en el caso de reproduccin para uso
exclusivamente privado, usos en beneficio de personas con discapacidad, uso a ttulo de cita o ilustracin
con fines educativos.
Las obras en situacin de dominio pblico, cuando el plazo de proteccin de los derechos ha expirado,
pueden ser utilizadas de forma libre y gratuita31.
Depsito de los datos: El depsito de los datasets en un repositorio implica el ejercicio de los derechos de
explotacin, por lo que se requiere el permiso explcito del titular de dichos derechos mediante un acuerdo
de cesin no exclusiva de los derechos necesarios.
31El TRLPI establece un plazo de duracin de los derechos de una obra en setenta aos desde su divulgacin, y en setenta aos
desde su creacin si no han sido divulgadas.
-
7/22/2019 Informe Datos Cientificos en Esp
22/59
22/59
LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS
CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE
TRABAJO DE BUENAS PRCTICAS.
Conforme al movimiento Open access, los datos resultantes de proyectos financiados con fondos pblicos
constituyen un bien de inters pblico, por lo que deben estar disponibles en un repositorio en acceso
abierto sin perjuicio de preceptos legales o ticos.
Licencias alternativas al copyright: Como hemos mencionado anteriormente, el titular de los derechos de
explotacin tiene la potestad de determinar quin puede acceder a los datos y bajo qu condiciones. Existen
licencias estndares y libres que el autor puede aplicar a sus datos de investigacin para proporcionar los
trminos en los que compartir y reutilizar dichos datos en el mbito de Internet. Un ejemplo de dichas
licencias son las Creative Commons, que en conjunto constituyen seis licencias que permiten la copia,
distribucin, descarga y transformacin de los documentos digitales:
RECONOCIMIENTO (Attribution):
En cualquier explotacin de la obra autorizada por la licencia har falta reconocer la autora.
NO COMERCIAL (Non Commercial):
La explotacin de la obra queda limitada a usos no comerciales.
SIN OBRAS DERIVADAS (No Derivate Works):
La autorizacin para explotar la obra no incluye la transformacin para crear una obra derivada.
COMPARTIR IGUAL (Share alike):
La explotacin autorizada incluye la creacin de obras derivadas siempre que mantengan la
misma licencia al ser divulgadas.
Mediante la combinacin de estos cuatro preceptos se obtienen seis tipos de licencias:
Reconocimiento de autora (CC BY)
Reconocimiento de autora compartir en idnticas condiciones (CC BY-SA)
Reconocimiento de autora Sin obra derivada (CC BY-ND)
Reconocimiento de autora Sin uso comercial (CC BY-NC)
Reconocimiento de autora Sin uso comercial compartir en idnticas condiciones (CC BY-NC-SA)
Reconocimiento de autora Sin uso comercial Sin obra derivada (CC BY-NC-ND)
Las licencias de la versin CC 4.0 abordan las caractersticas especficas de los datos.
Science Commons es una iniciativa dentro de Creative Commons que, entre otras cosas, pretender derribar
barreras y desarrollar herramientas para facilitar la reutilizacin de datos resultados de proyectos de
-
7/22/2019 Informe Datos Cientificos en Esp
23/59
23/59
LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS
CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE
TRABAJO DE BUENAS PRCTICAS.
investigacin. En esta lnea, Science Commons Open Access Data Protocol32 recoge una metodologa y unas
buenas prcticas para la creacin de herramientas que permitan la integracin de bases de datos cientficos
entre s y su puesta en el dominio pblico.
Siguiendo el modelo de Creative Commons, la Open Knowledge Foundation ha creado unas licencias
especficas para colecciones de datos: The Open Data Commons Licence33. Es importante distinguir entre la
licencia de los datos incluidos en la base de datos y el rgimen de licencia de la base de datos en s. Entre las
licencias de Open Data Commons destacan las Database Contents License, referida a los contenidos de la
base de datos, y la ms radical de todas, la Public Domain Database License, en que los titulares de los
derechos se despojan de ellos para beneficio de todos.
5.6 PreservacinLos datos debern ser preservados y permanecer accesibles y utilizables para la investigacin futura. La
gestin de los datos deber incluir un plan de preservacin conforme a estndares internacionales.
Las cuestiones a plantearse son: Qu datos hay que guardar? Cmo guardarlos?
Hacer copias de seguridad de forma regular que puedan ser utilizadas para restaurar los ficheros originales.
Es necesario constatar la integridad de los ficheros mediante la comprobacin del cdigo MD5 checksum
value, el tamao del fichero y la fecha.
La estrategia de almacenamiento de datos debe contemplar la obsolescencia del hardware y del software.
Conviene copiar los datos en diferentes tipos de soporte fsico, por ejemplo en uno digital y en un disco
duro. Hay que tener en cuenta factores de conservacin de los soportes, como los cambios de temperatura,
la humedad relativa, la luz, etc.
32http://sciencecommons.org/projects/publishing/open-access-data-protocol/[Consulta 12/12/2012]
33
http://opendatacommons.org/licenses/ [Consulta 12/12/2012]
http://sciencecommons.org/projects/publishing/open-access-data-protocol/http://opendatacommons.org/licenses/http://opendatacommons.org/licenses/http://opendatacommons.org/licenses/http://opendatacommons.org/licenses/http://opendatacommons.org/licenses/http://opendatacommons.org/licenses/http://opendatacommons.org/licenses/http://opendatacommons.org/licenses/http://opendatacommons.org/licenses/http://sciencecommons.org/projects/publishing/open-access-data-protocol/ -
7/22/2019 Informe Datos Cientificos en Esp
24/59
24/59
LA CONSERVACIN Y REUTILIZACIN DE LOS DATOS
CIENTFICOS EN ESPAA. INFORME DEL GRUPO DE
TRABAJO DE BUENAS PRCTICAS.
6.EJEMPLOS DE BUENAS PRCTICAS POR DISCIPLINAS Y ACTORES6.1 Guas para la gestin de los datos:
Australian National Data Service: HTTP://ANDS.ORG.AU/RESEARCHERS/MANAGE-DATA.HTML [Consulta
8/12/2012]
Australian National University. Data Management: Information from courses and a manual on data
management:HTTP://ILP.ANU.EDU.AU/DM/ [Consulta 8/12/2012]
CIESIN: Geospatial Electronic Records- Resources on managing and preserving geospatial data and
related electronic records:HTTP://WWW.CIESIN.COLUMBIA.EDU/GER [Consulta 8/12/2012]
Data Management for Researchers: HTTP://ANDS.ORG.AU/RESEARCHERS/MANAGE-DATA.HTML [Consulta
8/12/2012]
Gestin de datos en Humanidades:HTTP://ERCIM-NEWS.ERCIM.EU/EN89/SPECIAL/DATA-MANAGEMENT-IN-
THE-HUMANITIES [Consulta 8/12/2012]
ICPSR Guide to Social Science Data Preparation and Archiving: Outlines best practices throughout
the research process, including applying for a research grant, collecting data, and preparing data for
deposit in a public archive. HTTP://WWW.ICPSR.UMICH.EDU/FILES/ICPSR/ACCESS/DATAPREP.PDF
[Consulta 8/12/2012]
Oak Ridge National Laboratory. Best Practices for Preparing Environmental Data Sets to Share and
Archive. Describes the practices to make data sets ready to share with others:
HTTP://DAAC.ORNL.GOV/PI/BESTPRACTICES-2010.PDF [Consulta 8/12/2012]UK Data Archive: Create & Manage Data: Provides best practice strategies and methods for creating,
preparing and storing shareable datasets. HTTP://WWW.DATA-ARCHIVE.AC.UK/CREATE-MANAGE
[Consulta 8/12/2012]
UK Data Archive: Managing and Sharing Data: a Best Practice Guide for Researchers 3rd. ed.
HTTP://WWW.DATA-ARCHIVE.AC.UK/MEDIA/2894/MANAGINGSHARING.PDF [Consulta 8/12/2012
6.2 Datos por disciplinas:Anotacin y Descripcin de las bases de Datos Biomdicas (Harvard University):
HTTP://ESCHOLARSHIP.UMASSMED.EDU/CGI/VIEWCONTENT.CGI?ARTICLE=1000&CONTEXT=JESLIB [Consulta
8/12/2012]
Arqueologa:HTTP://ARCHAEOLOGYDATASERVICE.AC.UK/ [Consulta 8/12/2012]
Astronoma:HTTP://ADSWWW.HARVARD.EDU/ [Consulta 8/12/2012]
Bioinformtica: HTTP://WWW.EBI.AC.UK/INFORMATION/DATABASES_SITEMAP.HTML [Consulta
8/12/2012]
Ciencias Marinas:HTTP://WWW.MARINE-GEO.ORG/CONTRIBUTE.PHP [Consulta 8/12/2012]Ciencias Qumicas:HTTP://WWW.CHEMSPIDER.COM/ [Consulta 8/12/2012]
http://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ilp.anu.edu.au/dm/http://ilp.anu.edu.au/dm/http://ilp.anu.edu.au/dm/http://ilp.anu.edu.au/dm/http://ilp.anu.edu.au/dm/http://ilp.anu.edu.au/dm/http://ilp.anu.edu.au/dm/http://ilp.anu.edu.au/dm/http://ilp.anu.edu.au/dm/http://ilp.anu.edu.au/dm/http://ilp.anu.edu.au/dm/http://ilp.anu.edu.au/dm/http://ilp.anu.edu.au/dm/http://ilp.anu.edu.au/dm/http://www.ciesin.columbia.edu/gerhttp://www.ciesin.columbia.edu/gerhttp://www.ciesin.columbia.edu/gerhttp://www.ciesin.columbia.edu/gerhttp://www.ciesin.columbia.edu/gerhttp://www.ciesin.columbia.edu/gerhttp://www.ciesin.columbia.edu/gerhttp://www.ciesin.columbia.edu/gerhttp://www.ciesin.columbia.edu/gerhttp://www.ciesin.columbia.edu/gerhttp://www.ciesin.columbia.edu/gerhttp://www.ciesin.columbia.edu/gerhttp://www.ciesin.columbia.edu/gerhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ands.org.au/researchers/manage-data.htmlhttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://ercim-news.ercim.eu/en89/special/data-management-in-the-humanitieshttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://www.icpsr.umich.edu/files/ICPSR/access/dataprep.pdfhttp://daac.ornl.gov/PI/BestPractices-2010.pdfhttp://daac.ornl.gov/PI/BestPractices-2010.pdfhttp://daac.ornl.gov/PI/BestPractices-2010.pdfhttp://daac.ornl.gov/PI/BestPractices-2010.pdfhttp://daac.ornl.gov/PI/BestPractices-2010.pdfhttp://daac.ornl.gov/PI/BestPractices-2010.pdfhttp://daac.ornl.gov/PI/BestPractices-2010.pdfhttp://daac.ornl.gov/PI/BestPractices-2010.pdfhttp://daac.ornl.gov/PI/BestPractices-2010.pdfhttp://daac.ornl.gov/PI/BestPractices-2010.pdfhttp://daac.ornl.gov/PI/BestPractices-2010.pdfhttp://daac.ornl.gov/PI/BestPractices-2010.pdfhttp://daac.ornl.gov/PI/BestPractices-2010.pdfhttp://daac.ornl.gov/PI/BestPractices-2010.pdfhttp://www.data-archive.ac.uk/create-managehttp://www.data-archive.ac.uk/create-managehttp://www.data-archive.ac.uk/create-managehttp://www.data-archive.ac.uk/create-managehttp://www.data-archive.ac.uk/create-managehttp://www.data-archive.ac.uk/create-managehttp://www.data-archive.ac.uk/create-managehttp://www.data-archive.ac.uk/create-managehttp://www.data-archive.ac.uk/create-managehttp://www.data-archive.ac.uk/create-managehttp://www.data-archive.ac.uk/create-managehttp://www.data-archive.ac.uk/create-managehttp://www.data-archive.ac.uk/create-managehttp://www.data-archive.ac.uk/create-managehttp://www.data-archive.ac.uk/create-managehttp://www.data-archive.ac.uk/create-managehttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://www.data-archive.ac.uk/media/2894/managingsharing.pdfhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1000&context=jeslibhttp://archaeologydataservice.ac.uk/http://archaeologydataservice.ac.uk/http://archaeologydataservice.ac.uk/http://archaeologydataservice.ac.uk/http://archaeologydataservice.ac.uk/http://archaeologydataservice.ac.uk/http://archaeologydataservice.ac.uk/http://archaeologydataservice.ac.uk/http://archaeologydataservice.ac.uk/http://archaeologydataservice.ac.uk/http://adswww.harvard.edu/http://adswww.harvard.edu/http://adswww.harvard.edu/http://adswww.harvard.edu/http://adswww.harvard.edu/http://adswww.harvard.edu/h