Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema:...

105
CURSO AVANZADO DE GESTIÓN Y DIFUSIÓN EN ACCESO ABIERTO DE DATOS DE INVESTIGACIÓN Isabel Bernal Oficina Técnica de DIGITAL.CSIC, URICI 12 - 13 de marzo / 2018, CSIC

Transcript of Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema:...

Page 1: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

CURSO AVANZADO DE GESTIOacuteN Y DIFUSIOacuteN EN ACCESO ABIERTO DE DATOS DE INVESTIGACIOacuteN

Isabel Bernal

Oficina Teacutecnica de DIGITALCSIC URICI

12 - 13 de marzo 2018 CSIC

TIPOS DE DATOS DE INVESTIGACIOacuteN

Primer problema ldquoiquestde queacute datos hablamosrdquo (12)

bull DATA Facts measurements recordings records or observations about the world collected by scientists and others with a minimum of contextual interpretation Data may be in any format or medium taking the form of writings notes numbers symbols text images films video sound recordings pictorial reproductions drawings designs or other graphical representations procedural manuals forms diagrams work flow charts equipment descriptions data files data processing algorithms or statistical records httpdictionarycasraiorgData

bull RESEARCH DATA Data that are used as primary sources to support technical or scientific enquiry research scholarship or artistic activity and that are used as evidence in the research process andor are commonly accepted in the research community as necessary to validate research findings and results All other digital and non-digital content have the potential of becoming research data Research data may be experimental data observational data operational data third party data public sector data monitoring data processed data or repurposed data httpdictionarycasraiorgResearch_data

Primer problema ldquoiquestde queacute datos hablamosrdquo (22)

bull Research data are the evidence that underpins the answer to the research question and can be used to validate findings regardless of its form (eg print digital or physical) These might be quantitative information or qualitative statements collected by researchers in the course of their work by experimentation observation modelling interview or other methods or information derived from existing evidence Data may be raw or primary (eg direct from measurement or collection) or derived from primary data for subsequent analysis or interpretation (eg cleaned up or as an extract from a larger data set) or derived from existing sources where the rights may be held by others Data may be defined as lsquorelationalrsquo or lsquofunctionalrsquo components of research (hellip)

bull They may include for example statistics collections of digital images sound recordings transcripts of interviews survey data and fieldwork observations with appropriate annotations an interpretation an artwork archives found objects published texts or a manuscript

Concordat on Open Research Data

Tipos de datos cualitativos

bull Data from structured semi-structured or unstructured interviews focus groups oral histories (audiovideo recordings transcripts notessummaries questionnairesinterview protocols)

bull Field notes (including from participant observation or ethnography)

bull Mapssatellite imagerygeographic data bull Officialpublic documents files reports (diplomatic

public policy propaganda etc) bull Meeting minutes bull Government statistics bull Correspondence memoranda communiqueacutes

queries complaints bull Parliamentarylegislative proceedings bull Testimony in public hearings bull Speeches press conferences bull Military records

bull Court records legal documents (charts wills contracts)

bull Chronicles autobiographies memoirs travel logs diaries

bull Brochures posters flyers

bull Press releases newsletters annual reports

bull Records papers directories bull Internal memos reports meeting minutes bull Positionadvocacy papers mission

statements bull Party platforms bull Personal documents (letters personal

diaries correspondence personal papers) bull Maps diagrams drawings bull Radio broadcasts (audio or transcripts) bull TV programs (video or transcripts) bull Print media (magazine newspaper

articles) bull Electronic media bull Published collections of documents

gazeteers yearbooks etc bull Books articles dissertations working

papers bull Photographs bull Ephemera popular culture visual or audio

materials (printed cloth art music songs etc)

Grados de ldquoOpen datardquo desde un punto de vista legalteacutecnico

bull to be findable (F) or discoverable data and metadata should be richly described to enable attribute-based search

bull to be broadly accessible (A) data and metadata should be retrievable in a variety of formats that are sensible to humans and machines using persistent identifiers

bull to be interoperable (I) the description of metadata elements should follow community guidelines that use an open well defined vocabulary ndash to be reusable (R) the

description of essential recommended and optional metadata elements should be machine processable and verifiable use should be easy and data should be citable to sustain data sharing and recognize the value of data

httpswwwforce11orgfairprinciples

DATOS Y REPOSITORIOS E INFRAESTRUCTURAS OPEN SCIENCE

Repositorios de datos

httpwwwicpsrumicheduicpsrwebNAHDAPindexjsp

httpszenodoorg

2 PARA INVESTIGADORES DE UNA INSTITUCIOacuteN

1 PARA CUALQUIER AUTOR

Buscadores de repositorios de datos httpswwwre3dataorg httpsfairsharingorg httpoadsimmonseduoadwikiData_repositories

Buscadores de datos de investigacioacuten httpswwwdataoneorg httpswwwdataciteorg

Distintos tipos de enfoques

Iniciativa de Mendeley (Elsevier) Agregador de repositorios y otras plataformas y repositorio ldquohueacuterfanordquo internacional httpsdatamendeleycomfaq

El portal de datos abiertos de la UE es el punto de acceso uacutenico a una gran variedad de datos elaborados por las instituciones agencias y otros organismos de la UE Ejemplo

Recursos de intereacutes

bull Cataacutelogo de proyectos de datos abiertos (Universidad de Edimburgo)

bull Glosario sobre datos de Science Europe

GESTIOacuteN Y ACCESO ABIERTO A DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC

En la praacutectica los investigadores quierenhellip

ldquoNecesito urgentemente un DOI para mi

datasetrdquo

ldquoNecesito que los revisores

de mi artiacuteculo accedan a mi

datasetrdquo

ldquoNecesito 1 TB para mi datasetrdquo

ldquoAhora me piden que haga un plan de gestioacuten de datosrdquo

Y DIGITALCSIC tambieacuten quiere

Metadatos de calidad

Gestioacuten de copyright

Buenas praacutecticas cientiacuteficas

bull Metadatos completos y significativos

bull Suficiente informacioacuten contextual

bull Ficheros limpios

bull Formatos estaacutendar

bull Claras licencias de uso

bull Versionado

bull Atribucioacuten completa a todos los autores del dataset

bull Referencias a datos ajenos si procede

Dataset con metadatos

completos y a ser posible en

acceso abierto

iquestDOacuteNDE ESTAacuteN LOS DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC

Datasets que estaacuten asociados a artiacuteculos de revistas con una poliacutetica

de datos yo a proyectos H2020

Datasets que no estaacuten necesariamente vinculados como ldquounderlying datardquo a publicaciones

Datasets en su mayoriacutea imaacutegenesdibujos que son resultado de proyectos de investigacioacuten de muy

largo recorrido

Primer dataset en 2010 11659 items en DIGITALCSIC son datasets (en dctype) de los que algo maacutes de 8300 estaacuten en acceso abierto En colecciones de institutos de Ciencias Agrarias Recursos Naturales Humanidades Biomedicina Ciencias Marinas principalmente Fechas de publicacioacuten 2017 --- 1125 2016 --- 23 2015 --- 2463 2014 --- 3776 2013 --- 3363 2012 --- 17 2011 --- 2 2010 --- 5 1998 --- 2 1997 --- 1 1965 --- 1 1964 --- 865

iquestDoacutende se encuentran los datos de investigacioacuten en DIGITALCSIC

ITEMS INDIVIDUALES

Tipologiacuteas de recursos (dctype)

bull Dataset

bull Imagen

bull Mapas

bull Video

bull Documentos de trabajohellip

bull Con uno o maacutes ficheros

COLECCIONES DE DATOS

bull Estacioacuten Bioloacutegica de Dontildeana (EBD)

bull Instituto de Ciencias del Mar (ICM)

bull Instituto de Ciencias de Patrimonio (INCIPIT)

bull Instituto de Historia (IH)

bull Instituto de Investigaciones Marinas (IIM)

bull Instituto Pirenaico de Ecologiacutea (IPE)

bull Etcetera

COLECCIONES ESPECIALES

bull Colecciones del Proyecto Au

bull Coleccioacuten de Base de datos de Misioacuten de Irlanda

bull Variedades frutales de hueso y pepita

bull Etceacutetera

Viacuteas de carga de datos en DIGITALCSIC

CARGAS AUTOMATIZADAS

bull Gestionadas por la Oficina Teacutecnica del repositorio

bull Importacioacuten masiva de metadatos y ficheros

bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga

bull Esencial la colaboracioacuten de los productores de datos

CARGAS MANUALES

bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores

bull En general son datasets (1 o maacutes ficheros) en 1 solo item

DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN

Plantilla de descripcioacuten de datos en DIGITALCSIC

iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el

tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido

eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema

estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen

asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que

hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos

de los datos iquestLas palabras clave son suficientemente descriptivas y

especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se

encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos

Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles

Mapeo Dublin Core-DataCite

Mapeo con el esquema de metadatos de DataCite

httpsschemadataciteorg

Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes

Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523

Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling

iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo

ARTIacuteCULO

DATASET

Buenas praacutecticas descripcioacuten en ingleacutes

Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones

httpsdigitalcsiceshandle10261139347

Buenas praacutecticas citacioacuten seguacuten Principios FORCE11

bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto

bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal

bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)

bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final

httpsdigitalcsiceshandle10261140497

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)

bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX

bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud

bull httpsdigitalcsiceshandle10261139347

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)

httpsdigitalcsiceshandle10261156967

Buenas praacutecticas referencia a datos ajenos reutilizados

bull Item httpsdigitalcsiceshandle10261140497

Dcrelationisbasedon

E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)

bull Item httpsdigitalcsiceshandle10261141218

Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo

Buenas praacutecticas Metadatos sobre software y formatos

Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051

Buenas praacutecticas fichero readme significativo

bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas

bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt

bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada

bull httpsdigitalcsiceshandle10261135062

Buenas praacutecticas informacioacuten sobre la licencia de uso

bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899

bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40

bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES

ITEM httpsdigitalcsiceshandle10261106217

bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40

CASO 3 DATASET COMPLEJOHETEROGENEO

ITEM httpsdigitalcsiceshandle10261103342

bull Dcdescription

The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0

bull httpsopendatacommonsorgfaqlicensesdb-versus-contents

Buenas praacutecticas denominacioacuten consistente de ficheros

Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003

mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la

denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)

Otros esquemas de metadatos para datos por disciplinas

httpwwwdatacarpentryorglessons

httprd-alliancegithubiometadata-directorysubjects

Descripcioacuten de software bull La descripcioacuten de un software debe ser

suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented

bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86

bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados

bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra

bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 2: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

TIPOS DE DATOS DE INVESTIGACIOacuteN

Primer problema ldquoiquestde queacute datos hablamosrdquo (12)

bull DATA Facts measurements recordings records or observations about the world collected by scientists and others with a minimum of contextual interpretation Data may be in any format or medium taking the form of writings notes numbers symbols text images films video sound recordings pictorial reproductions drawings designs or other graphical representations procedural manuals forms diagrams work flow charts equipment descriptions data files data processing algorithms or statistical records httpdictionarycasraiorgData

bull RESEARCH DATA Data that are used as primary sources to support technical or scientific enquiry research scholarship or artistic activity and that are used as evidence in the research process andor are commonly accepted in the research community as necessary to validate research findings and results All other digital and non-digital content have the potential of becoming research data Research data may be experimental data observational data operational data third party data public sector data monitoring data processed data or repurposed data httpdictionarycasraiorgResearch_data

Primer problema ldquoiquestde queacute datos hablamosrdquo (22)

bull Research data are the evidence that underpins the answer to the research question and can be used to validate findings regardless of its form (eg print digital or physical) These might be quantitative information or qualitative statements collected by researchers in the course of their work by experimentation observation modelling interview or other methods or information derived from existing evidence Data may be raw or primary (eg direct from measurement or collection) or derived from primary data for subsequent analysis or interpretation (eg cleaned up or as an extract from a larger data set) or derived from existing sources where the rights may be held by others Data may be defined as lsquorelationalrsquo or lsquofunctionalrsquo components of research (hellip)

bull They may include for example statistics collections of digital images sound recordings transcripts of interviews survey data and fieldwork observations with appropriate annotations an interpretation an artwork archives found objects published texts or a manuscript

Concordat on Open Research Data

Tipos de datos cualitativos

bull Data from structured semi-structured or unstructured interviews focus groups oral histories (audiovideo recordings transcripts notessummaries questionnairesinterview protocols)

bull Field notes (including from participant observation or ethnography)

bull Mapssatellite imagerygeographic data bull Officialpublic documents files reports (diplomatic

public policy propaganda etc) bull Meeting minutes bull Government statistics bull Correspondence memoranda communiqueacutes

queries complaints bull Parliamentarylegislative proceedings bull Testimony in public hearings bull Speeches press conferences bull Military records

bull Court records legal documents (charts wills contracts)

bull Chronicles autobiographies memoirs travel logs diaries

bull Brochures posters flyers

bull Press releases newsletters annual reports

bull Records papers directories bull Internal memos reports meeting minutes bull Positionadvocacy papers mission

statements bull Party platforms bull Personal documents (letters personal

diaries correspondence personal papers) bull Maps diagrams drawings bull Radio broadcasts (audio or transcripts) bull TV programs (video or transcripts) bull Print media (magazine newspaper

articles) bull Electronic media bull Published collections of documents

gazeteers yearbooks etc bull Books articles dissertations working

papers bull Photographs bull Ephemera popular culture visual or audio

materials (printed cloth art music songs etc)

Grados de ldquoOpen datardquo desde un punto de vista legalteacutecnico

bull to be findable (F) or discoverable data and metadata should be richly described to enable attribute-based search

bull to be broadly accessible (A) data and metadata should be retrievable in a variety of formats that are sensible to humans and machines using persistent identifiers

bull to be interoperable (I) the description of metadata elements should follow community guidelines that use an open well defined vocabulary ndash to be reusable (R) the

description of essential recommended and optional metadata elements should be machine processable and verifiable use should be easy and data should be citable to sustain data sharing and recognize the value of data

httpswwwforce11orgfairprinciples

DATOS Y REPOSITORIOS E INFRAESTRUCTURAS OPEN SCIENCE

Repositorios de datos

httpwwwicpsrumicheduicpsrwebNAHDAPindexjsp

httpszenodoorg

2 PARA INVESTIGADORES DE UNA INSTITUCIOacuteN

1 PARA CUALQUIER AUTOR

Buscadores de repositorios de datos httpswwwre3dataorg httpsfairsharingorg httpoadsimmonseduoadwikiData_repositories

Buscadores de datos de investigacioacuten httpswwwdataoneorg httpswwwdataciteorg

Distintos tipos de enfoques

Iniciativa de Mendeley (Elsevier) Agregador de repositorios y otras plataformas y repositorio ldquohueacuterfanordquo internacional httpsdatamendeleycomfaq

El portal de datos abiertos de la UE es el punto de acceso uacutenico a una gran variedad de datos elaborados por las instituciones agencias y otros organismos de la UE Ejemplo

Recursos de intereacutes

bull Cataacutelogo de proyectos de datos abiertos (Universidad de Edimburgo)

bull Glosario sobre datos de Science Europe

GESTIOacuteN Y ACCESO ABIERTO A DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC

En la praacutectica los investigadores quierenhellip

ldquoNecesito urgentemente un DOI para mi

datasetrdquo

ldquoNecesito que los revisores

de mi artiacuteculo accedan a mi

datasetrdquo

ldquoNecesito 1 TB para mi datasetrdquo

ldquoAhora me piden que haga un plan de gestioacuten de datosrdquo

Y DIGITALCSIC tambieacuten quiere

Metadatos de calidad

Gestioacuten de copyright

Buenas praacutecticas cientiacuteficas

bull Metadatos completos y significativos

bull Suficiente informacioacuten contextual

bull Ficheros limpios

bull Formatos estaacutendar

bull Claras licencias de uso

bull Versionado

bull Atribucioacuten completa a todos los autores del dataset

bull Referencias a datos ajenos si procede

Dataset con metadatos

completos y a ser posible en

acceso abierto

iquestDOacuteNDE ESTAacuteN LOS DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC

Datasets que estaacuten asociados a artiacuteculos de revistas con una poliacutetica

de datos yo a proyectos H2020

Datasets que no estaacuten necesariamente vinculados como ldquounderlying datardquo a publicaciones

Datasets en su mayoriacutea imaacutegenesdibujos que son resultado de proyectos de investigacioacuten de muy

largo recorrido

Primer dataset en 2010 11659 items en DIGITALCSIC son datasets (en dctype) de los que algo maacutes de 8300 estaacuten en acceso abierto En colecciones de institutos de Ciencias Agrarias Recursos Naturales Humanidades Biomedicina Ciencias Marinas principalmente Fechas de publicacioacuten 2017 --- 1125 2016 --- 23 2015 --- 2463 2014 --- 3776 2013 --- 3363 2012 --- 17 2011 --- 2 2010 --- 5 1998 --- 2 1997 --- 1 1965 --- 1 1964 --- 865

iquestDoacutende se encuentran los datos de investigacioacuten en DIGITALCSIC

ITEMS INDIVIDUALES

Tipologiacuteas de recursos (dctype)

bull Dataset

bull Imagen

bull Mapas

bull Video

bull Documentos de trabajohellip

bull Con uno o maacutes ficheros

COLECCIONES DE DATOS

bull Estacioacuten Bioloacutegica de Dontildeana (EBD)

bull Instituto de Ciencias del Mar (ICM)

bull Instituto de Ciencias de Patrimonio (INCIPIT)

bull Instituto de Historia (IH)

bull Instituto de Investigaciones Marinas (IIM)

bull Instituto Pirenaico de Ecologiacutea (IPE)

bull Etcetera

COLECCIONES ESPECIALES

bull Colecciones del Proyecto Au

bull Coleccioacuten de Base de datos de Misioacuten de Irlanda

bull Variedades frutales de hueso y pepita

bull Etceacutetera

Viacuteas de carga de datos en DIGITALCSIC

CARGAS AUTOMATIZADAS

bull Gestionadas por la Oficina Teacutecnica del repositorio

bull Importacioacuten masiva de metadatos y ficheros

bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga

bull Esencial la colaboracioacuten de los productores de datos

CARGAS MANUALES

bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores

bull En general son datasets (1 o maacutes ficheros) en 1 solo item

DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN

Plantilla de descripcioacuten de datos en DIGITALCSIC

iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el

tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido

eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema

estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen

asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que

hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos

de los datos iquestLas palabras clave son suficientemente descriptivas y

especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se

encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos

Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles

Mapeo Dublin Core-DataCite

Mapeo con el esquema de metadatos de DataCite

httpsschemadataciteorg

Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes

Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523

Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling

iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo

ARTIacuteCULO

DATASET

Buenas praacutecticas descripcioacuten en ingleacutes

Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones

httpsdigitalcsiceshandle10261139347

Buenas praacutecticas citacioacuten seguacuten Principios FORCE11

bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto

bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal

bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)

bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final

httpsdigitalcsiceshandle10261140497

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)

bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX

bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud

bull httpsdigitalcsiceshandle10261139347

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)

httpsdigitalcsiceshandle10261156967

Buenas praacutecticas referencia a datos ajenos reutilizados

bull Item httpsdigitalcsiceshandle10261140497

Dcrelationisbasedon

E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)

bull Item httpsdigitalcsiceshandle10261141218

Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo

Buenas praacutecticas Metadatos sobre software y formatos

Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051

Buenas praacutecticas fichero readme significativo

bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas

bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt

bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada

bull httpsdigitalcsiceshandle10261135062

Buenas praacutecticas informacioacuten sobre la licencia de uso

bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899

bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40

bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES

ITEM httpsdigitalcsiceshandle10261106217

bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40

CASO 3 DATASET COMPLEJOHETEROGENEO

ITEM httpsdigitalcsiceshandle10261103342

bull Dcdescription

The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0

bull httpsopendatacommonsorgfaqlicensesdb-versus-contents

Buenas praacutecticas denominacioacuten consistente de ficheros

Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003

mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la

denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)

Otros esquemas de metadatos para datos por disciplinas

httpwwwdatacarpentryorglessons

httprd-alliancegithubiometadata-directorysubjects

Descripcioacuten de software bull La descripcioacuten de un software debe ser

suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented

bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86

bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados

bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra

bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 3: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Primer problema ldquoiquestde queacute datos hablamosrdquo (12)

bull DATA Facts measurements recordings records or observations about the world collected by scientists and others with a minimum of contextual interpretation Data may be in any format or medium taking the form of writings notes numbers symbols text images films video sound recordings pictorial reproductions drawings designs or other graphical representations procedural manuals forms diagrams work flow charts equipment descriptions data files data processing algorithms or statistical records httpdictionarycasraiorgData

bull RESEARCH DATA Data that are used as primary sources to support technical or scientific enquiry research scholarship or artistic activity and that are used as evidence in the research process andor are commonly accepted in the research community as necessary to validate research findings and results All other digital and non-digital content have the potential of becoming research data Research data may be experimental data observational data operational data third party data public sector data monitoring data processed data or repurposed data httpdictionarycasraiorgResearch_data

Primer problema ldquoiquestde queacute datos hablamosrdquo (22)

bull Research data are the evidence that underpins the answer to the research question and can be used to validate findings regardless of its form (eg print digital or physical) These might be quantitative information or qualitative statements collected by researchers in the course of their work by experimentation observation modelling interview or other methods or information derived from existing evidence Data may be raw or primary (eg direct from measurement or collection) or derived from primary data for subsequent analysis or interpretation (eg cleaned up or as an extract from a larger data set) or derived from existing sources where the rights may be held by others Data may be defined as lsquorelationalrsquo or lsquofunctionalrsquo components of research (hellip)

bull They may include for example statistics collections of digital images sound recordings transcripts of interviews survey data and fieldwork observations with appropriate annotations an interpretation an artwork archives found objects published texts or a manuscript

Concordat on Open Research Data

Tipos de datos cualitativos

bull Data from structured semi-structured or unstructured interviews focus groups oral histories (audiovideo recordings transcripts notessummaries questionnairesinterview protocols)

bull Field notes (including from participant observation or ethnography)

bull Mapssatellite imagerygeographic data bull Officialpublic documents files reports (diplomatic

public policy propaganda etc) bull Meeting minutes bull Government statistics bull Correspondence memoranda communiqueacutes

queries complaints bull Parliamentarylegislative proceedings bull Testimony in public hearings bull Speeches press conferences bull Military records

bull Court records legal documents (charts wills contracts)

bull Chronicles autobiographies memoirs travel logs diaries

bull Brochures posters flyers

bull Press releases newsletters annual reports

bull Records papers directories bull Internal memos reports meeting minutes bull Positionadvocacy papers mission

statements bull Party platforms bull Personal documents (letters personal

diaries correspondence personal papers) bull Maps diagrams drawings bull Radio broadcasts (audio or transcripts) bull TV programs (video or transcripts) bull Print media (magazine newspaper

articles) bull Electronic media bull Published collections of documents

gazeteers yearbooks etc bull Books articles dissertations working

papers bull Photographs bull Ephemera popular culture visual or audio

materials (printed cloth art music songs etc)

Grados de ldquoOpen datardquo desde un punto de vista legalteacutecnico

bull to be findable (F) or discoverable data and metadata should be richly described to enable attribute-based search

bull to be broadly accessible (A) data and metadata should be retrievable in a variety of formats that are sensible to humans and machines using persistent identifiers

bull to be interoperable (I) the description of metadata elements should follow community guidelines that use an open well defined vocabulary ndash to be reusable (R) the

description of essential recommended and optional metadata elements should be machine processable and verifiable use should be easy and data should be citable to sustain data sharing and recognize the value of data

httpswwwforce11orgfairprinciples

DATOS Y REPOSITORIOS E INFRAESTRUCTURAS OPEN SCIENCE

Repositorios de datos

httpwwwicpsrumicheduicpsrwebNAHDAPindexjsp

httpszenodoorg

2 PARA INVESTIGADORES DE UNA INSTITUCIOacuteN

1 PARA CUALQUIER AUTOR

Buscadores de repositorios de datos httpswwwre3dataorg httpsfairsharingorg httpoadsimmonseduoadwikiData_repositories

Buscadores de datos de investigacioacuten httpswwwdataoneorg httpswwwdataciteorg

Distintos tipos de enfoques

Iniciativa de Mendeley (Elsevier) Agregador de repositorios y otras plataformas y repositorio ldquohueacuterfanordquo internacional httpsdatamendeleycomfaq

El portal de datos abiertos de la UE es el punto de acceso uacutenico a una gran variedad de datos elaborados por las instituciones agencias y otros organismos de la UE Ejemplo

Recursos de intereacutes

bull Cataacutelogo de proyectos de datos abiertos (Universidad de Edimburgo)

bull Glosario sobre datos de Science Europe

GESTIOacuteN Y ACCESO ABIERTO A DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC

En la praacutectica los investigadores quierenhellip

ldquoNecesito urgentemente un DOI para mi

datasetrdquo

ldquoNecesito que los revisores

de mi artiacuteculo accedan a mi

datasetrdquo

ldquoNecesito 1 TB para mi datasetrdquo

ldquoAhora me piden que haga un plan de gestioacuten de datosrdquo

Y DIGITALCSIC tambieacuten quiere

Metadatos de calidad

Gestioacuten de copyright

Buenas praacutecticas cientiacuteficas

bull Metadatos completos y significativos

bull Suficiente informacioacuten contextual

bull Ficheros limpios

bull Formatos estaacutendar

bull Claras licencias de uso

bull Versionado

bull Atribucioacuten completa a todos los autores del dataset

bull Referencias a datos ajenos si procede

Dataset con metadatos

completos y a ser posible en

acceso abierto

iquestDOacuteNDE ESTAacuteN LOS DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC

Datasets que estaacuten asociados a artiacuteculos de revistas con una poliacutetica

de datos yo a proyectos H2020

Datasets que no estaacuten necesariamente vinculados como ldquounderlying datardquo a publicaciones

Datasets en su mayoriacutea imaacutegenesdibujos que son resultado de proyectos de investigacioacuten de muy

largo recorrido

Primer dataset en 2010 11659 items en DIGITALCSIC son datasets (en dctype) de los que algo maacutes de 8300 estaacuten en acceso abierto En colecciones de institutos de Ciencias Agrarias Recursos Naturales Humanidades Biomedicina Ciencias Marinas principalmente Fechas de publicacioacuten 2017 --- 1125 2016 --- 23 2015 --- 2463 2014 --- 3776 2013 --- 3363 2012 --- 17 2011 --- 2 2010 --- 5 1998 --- 2 1997 --- 1 1965 --- 1 1964 --- 865

iquestDoacutende se encuentran los datos de investigacioacuten en DIGITALCSIC

ITEMS INDIVIDUALES

Tipologiacuteas de recursos (dctype)

bull Dataset

bull Imagen

bull Mapas

bull Video

bull Documentos de trabajohellip

bull Con uno o maacutes ficheros

COLECCIONES DE DATOS

bull Estacioacuten Bioloacutegica de Dontildeana (EBD)

bull Instituto de Ciencias del Mar (ICM)

bull Instituto de Ciencias de Patrimonio (INCIPIT)

bull Instituto de Historia (IH)

bull Instituto de Investigaciones Marinas (IIM)

bull Instituto Pirenaico de Ecologiacutea (IPE)

bull Etcetera

COLECCIONES ESPECIALES

bull Colecciones del Proyecto Au

bull Coleccioacuten de Base de datos de Misioacuten de Irlanda

bull Variedades frutales de hueso y pepita

bull Etceacutetera

Viacuteas de carga de datos en DIGITALCSIC

CARGAS AUTOMATIZADAS

bull Gestionadas por la Oficina Teacutecnica del repositorio

bull Importacioacuten masiva de metadatos y ficheros

bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga

bull Esencial la colaboracioacuten de los productores de datos

CARGAS MANUALES

bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores

bull En general son datasets (1 o maacutes ficheros) en 1 solo item

DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN

Plantilla de descripcioacuten de datos en DIGITALCSIC

iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el

tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido

eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema

estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen

asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que

hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos

de los datos iquestLas palabras clave son suficientemente descriptivas y

especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se

encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos

Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles

Mapeo Dublin Core-DataCite

Mapeo con el esquema de metadatos de DataCite

httpsschemadataciteorg

Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes

Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523

Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling

iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo

ARTIacuteCULO

DATASET

Buenas praacutecticas descripcioacuten en ingleacutes

Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones

httpsdigitalcsiceshandle10261139347

Buenas praacutecticas citacioacuten seguacuten Principios FORCE11

bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto

bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal

bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)

bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final

httpsdigitalcsiceshandle10261140497

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)

bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX

bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud

bull httpsdigitalcsiceshandle10261139347

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)

httpsdigitalcsiceshandle10261156967

Buenas praacutecticas referencia a datos ajenos reutilizados

bull Item httpsdigitalcsiceshandle10261140497

Dcrelationisbasedon

E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)

bull Item httpsdigitalcsiceshandle10261141218

Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo

Buenas praacutecticas Metadatos sobre software y formatos

Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051

Buenas praacutecticas fichero readme significativo

bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas

bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt

bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada

bull httpsdigitalcsiceshandle10261135062

Buenas praacutecticas informacioacuten sobre la licencia de uso

bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899

bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40

bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES

ITEM httpsdigitalcsiceshandle10261106217

bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40

CASO 3 DATASET COMPLEJOHETEROGENEO

ITEM httpsdigitalcsiceshandle10261103342

bull Dcdescription

The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0

bull httpsopendatacommonsorgfaqlicensesdb-versus-contents

Buenas praacutecticas denominacioacuten consistente de ficheros

Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003

mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la

denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)

Otros esquemas de metadatos para datos por disciplinas

httpwwwdatacarpentryorglessons

httprd-alliancegithubiometadata-directorysubjects

Descripcioacuten de software bull La descripcioacuten de un software debe ser

suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented

bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86

bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados

bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra

bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 4: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Primer problema ldquoiquestde queacute datos hablamosrdquo (22)

bull Research data are the evidence that underpins the answer to the research question and can be used to validate findings regardless of its form (eg print digital or physical) These might be quantitative information or qualitative statements collected by researchers in the course of their work by experimentation observation modelling interview or other methods or information derived from existing evidence Data may be raw or primary (eg direct from measurement or collection) or derived from primary data for subsequent analysis or interpretation (eg cleaned up or as an extract from a larger data set) or derived from existing sources where the rights may be held by others Data may be defined as lsquorelationalrsquo or lsquofunctionalrsquo components of research (hellip)

bull They may include for example statistics collections of digital images sound recordings transcripts of interviews survey data and fieldwork observations with appropriate annotations an interpretation an artwork archives found objects published texts or a manuscript

Concordat on Open Research Data

Tipos de datos cualitativos

bull Data from structured semi-structured or unstructured interviews focus groups oral histories (audiovideo recordings transcripts notessummaries questionnairesinterview protocols)

bull Field notes (including from participant observation or ethnography)

bull Mapssatellite imagerygeographic data bull Officialpublic documents files reports (diplomatic

public policy propaganda etc) bull Meeting minutes bull Government statistics bull Correspondence memoranda communiqueacutes

queries complaints bull Parliamentarylegislative proceedings bull Testimony in public hearings bull Speeches press conferences bull Military records

bull Court records legal documents (charts wills contracts)

bull Chronicles autobiographies memoirs travel logs diaries

bull Brochures posters flyers

bull Press releases newsletters annual reports

bull Records papers directories bull Internal memos reports meeting minutes bull Positionadvocacy papers mission

statements bull Party platforms bull Personal documents (letters personal

diaries correspondence personal papers) bull Maps diagrams drawings bull Radio broadcasts (audio or transcripts) bull TV programs (video or transcripts) bull Print media (magazine newspaper

articles) bull Electronic media bull Published collections of documents

gazeteers yearbooks etc bull Books articles dissertations working

papers bull Photographs bull Ephemera popular culture visual or audio

materials (printed cloth art music songs etc)

Grados de ldquoOpen datardquo desde un punto de vista legalteacutecnico

bull to be findable (F) or discoverable data and metadata should be richly described to enable attribute-based search

bull to be broadly accessible (A) data and metadata should be retrievable in a variety of formats that are sensible to humans and machines using persistent identifiers

bull to be interoperable (I) the description of metadata elements should follow community guidelines that use an open well defined vocabulary ndash to be reusable (R) the

description of essential recommended and optional metadata elements should be machine processable and verifiable use should be easy and data should be citable to sustain data sharing and recognize the value of data

httpswwwforce11orgfairprinciples

DATOS Y REPOSITORIOS E INFRAESTRUCTURAS OPEN SCIENCE

Repositorios de datos

httpwwwicpsrumicheduicpsrwebNAHDAPindexjsp

httpszenodoorg

2 PARA INVESTIGADORES DE UNA INSTITUCIOacuteN

1 PARA CUALQUIER AUTOR

Buscadores de repositorios de datos httpswwwre3dataorg httpsfairsharingorg httpoadsimmonseduoadwikiData_repositories

Buscadores de datos de investigacioacuten httpswwwdataoneorg httpswwwdataciteorg

Distintos tipos de enfoques

Iniciativa de Mendeley (Elsevier) Agregador de repositorios y otras plataformas y repositorio ldquohueacuterfanordquo internacional httpsdatamendeleycomfaq

El portal de datos abiertos de la UE es el punto de acceso uacutenico a una gran variedad de datos elaborados por las instituciones agencias y otros organismos de la UE Ejemplo

Recursos de intereacutes

bull Cataacutelogo de proyectos de datos abiertos (Universidad de Edimburgo)

bull Glosario sobre datos de Science Europe

GESTIOacuteN Y ACCESO ABIERTO A DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC

En la praacutectica los investigadores quierenhellip

ldquoNecesito urgentemente un DOI para mi

datasetrdquo

ldquoNecesito que los revisores

de mi artiacuteculo accedan a mi

datasetrdquo

ldquoNecesito 1 TB para mi datasetrdquo

ldquoAhora me piden que haga un plan de gestioacuten de datosrdquo

Y DIGITALCSIC tambieacuten quiere

Metadatos de calidad

Gestioacuten de copyright

Buenas praacutecticas cientiacuteficas

bull Metadatos completos y significativos

bull Suficiente informacioacuten contextual

bull Ficheros limpios

bull Formatos estaacutendar

bull Claras licencias de uso

bull Versionado

bull Atribucioacuten completa a todos los autores del dataset

bull Referencias a datos ajenos si procede

Dataset con metadatos

completos y a ser posible en

acceso abierto

iquestDOacuteNDE ESTAacuteN LOS DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC

Datasets que estaacuten asociados a artiacuteculos de revistas con una poliacutetica

de datos yo a proyectos H2020

Datasets que no estaacuten necesariamente vinculados como ldquounderlying datardquo a publicaciones

Datasets en su mayoriacutea imaacutegenesdibujos que son resultado de proyectos de investigacioacuten de muy

largo recorrido

Primer dataset en 2010 11659 items en DIGITALCSIC son datasets (en dctype) de los que algo maacutes de 8300 estaacuten en acceso abierto En colecciones de institutos de Ciencias Agrarias Recursos Naturales Humanidades Biomedicina Ciencias Marinas principalmente Fechas de publicacioacuten 2017 --- 1125 2016 --- 23 2015 --- 2463 2014 --- 3776 2013 --- 3363 2012 --- 17 2011 --- 2 2010 --- 5 1998 --- 2 1997 --- 1 1965 --- 1 1964 --- 865

iquestDoacutende se encuentran los datos de investigacioacuten en DIGITALCSIC

ITEMS INDIVIDUALES

Tipologiacuteas de recursos (dctype)

bull Dataset

bull Imagen

bull Mapas

bull Video

bull Documentos de trabajohellip

bull Con uno o maacutes ficheros

COLECCIONES DE DATOS

bull Estacioacuten Bioloacutegica de Dontildeana (EBD)

bull Instituto de Ciencias del Mar (ICM)

bull Instituto de Ciencias de Patrimonio (INCIPIT)

bull Instituto de Historia (IH)

bull Instituto de Investigaciones Marinas (IIM)

bull Instituto Pirenaico de Ecologiacutea (IPE)

bull Etcetera

COLECCIONES ESPECIALES

bull Colecciones del Proyecto Au

bull Coleccioacuten de Base de datos de Misioacuten de Irlanda

bull Variedades frutales de hueso y pepita

bull Etceacutetera

Viacuteas de carga de datos en DIGITALCSIC

CARGAS AUTOMATIZADAS

bull Gestionadas por la Oficina Teacutecnica del repositorio

bull Importacioacuten masiva de metadatos y ficheros

bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga

bull Esencial la colaboracioacuten de los productores de datos

CARGAS MANUALES

bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores

bull En general son datasets (1 o maacutes ficheros) en 1 solo item

DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN

Plantilla de descripcioacuten de datos en DIGITALCSIC

iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el

tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido

eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema

estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen

asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que

hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos

de los datos iquestLas palabras clave son suficientemente descriptivas y

especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se

encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos

Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles

Mapeo Dublin Core-DataCite

Mapeo con el esquema de metadatos de DataCite

httpsschemadataciteorg

Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes

Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523

Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling

iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo

ARTIacuteCULO

DATASET

Buenas praacutecticas descripcioacuten en ingleacutes

Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones

httpsdigitalcsiceshandle10261139347

Buenas praacutecticas citacioacuten seguacuten Principios FORCE11

bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto

bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal

bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)

bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final

httpsdigitalcsiceshandle10261140497

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)

bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX

bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud

bull httpsdigitalcsiceshandle10261139347

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)

httpsdigitalcsiceshandle10261156967

Buenas praacutecticas referencia a datos ajenos reutilizados

bull Item httpsdigitalcsiceshandle10261140497

Dcrelationisbasedon

E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)

bull Item httpsdigitalcsiceshandle10261141218

Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo

Buenas praacutecticas Metadatos sobre software y formatos

Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051

Buenas praacutecticas fichero readme significativo

bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas

bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt

bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada

bull httpsdigitalcsiceshandle10261135062

Buenas praacutecticas informacioacuten sobre la licencia de uso

bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899

bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40

bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES

ITEM httpsdigitalcsiceshandle10261106217

bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40

CASO 3 DATASET COMPLEJOHETEROGENEO

ITEM httpsdigitalcsiceshandle10261103342

bull Dcdescription

The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0

bull httpsopendatacommonsorgfaqlicensesdb-versus-contents

Buenas praacutecticas denominacioacuten consistente de ficheros

Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003

mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la

denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)

Otros esquemas de metadatos para datos por disciplinas

httpwwwdatacarpentryorglessons

httprd-alliancegithubiometadata-directorysubjects

Descripcioacuten de software bull La descripcioacuten de un software debe ser

suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented

bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86

bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados

bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra

bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 5: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Tipos de datos cualitativos

bull Data from structured semi-structured or unstructured interviews focus groups oral histories (audiovideo recordings transcripts notessummaries questionnairesinterview protocols)

bull Field notes (including from participant observation or ethnography)

bull Mapssatellite imagerygeographic data bull Officialpublic documents files reports (diplomatic

public policy propaganda etc) bull Meeting minutes bull Government statistics bull Correspondence memoranda communiqueacutes

queries complaints bull Parliamentarylegislative proceedings bull Testimony in public hearings bull Speeches press conferences bull Military records

bull Court records legal documents (charts wills contracts)

bull Chronicles autobiographies memoirs travel logs diaries

bull Brochures posters flyers

bull Press releases newsletters annual reports

bull Records papers directories bull Internal memos reports meeting minutes bull Positionadvocacy papers mission

statements bull Party platforms bull Personal documents (letters personal

diaries correspondence personal papers) bull Maps diagrams drawings bull Radio broadcasts (audio or transcripts) bull TV programs (video or transcripts) bull Print media (magazine newspaper

articles) bull Electronic media bull Published collections of documents

gazeteers yearbooks etc bull Books articles dissertations working

papers bull Photographs bull Ephemera popular culture visual or audio

materials (printed cloth art music songs etc)

Grados de ldquoOpen datardquo desde un punto de vista legalteacutecnico

bull to be findable (F) or discoverable data and metadata should be richly described to enable attribute-based search

bull to be broadly accessible (A) data and metadata should be retrievable in a variety of formats that are sensible to humans and machines using persistent identifiers

bull to be interoperable (I) the description of metadata elements should follow community guidelines that use an open well defined vocabulary ndash to be reusable (R) the

description of essential recommended and optional metadata elements should be machine processable and verifiable use should be easy and data should be citable to sustain data sharing and recognize the value of data

httpswwwforce11orgfairprinciples

DATOS Y REPOSITORIOS E INFRAESTRUCTURAS OPEN SCIENCE

Repositorios de datos

httpwwwicpsrumicheduicpsrwebNAHDAPindexjsp

httpszenodoorg

2 PARA INVESTIGADORES DE UNA INSTITUCIOacuteN

1 PARA CUALQUIER AUTOR

Buscadores de repositorios de datos httpswwwre3dataorg httpsfairsharingorg httpoadsimmonseduoadwikiData_repositories

Buscadores de datos de investigacioacuten httpswwwdataoneorg httpswwwdataciteorg

Distintos tipos de enfoques

Iniciativa de Mendeley (Elsevier) Agregador de repositorios y otras plataformas y repositorio ldquohueacuterfanordquo internacional httpsdatamendeleycomfaq

El portal de datos abiertos de la UE es el punto de acceso uacutenico a una gran variedad de datos elaborados por las instituciones agencias y otros organismos de la UE Ejemplo

Recursos de intereacutes

bull Cataacutelogo de proyectos de datos abiertos (Universidad de Edimburgo)

bull Glosario sobre datos de Science Europe

GESTIOacuteN Y ACCESO ABIERTO A DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC

En la praacutectica los investigadores quierenhellip

ldquoNecesito urgentemente un DOI para mi

datasetrdquo

ldquoNecesito que los revisores

de mi artiacuteculo accedan a mi

datasetrdquo

ldquoNecesito 1 TB para mi datasetrdquo

ldquoAhora me piden que haga un plan de gestioacuten de datosrdquo

Y DIGITALCSIC tambieacuten quiere

Metadatos de calidad

Gestioacuten de copyright

Buenas praacutecticas cientiacuteficas

bull Metadatos completos y significativos

bull Suficiente informacioacuten contextual

bull Ficheros limpios

bull Formatos estaacutendar

bull Claras licencias de uso

bull Versionado

bull Atribucioacuten completa a todos los autores del dataset

bull Referencias a datos ajenos si procede

Dataset con metadatos

completos y a ser posible en

acceso abierto

iquestDOacuteNDE ESTAacuteN LOS DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC

Datasets que estaacuten asociados a artiacuteculos de revistas con una poliacutetica

de datos yo a proyectos H2020

Datasets que no estaacuten necesariamente vinculados como ldquounderlying datardquo a publicaciones

Datasets en su mayoriacutea imaacutegenesdibujos que son resultado de proyectos de investigacioacuten de muy

largo recorrido

Primer dataset en 2010 11659 items en DIGITALCSIC son datasets (en dctype) de los que algo maacutes de 8300 estaacuten en acceso abierto En colecciones de institutos de Ciencias Agrarias Recursos Naturales Humanidades Biomedicina Ciencias Marinas principalmente Fechas de publicacioacuten 2017 --- 1125 2016 --- 23 2015 --- 2463 2014 --- 3776 2013 --- 3363 2012 --- 17 2011 --- 2 2010 --- 5 1998 --- 2 1997 --- 1 1965 --- 1 1964 --- 865

iquestDoacutende se encuentran los datos de investigacioacuten en DIGITALCSIC

ITEMS INDIVIDUALES

Tipologiacuteas de recursos (dctype)

bull Dataset

bull Imagen

bull Mapas

bull Video

bull Documentos de trabajohellip

bull Con uno o maacutes ficheros

COLECCIONES DE DATOS

bull Estacioacuten Bioloacutegica de Dontildeana (EBD)

bull Instituto de Ciencias del Mar (ICM)

bull Instituto de Ciencias de Patrimonio (INCIPIT)

bull Instituto de Historia (IH)

bull Instituto de Investigaciones Marinas (IIM)

bull Instituto Pirenaico de Ecologiacutea (IPE)

bull Etcetera

COLECCIONES ESPECIALES

bull Colecciones del Proyecto Au

bull Coleccioacuten de Base de datos de Misioacuten de Irlanda

bull Variedades frutales de hueso y pepita

bull Etceacutetera

Viacuteas de carga de datos en DIGITALCSIC

CARGAS AUTOMATIZADAS

bull Gestionadas por la Oficina Teacutecnica del repositorio

bull Importacioacuten masiva de metadatos y ficheros

bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga

bull Esencial la colaboracioacuten de los productores de datos

CARGAS MANUALES

bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores

bull En general son datasets (1 o maacutes ficheros) en 1 solo item

DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN

Plantilla de descripcioacuten de datos en DIGITALCSIC

iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el

tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido

eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema

estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen

asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que

hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos

de los datos iquestLas palabras clave son suficientemente descriptivas y

especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se

encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos

Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles

Mapeo Dublin Core-DataCite

Mapeo con el esquema de metadatos de DataCite

httpsschemadataciteorg

Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes

Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523

Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling

iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo

ARTIacuteCULO

DATASET

Buenas praacutecticas descripcioacuten en ingleacutes

Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones

httpsdigitalcsiceshandle10261139347

Buenas praacutecticas citacioacuten seguacuten Principios FORCE11

bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto

bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal

bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)

bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final

httpsdigitalcsiceshandle10261140497

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)

bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX

bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud

bull httpsdigitalcsiceshandle10261139347

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)

httpsdigitalcsiceshandle10261156967

Buenas praacutecticas referencia a datos ajenos reutilizados

bull Item httpsdigitalcsiceshandle10261140497

Dcrelationisbasedon

E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)

bull Item httpsdigitalcsiceshandle10261141218

Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo

Buenas praacutecticas Metadatos sobre software y formatos

Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051

Buenas praacutecticas fichero readme significativo

bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas

bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt

bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada

bull httpsdigitalcsiceshandle10261135062

Buenas praacutecticas informacioacuten sobre la licencia de uso

bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899

bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40

bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES

ITEM httpsdigitalcsiceshandle10261106217

bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40

CASO 3 DATASET COMPLEJOHETEROGENEO

ITEM httpsdigitalcsiceshandle10261103342

bull Dcdescription

The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0

bull httpsopendatacommonsorgfaqlicensesdb-versus-contents

Buenas praacutecticas denominacioacuten consistente de ficheros

Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003

mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la

denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)

Otros esquemas de metadatos para datos por disciplinas

httpwwwdatacarpentryorglessons

httprd-alliancegithubiometadata-directorysubjects

Descripcioacuten de software bull La descripcioacuten de un software debe ser

suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented

bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86

bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados

bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra

bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 6: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Grados de ldquoOpen datardquo desde un punto de vista legalteacutecnico

bull to be findable (F) or discoverable data and metadata should be richly described to enable attribute-based search

bull to be broadly accessible (A) data and metadata should be retrievable in a variety of formats that are sensible to humans and machines using persistent identifiers

bull to be interoperable (I) the description of metadata elements should follow community guidelines that use an open well defined vocabulary ndash to be reusable (R) the

description of essential recommended and optional metadata elements should be machine processable and verifiable use should be easy and data should be citable to sustain data sharing and recognize the value of data

httpswwwforce11orgfairprinciples

DATOS Y REPOSITORIOS E INFRAESTRUCTURAS OPEN SCIENCE

Repositorios de datos

httpwwwicpsrumicheduicpsrwebNAHDAPindexjsp

httpszenodoorg

2 PARA INVESTIGADORES DE UNA INSTITUCIOacuteN

1 PARA CUALQUIER AUTOR

Buscadores de repositorios de datos httpswwwre3dataorg httpsfairsharingorg httpoadsimmonseduoadwikiData_repositories

Buscadores de datos de investigacioacuten httpswwwdataoneorg httpswwwdataciteorg

Distintos tipos de enfoques

Iniciativa de Mendeley (Elsevier) Agregador de repositorios y otras plataformas y repositorio ldquohueacuterfanordquo internacional httpsdatamendeleycomfaq

El portal de datos abiertos de la UE es el punto de acceso uacutenico a una gran variedad de datos elaborados por las instituciones agencias y otros organismos de la UE Ejemplo

Recursos de intereacutes

bull Cataacutelogo de proyectos de datos abiertos (Universidad de Edimburgo)

bull Glosario sobre datos de Science Europe

GESTIOacuteN Y ACCESO ABIERTO A DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC

En la praacutectica los investigadores quierenhellip

ldquoNecesito urgentemente un DOI para mi

datasetrdquo

ldquoNecesito que los revisores

de mi artiacuteculo accedan a mi

datasetrdquo

ldquoNecesito 1 TB para mi datasetrdquo

ldquoAhora me piden que haga un plan de gestioacuten de datosrdquo

Y DIGITALCSIC tambieacuten quiere

Metadatos de calidad

Gestioacuten de copyright

Buenas praacutecticas cientiacuteficas

bull Metadatos completos y significativos

bull Suficiente informacioacuten contextual

bull Ficheros limpios

bull Formatos estaacutendar

bull Claras licencias de uso

bull Versionado

bull Atribucioacuten completa a todos los autores del dataset

bull Referencias a datos ajenos si procede

Dataset con metadatos

completos y a ser posible en

acceso abierto

iquestDOacuteNDE ESTAacuteN LOS DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC

Datasets que estaacuten asociados a artiacuteculos de revistas con una poliacutetica

de datos yo a proyectos H2020

Datasets que no estaacuten necesariamente vinculados como ldquounderlying datardquo a publicaciones

Datasets en su mayoriacutea imaacutegenesdibujos que son resultado de proyectos de investigacioacuten de muy

largo recorrido

Primer dataset en 2010 11659 items en DIGITALCSIC son datasets (en dctype) de los que algo maacutes de 8300 estaacuten en acceso abierto En colecciones de institutos de Ciencias Agrarias Recursos Naturales Humanidades Biomedicina Ciencias Marinas principalmente Fechas de publicacioacuten 2017 --- 1125 2016 --- 23 2015 --- 2463 2014 --- 3776 2013 --- 3363 2012 --- 17 2011 --- 2 2010 --- 5 1998 --- 2 1997 --- 1 1965 --- 1 1964 --- 865

iquestDoacutende se encuentran los datos de investigacioacuten en DIGITALCSIC

ITEMS INDIVIDUALES

Tipologiacuteas de recursos (dctype)

bull Dataset

bull Imagen

bull Mapas

bull Video

bull Documentos de trabajohellip

bull Con uno o maacutes ficheros

COLECCIONES DE DATOS

bull Estacioacuten Bioloacutegica de Dontildeana (EBD)

bull Instituto de Ciencias del Mar (ICM)

bull Instituto de Ciencias de Patrimonio (INCIPIT)

bull Instituto de Historia (IH)

bull Instituto de Investigaciones Marinas (IIM)

bull Instituto Pirenaico de Ecologiacutea (IPE)

bull Etcetera

COLECCIONES ESPECIALES

bull Colecciones del Proyecto Au

bull Coleccioacuten de Base de datos de Misioacuten de Irlanda

bull Variedades frutales de hueso y pepita

bull Etceacutetera

Viacuteas de carga de datos en DIGITALCSIC

CARGAS AUTOMATIZADAS

bull Gestionadas por la Oficina Teacutecnica del repositorio

bull Importacioacuten masiva de metadatos y ficheros

bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga

bull Esencial la colaboracioacuten de los productores de datos

CARGAS MANUALES

bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores

bull En general son datasets (1 o maacutes ficheros) en 1 solo item

DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN

Plantilla de descripcioacuten de datos en DIGITALCSIC

iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el

tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido

eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema

estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen

asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que

hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos

de los datos iquestLas palabras clave son suficientemente descriptivas y

especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se

encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos

Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles

Mapeo Dublin Core-DataCite

Mapeo con el esquema de metadatos de DataCite

httpsschemadataciteorg

Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes

Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523

Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling

iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo

ARTIacuteCULO

DATASET

Buenas praacutecticas descripcioacuten en ingleacutes

Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones

httpsdigitalcsiceshandle10261139347

Buenas praacutecticas citacioacuten seguacuten Principios FORCE11

bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto

bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal

bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)

bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final

httpsdigitalcsiceshandle10261140497

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)

bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX

bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud

bull httpsdigitalcsiceshandle10261139347

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)

httpsdigitalcsiceshandle10261156967

Buenas praacutecticas referencia a datos ajenos reutilizados

bull Item httpsdigitalcsiceshandle10261140497

Dcrelationisbasedon

E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)

bull Item httpsdigitalcsiceshandle10261141218

Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo

Buenas praacutecticas Metadatos sobre software y formatos

Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051

Buenas praacutecticas fichero readme significativo

bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas

bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt

bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada

bull httpsdigitalcsiceshandle10261135062

Buenas praacutecticas informacioacuten sobre la licencia de uso

bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899

bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40

bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES

ITEM httpsdigitalcsiceshandle10261106217

bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40

CASO 3 DATASET COMPLEJOHETEROGENEO

ITEM httpsdigitalcsiceshandle10261103342

bull Dcdescription

The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0

bull httpsopendatacommonsorgfaqlicensesdb-versus-contents

Buenas praacutecticas denominacioacuten consistente de ficheros

Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003

mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la

denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)

Otros esquemas de metadatos para datos por disciplinas

httpwwwdatacarpentryorglessons

httprd-alliancegithubiometadata-directorysubjects

Descripcioacuten de software bull La descripcioacuten de un software debe ser

suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented

bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86

bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados

bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra

bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 7: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

bull to be findable (F) or discoverable data and metadata should be richly described to enable attribute-based search

bull to be broadly accessible (A) data and metadata should be retrievable in a variety of formats that are sensible to humans and machines using persistent identifiers

bull to be interoperable (I) the description of metadata elements should follow community guidelines that use an open well defined vocabulary ndash to be reusable (R) the

description of essential recommended and optional metadata elements should be machine processable and verifiable use should be easy and data should be citable to sustain data sharing and recognize the value of data

httpswwwforce11orgfairprinciples

DATOS Y REPOSITORIOS E INFRAESTRUCTURAS OPEN SCIENCE

Repositorios de datos

httpwwwicpsrumicheduicpsrwebNAHDAPindexjsp

httpszenodoorg

2 PARA INVESTIGADORES DE UNA INSTITUCIOacuteN

1 PARA CUALQUIER AUTOR

Buscadores de repositorios de datos httpswwwre3dataorg httpsfairsharingorg httpoadsimmonseduoadwikiData_repositories

Buscadores de datos de investigacioacuten httpswwwdataoneorg httpswwwdataciteorg

Distintos tipos de enfoques

Iniciativa de Mendeley (Elsevier) Agregador de repositorios y otras plataformas y repositorio ldquohueacuterfanordquo internacional httpsdatamendeleycomfaq

El portal de datos abiertos de la UE es el punto de acceso uacutenico a una gran variedad de datos elaborados por las instituciones agencias y otros organismos de la UE Ejemplo

Recursos de intereacutes

bull Cataacutelogo de proyectos de datos abiertos (Universidad de Edimburgo)

bull Glosario sobre datos de Science Europe

GESTIOacuteN Y ACCESO ABIERTO A DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC

En la praacutectica los investigadores quierenhellip

ldquoNecesito urgentemente un DOI para mi

datasetrdquo

ldquoNecesito que los revisores

de mi artiacuteculo accedan a mi

datasetrdquo

ldquoNecesito 1 TB para mi datasetrdquo

ldquoAhora me piden que haga un plan de gestioacuten de datosrdquo

Y DIGITALCSIC tambieacuten quiere

Metadatos de calidad

Gestioacuten de copyright

Buenas praacutecticas cientiacuteficas

bull Metadatos completos y significativos

bull Suficiente informacioacuten contextual

bull Ficheros limpios

bull Formatos estaacutendar

bull Claras licencias de uso

bull Versionado

bull Atribucioacuten completa a todos los autores del dataset

bull Referencias a datos ajenos si procede

Dataset con metadatos

completos y a ser posible en

acceso abierto

iquestDOacuteNDE ESTAacuteN LOS DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC

Datasets que estaacuten asociados a artiacuteculos de revistas con una poliacutetica

de datos yo a proyectos H2020

Datasets que no estaacuten necesariamente vinculados como ldquounderlying datardquo a publicaciones

Datasets en su mayoriacutea imaacutegenesdibujos que son resultado de proyectos de investigacioacuten de muy

largo recorrido

Primer dataset en 2010 11659 items en DIGITALCSIC son datasets (en dctype) de los que algo maacutes de 8300 estaacuten en acceso abierto En colecciones de institutos de Ciencias Agrarias Recursos Naturales Humanidades Biomedicina Ciencias Marinas principalmente Fechas de publicacioacuten 2017 --- 1125 2016 --- 23 2015 --- 2463 2014 --- 3776 2013 --- 3363 2012 --- 17 2011 --- 2 2010 --- 5 1998 --- 2 1997 --- 1 1965 --- 1 1964 --- 865

iquestDoacutende se encuentran los datos de investigacioacuten en DIGITALCSIC

ITEMS INDIVIDUALES

Tipologiacuteas de recursos (dctype)

bull Dataset

bull Imagen

bull Mapas

bull Video

bull Documentos de trabajohellip

bull Con uno o maacutes ficheros

COLECCIONES DE DATOS

bull Estacioacuten Bioloacutegica de Dontildeana (EBD)

bull Instituto de Ciencias del Mar (ICM)

bull Instituto de Ciencias de Patrimonio (INCIPIT)

bull Instituto de Historia (IH)

bull Instituto de Investigaciones Marinas (IIM)

bull Instituto Pirenaico de Ecologiacutea (IPE)

bull Etcetera

COLECCIONES ESPECIALES

bull Colecciones del Proyecto Au

bull Coleccioacuten de Base de datos de Misioacuten de Irlanda

bull Variedades frutales de hueso y pepita

bull Etceacutetera

Viacuteas de carga de datos en DIGITALCSIC

CARGAS AUTOMATIZADAS

bull Gestionadas por la Oficina Teacutecnica del repositorio

bull Importacioacuten masiva de metadatos y ficheros

bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga

bull Esencial la colaboracioacuten de los productores de datos

CARGAS MANUALES

bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores

bull En general son datasets (1 o maacutes ficheros) en 1 solo item

DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN

Plantilla de descripcioacuten de datos en DIGITALCSIC

iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el

tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido

eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema

estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen

asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que

hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos

de los datos iquestLas palabras clave son suficientemente descriptivas y

especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se

encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos

Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles

Mapeo Dublin Core-DataCite

Mapeo con el esquema de metadatos de DataCite

httpsschemadataciteorg

Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes

Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523

Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling

iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo

ARTIacuteCULO

DATASET

Buenas praacutecticas descripcioacuten en ingleacutes

Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones

httpsdigitalcsiceshandle10261139347

Buenas praacutecticas citacioacuten seguacuten Principios FORCE11

bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto

bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal

bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)

bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final

httpsdigitalcsiceshandle10261140497

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)

bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX

bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud

bull httpsdigitalcsiceshandle10261139347

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)

httpsdigitalcsiceshandle10261156967

Buenas praacutecticas referencia a datos ajenos reutilizados

bull Item httpsdigitalcsiceshandle10261140497

Dcrelationisbasedon

E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)

bull Item httpsdigitalcsiceshandle10261141218

Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo

Buenas praacutecticas Metadatos sobre software y formatos

Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051

Buenas praacutecticas fichero readme significativo

bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas

bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt

bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada

bull httpsdigitalcsiceshandle10261135062

Buenas praacutecticas informacioacuten sobre la licencia de uso

bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899

bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40

bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES

ITEM httpsdigitalcsiceshandle10261106217

bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40

CASO 3 DATASET COMPLEJOHETEROGENEO

ITEM httpsdigitalcsiceshandle10261103342

bull Dcdescription

The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0

bull httpsopendatacommonsorgfaqlicensesdb-versus-contents

Buenas praacutecticas denominacioacuten consistente de ficheros

Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003

mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la

denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)

Otros esquemas de metadatos para datos por disciplinas

httpwwwdatacarpentryorglessons

httprd-alliancegithubiometadata-directorysubjects

Descripcioacuten de software bull La descripcioacuten de un software debe ser

suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented

bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86

bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados

bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra

bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 8: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

DATOS Y REPOSITORIOS E INFRAESTRUCTURAS OPEN SCIENCE

Repositorios de datos

httpwwwicpsrumicheduicpsrwebNAHDAPindexjsp

httpszenodoorg

2 PARA INVESTIGADORES DE UNA INSTITUCIOacuteN

1 PARA CUALQUIER AUTOR

Buscadores de repositorios de datos httpswwwre3dataorg httpsfairsharingorg httpoadsimmonseduoadwikiData_repositories

Buscadores de datos de investigacioacuten httpswwwdataoneorg httpswwwdataciteorg

Distintos tipos de enfoques

Iniciativa de Mendeley (Elsevier) Agregador de repositorios y otras plataformas y repositorio ldquohueacuterfanordquo internacional httpsdatamendeleycomfaq

El portal de datos abiertos de la UE es el punto de acceso uacutenico a una gran variedad de datos elaborados por las instituciones agencias y otros organismos de la UE Ejemplo

Recursos de intereacutes

bull Cataacutelogo de proyectos de datos abiertos (Universidad de Edimburgo)

bull Glosario sobre datos de Science Europe

GESTIOacuteN Y ACCESO ABIERTO A DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC

En la praacutectica los investigadores quierenhellip

ldquoNecesito urgentemente un DOI para mi

datasetrdquo

ldquoNecesito que los revisores

de mi artiacuteculo accedan a mi

datasetrdquo

ldquoNecesito 1 TB para mi datasetrdquo

ldquoAhora me piden que haga un plan de gestioacuten de datosrdquo

Y DIGITALCSIC tambieacuten quiere

Metadatos de calidad

Gestioacuten de copyright

Buenas praacutecticas cientiacuteficas

bull Metadatos completos y significativos

bull Suficiente informacioacuten contextual

bull Ficheros limpios

bull Formatos estaacutendar

bull Claras licencias de uso

bull Versionado

bull Atribucioacuten completa a todos los autores del dataset

bull Referencias a datos ajenos si procede

Dataset con metadatos

completos y a ser posible en

acceso abierto

iquestDOacuteNDE ESTAacuteN LOS DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC

Datasets que estaacuten asociados a artiacuteculos de revistas con una poliacutetica

de datos yo a proyectos H2020

Datasets que no estaacuten necesariamente vinculados como ldquounderlying datardquo a publicaciones

Datasets en su mayoriacutea imaacutegenesdibujos que son resultado de proyectos de investigacioacuten de muy

largo recorrido

Primer dataset en 2010 11659 items en DIGITALCSIC son datasets (en dctype) de los que algo maacutes de 8300 estaacuten en acceso abierto En colecciones de institutos de Ciencias Agrarias Recursos Naturales Humanidades Biomedicina Ciencias Marinas principalmente Fechas de publicacioacuten 2017 --- 1125 2016 --- 23 2015 --- 2463 2014 --- 3776 2013 --- 3363 2012 --- 17 2011 --- 2 2010 --- 5 1998 --- 2 1997 --- 1 1965 --- 1 1964 --- 865

iquestDoacutende se encuentran los datos de investigacioacuten en DIGITALCSIC

ITEMS INDIVIDUALES

Tipologiacuteas de recursos (dctype)

bull Dataset

bull Imagen

bull Mapas

bull Video

bull Documentos de trabajohellip

bull Con uno o maacutes ficheros

COLECCIONES DE DATOS

bull Estacioacuten Bioloacutegica de Dontildeana (EBD)

bull Instituto de Ciencias del Mar (ICM)

bull Instituto de Ciencias de Patrimonio (INCIPIT)

bull Instituto de Historia (IH)

bull Instituto de Investigaciones Marinas (IIM)

bull Instituto Pirenaico de Ecologiacutea (IPE)

bull Etcetera

COLECCIONES ESPECIALES

bull Colecciones del Proyecto Au

bull Coleccioacuten de Base de datos de Misioacuten de Irlanda

bull Variedades frutales de hueso y pepita

bull Etceacutetera

Viacuteas de carga de datos en DIGITALCSIC

CARGAS AUTOMATIZADAS

bull Gestionadas por la Oficina Teacutecnica del repositorio

bull Importacioacuten masiva de metadatos y ficheros

bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga

bull Esencial la colaboracioacuten de los productores de datos

CARGAS MANUALES

bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores

bull En general son datasets (1 o maacutes ficheros) en 1 solo item

DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN

Plantilla de descripcioacuten de datos en DIGITALCSIC

iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el

tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido

eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema

estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen

asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que

hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos

de los datos iquestLas palabras clave son suficientemente descriptivas y

especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se

encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos

Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles

Mapeo Dublin Core-DataCite

Mapeo con el esquema de metadatos de DataCite

httpsschemadataciteorg

Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes

Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523

Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling

iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo

ARTIacuteCULO

DATASET

Buenas praacutecticas descripcioacuten en ingleacutes

Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones

httpsdigitalcsiceshandle10261139347

Buenas praacutecticas citacioacuten seguacuten Principios FORCE11

bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto

bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal

bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)

bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final

httpsdigitalcsiceshandle10261140497

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)

bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX

bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud

bull httpsdigitalcsiceshandle10261139347

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)

httpsdigitalcsiceshandle10261156967

Buenas praacutecticas referencia a datos ajenos reutilizados

bull Item httpsdigitalcsiceshandle10261140497

Dcrelationisbasedon

E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)

bull Item httpsdigitalcsiceshandle10261141218

Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo

Buenas praacutecticas Metadatos sobre software y formatos

Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051

Buenas praacutecticas fichero readme significativo

bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas

bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt

bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada

bull httpsdigitalcsiceshandle10261135062

Buenas praacutecticas informacioacuten sobre la licencia de uso

bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899

bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40

bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES

ITEM httpsdigitalcsiceshandle10261106217

bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40

CASO 3 DATASET COMPLEJOHETEROGENEO

ITEM httpsdigitalcsiceshandle10261103342

bull Dcdescription

The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0

bull httpsopendatacommonsorgfaqlicensesdb-versus-contents

Buenas praacutecticas denominacioacuten consistente de ficheros

Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003

mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la

denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)

Otros esquemas de metadatos para datos por disciplinas

httpwwwdatacarpentryorglessons

httprd-alliancegithubiometadata-directorysubjects

Descripcioacuten de software bull La descripcioacuten de un software debe ser

suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented

bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86

bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados

bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra

bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 9: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Repositorios de datos

httpwwwicpsrumicheduicpsrwebNAHDAPindexjsp

httpszenodoorg

2 PARA INVESTIGADORES DE UNA INSTITUCIOacuteN

1 PARA CUALQUIER AUTOR

Buscadores de repositorios de datos httpswwwre3dataorg httpsfairsharingorg httpoadsimmonseduoadwikiData_repositories

Buscadores de datos de investigacioacuten httpswwwdataoneorg httpswwwdataciteorg

Distintos tipos de enfoques

Iniciativa de Mendeley (Elsevier) Agregador de repositorios y otras plataformas y repositorio ldquohueacuterfanordquo internacional httpsdatamendeleycomfaq

El portal de datos abiertos de la UE es el punto de acceso uacutenico a una gran variedad de datos elaborados por las instituciones agencias y otros organismos de la UE Ejemplo

Recursos de intereacutes

bull Cataacutelogo de proyectos de datos abiertos (Universidad de Edimburgo)

bull Glosario sobre datos de Science Europe

GESTIOacuteN Y ACCESO ABIERTO A DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC

En la praacutectica los investigadores quierenhellip

ldquoNecesito urgentemente un DOI para mi

datasetrdquo

ldquoNecesito que los revisores

de mi artiacuteculo accedan a mi

datasetrdquo

ldquoNecesito 1 TB para mi datasetrdquo

ldquoAhora me piden que haga un plan de gestioacuten de datosrdquo

Y DIGITALCSIC tambieacuten quiere

Metadatos de calidad

Gestioacuten de copyright

Buenas praacutecticas cientiacuteficas

bull Metadatos completos y significativos

bull Suficiente informacioacuten contextual

bull Ficheros limpios

bull Formatos estaacutendar

bull Claras licencias de uso

bull Versionado

bull Atribucioacuten completa a todos los autores del dataset

bull Referencias a datos ajenos si procede

Dataset con metadatos

completos y a ser posible en

acceso abierto

iquestDOacuteNDE ESTAacuteN LOS DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC

Datasets que estaacuten asociados a artiacuteculos de revistas con una poliacutetica

de datos yo a proyectos H2020

Datasets que no estaacuten necesariamente vinculados como ldquounderlying datardquo a publicaciones

Datasets en su mayoriacutea imaacutegenesdibujos que son resultado de proyectos de investigacioacuten de muy

largo recorrido

Primer dataset en 2010 11659 items en DIGITALCSIC son datasets (en dctype) de los que algo maacutes de 8300 estaacuten en acceso abierto En colecciones de institutos de Ciencias Agrarias Recursos Naturales Humanidades Biomedicina Ciencias Marinas principalmente Fechas de publicacioacuten 2017 --- 1125 2016 --- 23 2015 --- 2463 2014 --- 3776 2013 --- 3363 2012 --- 17 2011 --- 2 2010 --- 5 1998 --- 2 1997 --- 1 1965 --- 1 1964 --- 865

iquestDoacutende se encuentran los datos de investigacioacuten en DIGITALCSIC

ITEMS INDIVIDUALES

Tipologiacuteas de recursos (dctype)

bull Dataset

bull Imagen

bull Mapas

bull Video

bull Documentos de trabajohellip

bull Con uno o maacutes ficheros

COLECCIONES DE DATOS

bull Estacioacuten Bioloacutegica de Dontildeana (EBD)

bull Instituto de Ciencias del Mar (ICM)

bull Instituto de Ciencias de Patrimonio (INCIPIT)

bull Instituto de Historia (IH)

bull Instituto de Investigaciones Marinas (IIM)

bull Instituto Pirenaico de Ecologiacutea (IPE)

bull Etcetera

COLECCIONES ESPECIALES

bull Colecciones del Proyecto Au

bull Coleccioacuten de Base de datos de Misioacuten de Irlanda

bull Variedades frutales de hueso y pepita

bull Etceacutetera

Viacuteas de carga de datos en DIGITALCSIC

CARGAS AUTOMATIZADAS

bull Gestionadas por la Oficina Teacutecnica del repositorio

bull Importacioacuten masiva de metadatos y ficheros

bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga

bull Esencial la colaboracioacuten de los productores de datos

CARGAS MANUALES

bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores

bull En general son datasets (1 o maacutes ficheros) en 1 solo item

DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN

Plantilla de descripcioacuten de datos en DIGITALCSIC

iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el

tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido

eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema

estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen

asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que

hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos

de los datos iquestLas palabras clave son suficientemente descriptivas y

especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se

encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos

Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles

Mapeo Dublin Core-DataCite

Mapeo con el esquema de metadatos de DataCite

httpsschemadataciteorg

Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes

Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523

Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling

iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo

ARTIacuteCULO

DATASET

Buenas praacutecticas descripcioacuten en ingleacutes

Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones

httpsdigitalcsiceshandle10261139347

Buenas praacutecticas citacioacuten seguacuten Principios FORCE11

bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto

bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal

bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)

bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final

httpsdigitalcsiceshandle10261140497

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)

bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX

bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud

bull httpsdigitalcsiceshandle10261139347

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)

httpsdigitalcsiceshandle10261156967

Buenas praacutecticas referencia a datos ajenos reutilizados

bull Item httpsdigitalcsiceshandle10261140497

Dcrelationisbasedon

E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)

bull Item httpsdigitalcsiceshandle10261141218

Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo

Buenas praacutecticas Metadatos sobre software y formatos

Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051

Buenas praacutecticas fichero readme significativo

bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas

bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt

bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada

bull httpsdigitalcsiceshandle10261135062

Buenas praacutecticas informacioacuten sobre la licencia de uso

bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899

bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40

bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES

ITEM httpsdigitalcsiceshandle10261106217

bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40

CASO 3 DATASET COMPLEJOHETEROGENEO

ITEM httpsdigitalcsiceshandle10261103342

bull Dcdescription

The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0

bull httpsopendatacommonsorgfaqlicensesdb-versus-contents

Buenas praacutecticas denominacioacuten consistente de ficheros

Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003

mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la

denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)

Otros esquemas de metadatos para datos por disciplinas

httpwwwdatacarpentryorglessons

httprd-alliancegithubiometadata-directorysubjects

Descripcioacuten de software bull La descripcioacuten de un software debe ser

suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented

bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86

bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados

bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra

bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 10: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Distintos tipos de enfoques

Iniciativa de Mendeley (Elsevier) Agregador de repositorios y otras plataformas y repositorio ldquohueacuterfanordquo internacional httpsdatamendeleycomfaq

El portal de datos abiertos de la UE es el punto de acceso uacutenico a una gran variedad de datos elaborados por las instituciones agencias y otros organismos de la UE Ejemplo

Recursos de intereacutes

bull Cataacutelogo de proyectos de datos abiertos (Universidad de Edimburgo)

bull Glosario sobre datos de Science Europe

GESTIOacuteN Y ACCESO ABIERTO A DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC

En la praacutectica los investigadores quierenhellip

ldquoNecesito urgentemente un DOI para mi

datasetrdquo

ldquoNecesito que los revisores

de mi artiacuteculo accedan a mi

datasetrdquo

ldquoNecesito 1 TB para mi datasetrdquo

ldquoAhora me piden que haga un plan de gestioacuten de datosrdquo

Y DIGITALCSIC tambieacuten quiere

Metadatos de calidad

Gestioacuten de copyright

Buenas praacutecticas cientiacuteficas

bull Metadatos completos y significativos

bull Suficiente informacioacuten contextual

bull Ficheros limpios

bull Formatos estaacutendar

bull Claras licencias de uso

bull Versionado

bull Atribucioacuten completa a todos los autores del dataset

bull Referencias a datos ajenos si procede

Dataset con metadatos

completos y a ser posible en

acceso abierto

iquestDOacuteNDE ESTAacuteN LOS DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC

Datasets que estaacuten asociados a artiacuteculos de revistas con una poliacutetica

de datos yo a proyectos H2020

Datasets que no estaacuten necesariamente vinculados como ldquounderlying datardquo a publicaciones

Datasets en su mayoriacutea imaacutegenesdibujos que son resultado de proyectos de investigacioacuten de muy

largo recorrido

Primer dataset en 2010 11659 items en DIGITALCSIC son datasets (en dctype) de los que algo maacutes de 8300 estaacuten en acceso abierto En colecciones de institutos de Ciencias Agrarias Recursos Naturales Humanidades Biomedicina Ciencias Marinas principalmente Fechas de publicacioacuten 2017 --- 1125 2016 --- 23 2015 --- 2463 2014 --- 3776 2013 --- 3363 2012 --- 17 2011 --- 2 2010 --- 5 1998 --- 2 1997 --- 1 1965 --- 1 1964 --- 865

iquestDoacutende se encuentran los datos de investigacioacuten en DIGITALCSIC

ITEMS INDIVIDUALES

Tipologiacuteas de recursos (dctype)

bull Dataset

bull Imagen

bull Mapas

bull Video

bull Documentos de trabajohellip

bull Con uno o maacutes ficheros

COLECCIONES DE DATOS

bull Estacioacuten Bioloacutegica de Dontildeana (EBD)

bull Instituto de Ciencias del Mar (ICM)

bull Instituto de Ciencias de Patrimonio (INCIPIT)

bull Instituto de Historia (IH)

bull Instituto de Investigaciones Marinas (IIM)

bull Instituto Pirenaico de Ecologiacutea (IPE)

bull Etcetera

COLECCIONES ESPECIALES

bull Colecciones del Proyecto Au

bull Coleccioacuten de Base de datos de Misioacuten de Irlanda

bull Variedades frutales de hueso y pepita

bull Etceacutetera

Viacuteas de carga de datos en DIGITALCSIC

CARGAS AUTOMATIZADAS

bull Gestionadas por la Oficina Teacutecnica del repositorio

bull Importacioacuten masiva de metadatos y ficheros

bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga

bull Esencial la colaboracioacuten de los productores de datos

CARGAS MANUALES

bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores

bull En general son datasets (1 o maacutes ficheros) en 1 solo item

DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN

Plantilla de descripcioacuten de datos en DIGITALCSIC

iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el

tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido

eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema

estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen

asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que

hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos

de los datos iquestLas palabras clave son suficientemente descriptivas y

especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se

encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos

Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles

Mapeo Dublin Core-DataCite

Mapeo con el esquema de metadatos de DataCite

httpsschemadataciteorg

Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes

Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523

Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling

iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo

ARTIacuteCULO

DATASET

Buenas praacutecticas descripcioacuten en ingleacutes

Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones

httpsdigitalcsiceshandle10261139347

Buenas praacutecticas citacioacuten seguacuten Principios FORCE11

bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto

bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal

bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)

bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final

httpsdigitalcsiceshandle10261140497

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)

bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX

bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud

bull httpsdigitalcsiceshandle10261139347

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)

httpsdigitalcsiceshandle10261156967

Buenas praacutecticas referencia a datos ajenos reutilizados

bull Item httpsdigitalcsiceshandle10261140497

Dcrelationisbasedon

E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)

bull Item httpsdigitalcsiceshandle10261141218

Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo

Buenas praacutecticas Metadatos sobre software y formatos

Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051

Buenas praacutecticas fichero readme significativo

bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas

bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt

bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada

bull httpsdigitalcsiceshandle10261135062

Buenas praacutecticas informacioacuten sobre la licencia de uso

bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899

bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40

bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES

ITEM httpsdigitalcsiceshandle10261106217

bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40

CASO 3 DATASET COMPLEJOHETEROGENEO

ITEM httpsdigitalcsiceshandle10261103342

bull Dcdescription

The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0

bull httpsopendatacommonsorgfaqlicensesdb-versus-contents

Buenas praacutecticas denominacioacuten consistente de ficheros

Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003

mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la

denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)

Otros esquemas de metadatos para datos por disciplinas

httpwwwdatacarpentryorglessons

httprd-alliancegithubiometadata-directorysubjects

Descripcioacuten de software bull La descripcioacuten de un software debe ser

suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented

bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86

bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados

bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra

bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 11: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Recursos de intereacutes

bull Cataacutelogo de proyectos de datos abiertos (Universidad de Edimburgo)

bull Glosario sobre datos de Science Europe

GESTIOacuteN Y ACCESO ABIERTO A DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC

En la praacutectica los investigadores quierenhellip

ldquoNecesito urgentemente un DOI para mi

datasetrdquo

ldquoNecesito que los revisores

de mi artiacuteculo accedan a mi

datasetrdquo

ldquoNecesito 1 TB para mi datasetrdquo

ldquoAhora me piden que haga un plan de gestioacuten de datosrdquo

Y DIGITALCSIC tambieacuten quiere

Metadatos de calidad

Gestioacuten de copyright

Buenas praacutecticas cientiacuteficas

bull Metadatos completos y significativos

bull Suficiente informacioacuten contextual

bull Ficheros limpios

bull Formatos estaacutendar

bull Claras licencias de uso

bull Versionado

bull Atribucioacuten completa a todos los autores del dataset

bull Referencias a datos ajenos si procede

Dataset con metadatos

completos y a ser posible en

acceso abierto

iquestDOacuteNDE ESTAacuteN LOS DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC

Datasets que estaacuten asociados a artiacuteculos de revistas con una poliacutetica

de datos yo a proyectos H2020

Datasets que no estaacuten necesariamente vinculados como ldquounderlying datardquo a publicaciones

Datasets en su mayoriacutea imaacutegenesdibujos que son resultado de proyectos de investigacioacuten de muy

largo recorrido

Primer dataset en 2010 11659 items en DIGITALCSIC son datasets (en dctype) de los que algo maacutes de 8300 estaacuten en acceso abierto En colecciones de institutos de Ciencias Agrarias Recursos Naturales Humanidades Biomedicina Ciencias Marinas principalmente Fechas de publicacioacuten 2017 --- 1125 2016 --- 23 2015 --- 2463 2014 --- 3776 2013 --- 3363 2012 --- 17 2011 --- 2 2010 --- 5 1998 --- 2 1997 --- 1 1965 --- 1 1964 --- 865

iquestDoacutende se encuentran los datos de investigacioacuten en DIGITALCSIC

ITEMS INDIVIDUALES

Tipologiacuteas de recursos (dctype)

bull Dataset

bull Imagen

bull Mapas

bull Video

bull Documentos de trabajohellip

bull Con uno o maacutes ficheros

COLECCIONES DE DATOS

bull Estacioacuten Bioloacutegica de Dontildeana (EBD)

bull Instituto de Ciencias del Mar (ICM)

bull Instituto de Ciencias de Patrimonio (INCIPIT)

bull Instituto de Historia (IH)

bull Instituto de Investigaciones Marinas (IIM)

bull Instituto Pirenaico de Ecologiacutea (IPE)

bull Etcetera

COLECCIONES ESPECIALES

bull Colecciones del Proyecto Au

bull Coleccioacuten de Base de datos de Misioacuten de Irlanda

bull Variedades frutales de hueso y pepita

bull Etceacutetera

Viacuteas de carga de datos en DIGITALCSIC

CARGAS AUTOMATIZADAS

bull Gestionadas por la Oficina Teacutecnica del repositorio

bull Importacioacuten masiva de metadatos y ficheros

bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga

bull Esencial la colaboracioacuten de los productores de datos

CARGAS MANUALES

bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores

bull En general son datasets (1 o maacutes ficheros) en 1 solo item

DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN

Plantilla de descripcioacuten de datos en DIGITALCSIC

iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el

tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido

eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema

estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen

asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que

hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos

de los datos iquestLas palabras clave son suficientemente descriptivas y

especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se

encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos

Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles

Mapeo Dublin Core-DataCite

Mapeo con el esquema de metadatos de DataCite

httpsschemadataciteorg

Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes

Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523

Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling

iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo

ARTIacuteCULO

DATASET

Buenas praacutecticas descripcioacuten en ingleacutes

Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones

httpsdigitalcsiceshandle10261139347

Buenas praacutecticas citacioacuten seguacuten Principios FORCE11

bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto

bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal

bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)

bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final

httpsdigitalcsiceshandle10261140497

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)

bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX

bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud

bull httpsdigitalcsiceshandle10261139347

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)

httpsdigitalcsiceshandle10261156967

Buenas praacutecticas referencia a datos ajenos reutilizados

bull Item httpsdigitalcsiceshandle10261140497

Dcrelationisbasedon

E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)

bull Item httpsdigitalcsiceshandle10261141218

Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo

Buenas praacutecticas Metadatos sobre software y formatos

Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051

Buenas praacutecticas fichero readme significativo

bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas

bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt

bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada

bull httpsdigitalcsiceshandle10261135062

Buenas praacutecticas informacioacuten sobre la licencia de uso

bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899

bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40

bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES

ITEM httpsdigitalcsiceshandle10261106217

bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40

CASO 3 DATASET COMPLEJOHETEROGENEO

ITEM httpsdigitalcsiceshandle10261103342

bull Dcdescription

The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0

bull httpsopendatacommonsorgfaqlicensesdb-versus-contents

Buenas praacutecticas denominacioacuten consistente de ficheros

Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003

mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la

denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)

Otros esquemas de metadatos para datos por disciplinas

httpwwwdatacarpentryorglessons

httprd-alliancegithubiometadata-directorysubjects

Descripcioacuten de software bull La descripcioacuten de un software debe ser

suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented

bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86

bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados

bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra

bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 12: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

GESTIOacuteN Y ACCESO ABIERTO A DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC

En la praacutectica los investigadores quierenhellip

ldquoNecesito urgentemente un DOI para mi

datasetrdquo

ldquoNecesito que los revisores

de mi artiacuteculo accedan a mi

datasetrdquo

ldquoNecesito 1 TB para mi datasetrdquo

ldquoAhora me piden que haga un plan de gestioacuten de datosrdquo

Y DIGITALCSIC tambieacuten quiere

Metadatos de calidad

Gestioacuten de copyright

Buenas praacutecticas cientiacuteficas

bull Metadatos completos y significativos

bull Suficiente informacioacuten contextual

bull Ficheros limpios

bull Formatos estaacutendar

bull Claras licencias de uso

bull Versionado

bull Atribucioacuten completa a todos los autores del dataset

bull Referencias a datos ajenos si procede

Dataset con metadatos

completos y a ser posible en

acceso abierto

iquestDOacuteNDE ESTAacuteN LOS DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC

Datasets que estaacuten asociados a artiacuteculos de revistas con una poliacutetica

de datos yo a proyectos H2020

Datasets que no estaacuten necesariamente vinculados como ldquounderlying datardquo a publicaciones

Datasets en su mayoriacutea imaacutegenesdibujos que son resultado de proyectos de investigacioacuten de muy

largo recorrido

Primer dataset en 2010 11659 items en DIGITALCSIC son datasets (en dctype) de los que algo maacutes de 8300 estaacuten en acceso abierto En colecciones de institutos de Ciencias Agrarias Recursos Naturales Humanidades Biomedicina Ciencias Marinas principalmente Fechas de publicacioacuten 2017 --- 1125 2016 --- 23 2015 --- 2463 2014 --- 3776 2013 --- 3363 2012 --- 17 2011 --- 2 2010 --- 5 1998 --- 2 1997 --- 1 1965 --- 1 1964 --- 865

iquestDoacutende se encuentran los datos de investigacioacuten en DIGITALCSIC

ITEMS INDIVIDUALES

Tipologiacuteas de recursos (dctype)

bull Dataset

bull Imagen

bull Mapas

bull Video

bull Documentos de trabajohellip

bull Con uno o maacutes ficheros

COLECCIONES DE DATOS

bull Estacioacuten Bioloacutegica de Dontildeana (EBD)

bull Instituto de Ciencias del Mar (ICM)

bull Instituto de Ciencias de Patrimonio (INCIPIT)

bull Instituto de Historia (IH)

bull Instituto de Investigaciones Marinas (IIM)

bull Instituto Pirenaico de Ecologiacutea (IPE)

bull Etcetera

COLECCIONES ESPECIALES

bull Colecciones del Proyecto Au

bull Coleccioacuten de Base de datos de Misioacuten de Irlanda

bull Variedades frutales de hueso y pepita

bull Etceacutetera

Viacuteas de carga de datos en DIGITALCSIC

CARGAS AUTOMATIZADAS

bull Gestionadas por la Oficina Teacutecnica del repositorio

bull Importacioacuten masiva de metadatos y ficheros

bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga

bull Esencial la colaboracioacuten de los productores de datos

CARGAS MANUALES

bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores

bull En general son datasets (1 o maacutes ficheros) en 1 solo item

DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN

Plantilla de descripcioacuten de datos en DIGITALCSIC

iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el

tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido

eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema

estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen

asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que

hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos

de los datos iquestLas palabras clave son suficientemente descriptivas y

especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se

encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos

Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles

Mapeo Dublin Core-DataCite

Mapeo con el esquema de metadatos de DataCite

httpsschemadataciteorg

Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes

Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523

Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling

iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo

ARTIacuteCULO

DATASET

Buenas praacutecticas descripcioacuten en ingleacutes

Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones

httpsdigitalcsiceshandle10261139347

Buenas praacutecticas citacioacuten seguacuten Principios FORCE11

bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto

bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal

bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)

bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final

httpsdigitalcsiceshandle10261140497

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)

bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX

bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud

bull httpsdigitalcsiceshandle10261139347

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)

httpsdigitalcsiceshandle10261156967

Buenas praacutecticas referencia a datos ajenos reutilizados

bull Item httpsdigitalcsiceshandle10261140497

Dcrelationisbasedon

E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)

bull Item httpsdigitalcsiceshandle10261141218

Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo

Buenas praacutecticas Metadatos sobre software y formatos

Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051

Buenas praacutecticas fichero readme significativo

bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas

bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt

bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada

bull httpsdigitalcsiceshandle10261135062

Buenas praacutecticas informacioacuten sobre la licencia de uso

bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899

bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40

bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES

ITEM httpsdigitalcsiceshandle10261106217

bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40

CASO 3 DATASET COMPLEJOHETEROGENEO

ITEM httpsdigitalcsiceshandle10261103342

bull Dcdescription

The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0

bull httpsopendatacommonsorgfaqlicensesdb-versus-contents

Buenas praacutecticas denominacioacuten consistente de ficheros

Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003

mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la

denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)

Otros esquemas de metadatos para datos por disciplinas

httpwwwdatacarpentryorglessons

httprd-alliancegithubiometadata-directorysubjects

Descripcioacuten de software bull La descripcioacuten de un software debe ser

suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented

bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86

bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados

bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra

bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 13: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

En la praacutectica los investigadores quierenhellip

ldquoNecesito urgentemente un DOI para mi

datasetrdquo

ldquoNecesito que los revisores

de mi artiacuteculo accedan a mi

datasetrdquo

ldquoNecesito 1 TB para mi datasetrdquo

ldquoAhora me piden que haga un plan de gestioacuten de datosrdquo

Y DIGITALCSIC tambieacuten quiere

Metadatos de calidad

Gestioacuten de copyright

Buenas praacutecticas cientiacuteficas

bull Metadatos completos y significativos

bull Suficiente informacioacuten contextual

bull Ficheros limpios

bull Formatos estaacutendar

bull Claras licencias de uso

bull Versionado

bull Atribucioacuten completa a todos los autores del dataset

bull Referencias a datos ajenos si procede

Dataset con metadatos

completos y a ser posible en

acceso abierto

iquestDOacuteNDE ESTAacuteN LOS DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC

Datasets que estaacuten asociados a artiacuteculos de revistas con una poliacutetica

de datos yo a proyectos H2020

Datasets que no estaacuten necesariamente vinculados como ldquounderlying datardquo a publicaciones

Datasets en su mayoriacutea imaacutegenesdibujos que son resultado de proyectos de investigacioacuten de muy

largo recorrido

Primer dataset en 2010 11659 items en DIGITALCSIC son datasets (en dctype) de los que algo maacutes de 8300 estaacuten en acceso abierto En colecciones de institutos de Ciencias Agrarias Recursos Naturales Humanidades Biomedicina Ciencias Marinas principalmente Fechas de publicacioacuten 2017 --- 1125 2016 --- 23 2015 --- 2463 2014 --- 3776 2013 --- 3363 2012 --- 17 2011 --- 2 2010 --- 5 1998 --- 2 1997 --- 1 1965 --- 1 1964 --- 865

iquestDoacutende se encuentran los datos de investigacioacuten en DIGITALCSIC

ITEMS INDIVIDUALES

Tipologiacuteas de recursos (dctype)

bull Dataset

bull Imagen

bull Mapas

bull Video

bull Documentos de trabajohellip

bull Con uno o maacutes ficheros

COLECCIONES DE DATOS

bull Estacioacuten Bioloacutegica de Dontildeana (EBD)

bull Instituto de Ciencias del Mar (ICM)

bull Instituto de Ciencias de Patrimonio (INCIPIT)

bull Instituto de Historia (IH)

bull Instituto de Investigaciones Marinas (IIM)

bull Instituto Pirenaico de Ecologiacutea (IPE)

bull Etcetera

COLECCIONES ESPECIALES

bull Colecciones del Proyecto Au

bull Coleccioacuten de Base de datos de Misioacuten de Irlanda

bull Variedades frutales de hueso y pepita

bull Etceacutetera

Viacuteas de carga de datos en DIGITALCSIC

CARGAS AUTOMATIZADAS

bull Gestionadas por la Oficina Teacutecnica del repositorio

bull Importacioacuten masiva de metadatos y ficheros

bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga

bull Esencial la colaboracioacuten de los productores de datos

CARGAS MANUALES

bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores

bull En general son datasets (1 o maacutes ficheros) en 1 solo item

DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN

Plantilla de descripcioacuten de datos en DIGITALCSIC

iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el

tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido

eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema

estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen

asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que

hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos

de los datos iquestLas palabras clave son suficientemente descriptivas y

especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se

encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos

Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles

Mapeo Dublin Core-DataCite

Mapeo con el esquema de metadatos de DataCite

httpsschemadataciteorg

Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes

Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523

Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling

iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo

ARTIacuteCULO

DATASET

Buenas praacutecticas descripcioacuten en ingleacutes

Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones

httpsdigitalcsiceshandle10261139347

Buenas praacutecticas citacioacuten seguacuten Principios FORCE11

bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto

bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal

bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)

bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final

httpsdigitalcsiceshandle10261140497

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)

bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX

bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud

bull httpsdigitalcsiceshandle10261139347

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)

httpsdigitalcsiceshandle10261156967

Buenas praacutecticas referencia a datos ajenos reutilizados

bull Item httpsdigitalcsiceshandle10261140497

Dcrelationisbasedon

E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)

bull Item httpsdigitalcsiceshandle10261141218

Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo

Buenas praacutecticas Metadatos sobre software y formatos

Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051

Buenas praacutecticas fichero readme significativo

bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas

bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt

bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada

bull httpsdigitalcsiceshandle10261135062

Buenas praacutecticas informacioacuten sobre la licencia de uso

bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899

bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40

bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES

ITEM httpsdigitalcsiceshandle10261106217

bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40

CASO 3 DATASET COMPLEJOHETEROGENEO

ITEM httpsdigitalcsiceshandle10261103342

bull Dcdescription

The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0

bull httpsopendatacommonsorgfaqlicensesdb-versus-contents

Buenas praacutecticas denominacioacuten consistente de ficheros

Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003

mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la

denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)

Otros esquemas de metadatos para datos por disciplinas

httpwwwdatacarpentryorglessons

httprd-alliancegithubiometadata-directorysubjects

Descripcioacuten de software bull La descripcioacuten de un software debe ser

suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented

bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86

bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados

bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra

bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 14: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Y DIGITALCSIC tambieacuten quiere

Metadatos de calidad

Gestioacuten de copyright

Buenas praacutecticas cientiacuteficas

bull Metadatos completos y significativos

bull Suficiente informacioacuten contextual

bull Ficheros limpios

bull Formatos estaacutendar

bull Claras licencias de uso

bull Versionado

bull Atribucioacuten completa a todos los autores del dataset

bull Referencias a datos ajenos si procede

Dataset con metadatos

completos y a ser posible en

acceso abierto

iquestDOacuteNDE ESTAacuteN LOS DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC

Datasets que estaacuten asociados a artiacuteculos de revistas con una poliacutetica

de datos yo a proyectos H2020

Datasets que no estaacuten necesariamente vinculados como ldquounderlying datardquo a publicaciones

Datasets en su mayoriacutea imaacutegenesdibujos que son resultado de proyectos de investigacioacuten de muy

largo recorrido

Primer dataset en 2010 11659 items en DIGITALCSIC son datasets (en dctype) de los que algo maacutes de 8300 estaacuten en acceso abierto En colecciones de institutos de Ciencias Agrarias Recursos Naturales Humanidades Biomedicina Ciencias Marinas principalmente Fechas de publicacioacuten 2017 --- 1125 2016 --- 23 2015 --- 2463 2014 --- 3776 2013 --- 3363 2012 --- 17 2011 --- 2 2010 --- 5 1998 --- 2 1997 --- 1 1965 --- 1 1964 --- 865

iquestDoacutende se encuentran los datos de investigacioacuten en DIGITALCSIC

ITEMS INDIVIDUALES

Tipologiacuteas de recursos (dctype)

bull Dataset

bull Imagen

bull Mapas

bull Video

bull Documentos de trabajohellip

bull Con uno o maacutes ficheros

COLECCIONES DE DATOS

bull Estacioacuten Bioloacutegica de Dontildeana (EBD)

bull Instituto de Ciencias del Mar (ICM)

bull Instituto de Ciencias de Patrimonio (INCIPIT)

bull Instituto de Historia (IH)

bull Instituto de Investigaciones Marinas (IIM)

bull Instituto Pirenaico de Ecologiacutea (IPE)

bull Etcetera

COLECCIONES ESPECIALES

bull Colecciones del Proyecto Au

bull Coleccioacuten de Base de datos de Misioacuten de Irlanda

bull Variedades frutales de hueso y pepita

bull Etceacutetera

Viacuteas de carga de datos en DIGITALCSIC

CARGAS AUTOMATIZADAS

bull Gestionadas por la Oficina Teacutecnica del repositorio

bull Importacioacuten masiva de metadatos y ficheros

bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga

bull Esencial la colaboracioacuten de los productores de datos

CARGAS MANUALES

bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores

bull En general son datasets (1 o maacutes ficheros) en 1 solo item

DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN

Plantilla de descripcioacuten de datos en DIGITALCSIC

iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el

tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido

eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema

estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen

asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que

hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos

de los datos iquestLas palabras clave son suficientemente descriptivas y

especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se

encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos

Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles

Mapeo Dublin Core-DataCite

Mapeo con el esquema de metadatos de DataCite

httpsschemadataciteorg

Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes

Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523

Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling

iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo

ARTIacuteCULO

DATASET

Buenas praacutecticas descripcioacuten en ingleacutes

Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones

httpsdigitalcsiceshandle10261139347

Buenas praacutecticas citacioacuten seguacuten Principios FORCE11

bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto

bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal

bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)

bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final

httpsdigitalcsiceshandle10261140497

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)

bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX

bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud

bull httpsdigitalcsiceshandle10261139347

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)

httpsdigitalcsiceshandle10261156967

Buenas praacutecticas referencia a datos ajenos reutilizados

bull Item httpsdigitalcsiceshandle10261140497

Dcrelationisbasedon

E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)

bull Item httpsdigitalcsiceshandle10261141218

Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo

Buenas praacutecticas Metadatos sobre software y formatos

Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051

Buenas praacutecticas fichero readme significativo

bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas

bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt

bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada

bull httpsdigitalcsiceshandle10261135062

Buenas praacutecticas informacioacuten sobre la licencia de uso

bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899

bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40

bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES

ITEM httpsdigitalcsiceshandle10261106217

bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40

CASO 3 DATASET COMPLEJOHETEROGENEO

ITEM httpsdigitalcsiceshandle10261103342

bull Dcdescription

The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0

bull httpsopendatacommonsorgfaqlicensesdb-versus-contents

Buenas praacutecticas denominacioacuten consistente de ficheros

Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003

mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la

denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)

Otros esquemas de metadatos para datos por disciplinas

httpwwwdatacarpentryorglessons

httprd-alliancegithubiometadata-directorysubjects

Descripcioacuten de software bull La descripcioacuten de un software debe ser

suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented

bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86

bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados

bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra

bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 15: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

iquestDOacuteNDE ESTAacuteN LOS DATOS DE INVESTIGACIOacuteN EN DIGITALCSIC

Datasets que estaacuten asociados a artiacuteculos de revistas con una poliacutetica

de datos yo a proyectos H2020

Datasets que no estaacuten necesariamente vinculados como ldquounderlying datardquo a publicaciones

Datasets en su mayoriacutea imaacutegenesdibujos que son resultado de proyectos de investigacioacuten de muy

largo recorrido

Primer dataset en 2010 11659 items en DIGITALCSIC son datasets (en dctype) de los que algo maacutes de 8300 estaacuten en acceso abierto En colecciones de institutos de Ciencias Agrarias Recursos Naturales Humanidades Biomedicina Ciencias Marinas principalmente Fechas de publicacioacuten 2017 --- 1125 2016 --- 23 2015 --- 2463 2014 --- 3776 2013 --- 3363 2012 --- 17 2011 --- 2 2010 --- 5 1998 --- 2 1997 --- 1 1965 --- 1 1964 --- 865

iquestDoacutende se encuentran los datos de investigacioacuten en DIGITALCSIC

ITEMS INDIVIDUALES

Tipologiacuteas de recursos (dctype)

bull Dataset

bull Imagen

bull Mapas

bull Video

bull Documentos de trabajohellip

bull Con uno o maacutes ficheros

COLECCIONES DE DATOS

bull Estacioacuten Bioloacutegica de Dontildeana (EBD)

bull Instituto de Ciencias del Mar (ICM)

bull Instituto de Ciencias de Patrimonio (INCIPIT)

bull Instituto de Historia (IH)

bull Instituto de Investigaciones Marinas (IIM)

bull Instituto Pirenaico de Ecologiacutea (IPE)

bull Etcetera

COLECCIONES ESPECIALES

bull Colecciones del Proyecto Au

bull Coleccioacuten de Base de datos de Misioacuten de Irlanda

bull Variedades frutales de hueso y pepita

bull Etceacutetera

Viacuteas de carga de datos en DIGITALCSIC

CARGAS AUTOMATIZADAS

bull Gestionadas por la Oficina Teacutecnica del repositorio

bull Importacioacuten masiva de metadatos y ficheros

bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga

bull Esencial la colaboracioacuten de los productores de datos

CARGAS MANUALES

bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores

bull En general son datasets (1 o maacutes ficheros) en 1 solo item

DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN

Plantilla de descripcioacuten de datos en DIGITALCSIC

iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el

tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido

eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema

estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen

asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que

hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos

de los datos iquestLas palabras clave son suficientemente descriptivas y

especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se

encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos

Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles

Mapeo Dublin Core-DataCite

Mapeo con el esquema de metadatos de DataCite

httpsschemadataciteorg

Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes

Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523

Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling

iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo

ARTIacuteCULO

DATASET

Buenas praacutecticas descripcioacuten en ingleacutes

Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones

httpsdigitalcsiceshandle10261139347

Buenas praacutecticas citacioacuten seguacuten Principios FORCE11

bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto

bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal

bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)

bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final

httpsdigitalcsiceshandle10261140497

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)

bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX

bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud

bull httpsdigitalcsiceshandle10261139347

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)

httpsdigitalcsiceshandle10261156967

Buenas praacutecticas referencia a datos ajenos reutilizados

bull Item httpsdigitalcsiceshandle10261140497

Dcrelationisbasedon

E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)

bull Item httpsdigitalcsiceshandle10261141218

Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo

Buenas praacutecticas Metadatos sobre software y formatos

Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051

Buenas praacutecticas fichero readme significativo

bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas

bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt

bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada

bull httpsdigitalcsiceshandle10261135062

Buenas praacutecticas informacioacuten sobre la licencia de uso

bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899

bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40

bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES

ITEM httpsdigitalcsiceshandle10261106217

bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40

CASO 3 DATASET COMPLEJOHETEROGENEO

ITEM httpsdigitalcsiceshandle10261103342

bull Dcdescription

The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0

bull httpsopendatacommonsorgfaqlicensesdb-versus-contents

Buenas praacutecticas denominacioacuten consistente de ficheros

Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003

mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la

denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)

Otros esquemas de metadatos para datos por disciplinas

httpwwwdatacarpentryorglessons

httprd-alliancegithubiometadata-directorysubjects

Descripcioacuten de software bull La descripcioacuten de un software debe ser

suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented

bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86

bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados

bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra

bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 16: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Datasets que estaacuten asociados a artiacuteculos de revistas con una poliacutetica

de datos yo a proyectos H2020

Datasets que no estaacuten necesariamente vinculados como ldquounderlying datardquo a publicaciones

Datasets en su mayoriacutea imaacutegenesdibujos que son resultado de proyectos de investigacioacuten de muy

largo recorrido

Primer dataset en 2010 11659 items en DIGITALCSIC son datasets (en dctype) de los que algo maacutes de 8300 estaacuten en acceso abierto En colecciones de institutos de Ciencias Agrarias Recursos Naturales Humanidades Biomedicina Ciencias Marinas principalmente Fechas de publicacioacuten 2017 --- 1125 2016 --- 23 2015 --- 2463 2014 --- 3776 2013 --- 3363 2012 --- 17 2011 --- 2 2010 --- 5 1998 --- 2 1997 --- 1 1965 --- 1 1964 --- 865

iquestDoacutende se encuentran los datos de investigacioacuten en DIGITALCSIC

ITEMS INDIVIDUALES

Tipologiacuteas de recursos (dctype)

bull Dataset

bull Imagen

bull Mapas

bull Video

bull Documentos de trabajohellip

bull Con uno o maacutes ficheros

COLECCIONES DE DATOS

bull Estacioacuten Bioloacutegica de Dontildeana (EBD)

bull Instituto de Ciencias del Mar (ICM)

bull Instituto de Ciencias de Patrimonio (INCIPIT)

bull Instituto de Historia (IH)

bull Instituto de Investigaciones Marinas (IIM)

bull Instituto Pirenaico de Ecologiacutea (IPE)

bull Etcetera

COLECCIONES ESPECIALES

bull Colecciones del Proyecto Au

bull Coleccioacuten de Base de datos de Misioacuten de Irlanda

bull Variedades frutales de hueso y pepita

bull Etceacutetera

Viacuteas de carga de datos en DIGITALCSIC

CARGAS AUTOMATIZADAS

bull Gestionadas por la Oficina Teacutecnica del repositorio

bull Importacioacuten masiva de metadatos y ficheros

bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga

bull Esencial la colaboracioacuten de los productores de datos

CARGAS MANUALES

bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores

bull En general son datasets (1 o maacutes ficheros) en 1 solo item

DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN

Plantilla de descripcioacuten de datos en DIGITALCSIC

iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el

tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido

eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema

estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen

asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que

hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos

de los datos iquestLas palabras clave son suficientemente descriptivas y

especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se

encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos

Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles

Mapeo Dublin Core-DataCite

Mapeo con el esquema de metadatos de DataCite

httpsschemadataciteorg

Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes

Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523

Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling

iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo

ARTIacuteCULO

DATASET

Buenas praacutecticas descripcioacuten en ingleacutes

Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones

httpsdigitalcsiceshandle10261139347

Buenas praacutecticas citacioacuten seguacuten Principios FORCE11

bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto

bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal

bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)

bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final

httpsdigitalcsiceshandle10261140497

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)

bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX

bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud

bull httpsdigitalcsiceshandle10261139347

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)

httpsdigitalcsiceshandle10261156967

Buenas praacutecticas referencia a datos ajenos reutilizados

bull Item httpsdigitalcsiceshandle10261140497

Dcrelationisbasedon

E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)

bull Item httpsdigitalcsiceshandle10261141218

Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo

Buenas praacutecticas Metadatos sobre software y formatos

Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051

Buenas praacutecticas fichero readme significativo

bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas

bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt

bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada

bull httpsdigitalcsiceshandle10261135062

Buenas praacutecticas informacioacuten sobre la licencia de uso

bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899

bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40

bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES

ITEM httpsdigitalcsiceshandle10261106217

bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40

CASO 3 DATASET COMPLEJOHETEROGENEO

ITEM httpsdigitalcsiceshandle10261103342

bull Dcdescription

The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0

bull httpsopendatacommonsorgfaqlicensesdb-versus-contents

Buenas praacutecticas denominacioacuten consistente de ficheros

Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003

mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la

denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)

Otros esquemas de metadatos para datos por disciplinas

httpwwwdatacarpentryorglessons

httprd-alliancegithubiometadata-directorysubjects

Descripcioacuten de software bull La descripcioacuten de un software debe ser

suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented

bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86

bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados

bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra

bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 17: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

iquestDoacutende se encuentran los datos de investigacioacuten en DIGITALCSIC

ITEMS INDIVIDUALES

Tipologiacuteas de recursos (dctype)

bull Dataset

bull Imagen

bull Mapas

bull Video

bull Documentos de trabajohellip

bull Con uno o maacutes ficheros

COLECCIONES DE DATOS

bull Estacioacuten Bioloacutegica de Dontildeana (EBD)

bull Instituto de Ciencias del Mar (ICM)

bull Instituto de Ciencias de Patrimonio (INCIPIT)

bull Instituto de Historia (IH)

bull Instituto de Investigaciones Marinas (IIM)

bull Instituto Pirenaico de Ecologiacutea (IPE)

bull Etcetera

COLECCIONES ESPECIALES

bull Colecciones del Proyecto Au

bull Coleccioacuten de Base de datos de Misioacuten de Irlanda

bull Variedades frutales de hueso y pepita

bull Etceacutetera

Viacuteas de carga de datos en DIGITALCSIC

CARGAS AUTOMATIZADAS

bull Gestionadas por la Oficina Teacutecnica del repositorio

bull Importacioacuten masiva de metadatos y ficheros

bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga

bull Esencial la colaboracioacuten de los productores de datos

CARGAS MANUALES

bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores

bull En general son datasets (1 o maacutes ficheros) en 1 solo item

DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN

Plantilla de descripcioacuten de datos en DIGITALCSIC

iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el

tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido

eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema

estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen

asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que

hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos

de los datos iquestLas palabras clave son suficientemente descriptivas y

especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se

encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos

Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles

Mapeo Dublin Core-DataCite

Mapeo con el esquema de metadatos de DataCite

httpsschemadataciteorg

Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes

Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523

Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling

iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo

ARTIacuteCULO

DATASET

Buenas praacutecticas descripcioacuten en ingleacutes

Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones

httpsdigitalcsiceshandle10261139347

Buenas praacutecticas citacioacuten seguacuten Principios FORCE11

bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto

bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal

bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)

bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final

httpsdigitalcsiceshandle10261140497

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)

bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX

bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud

bull httpsdigitalcsiceshandle10261139347

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)

httpsdigitalcsiceshandle10261156967

Buenas praacutecticas referencia a datos ajenos reutilizados

bull Item httpsdigitalcsiceshandle10261140497

Dcrelationisbasedon

E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)

bull Item httpsdigitalcsiceshandle10261141218

Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo

Buenas praacutecticas Metadatos sobre software y formatos

Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051

Buenas praacutecticas fichero readme significativo

bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas

bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt

bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada

bull httpsdigitalcsiceshandle10261135062

Buenas praacutecticas informacioacuten sobre la licencia de uso

bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899

bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40

bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES

ITEM httpsdigitalcsiceshandle10261106217

bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40

CASO 3 DATASET COMPLEJOHETEROGENEO

ITEM httpsdigitalcsiceshandle10261103342

bull Dcdescription

The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0

bull httpsopendatacommonsorgfaqlicensesdb-versus-contents

Buenas praacutecticas denominacioacuten consistente de ficheros

Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003

mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la

denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)

Otros esquemas de metadatos para datos por disciplinas

httpwwwdatacarpentryorglessons

httprd-alliancegithubiometadata-directorysubjects

Descripcioacuten de software bull La descripcioacuten de un software debe ser

suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented

bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86

bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados

bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra

bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 18: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Viacuteas de carga de datos en DIGITALCSIC

CARGAS AUTOMATIZADAS

bull Gestionadas por la Oficina Teacutecnica del repositorio

bull Importacioacuten masiva de metadatos y ficheros

bull Labor previa de organizacioacuten de los objetos digitales redenominacioacuten de ficheros y de mapeos de metadatos habitualmente larga

bull Esencial la colaboracioacuten de los productores de datos

CARGAS MANUALES

bull Por la Oficina Teacutecnica del repositorio bibliotecas CSIC e investigadores

bull En general son datasets (1 o maacutes ficheros) en 1 solo item

DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN

Plantilla de descripcioacuten de datos en DIGITALCSIC

iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el

tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido

eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema

estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen

asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que

hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos

de los datos iquestLas palabras clave son suficientemente descriptivas y

especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se

encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos

Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles

Mapeo Dublin Core-DataCite

Mapeo con el esquema de metadatos de DataCite

httpsschemadataciteorg

Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes

Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523

Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling

iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo

ARTIacuteCULO

DATASET

Buenas praacutecticas descripcioacuten en ingleacutes

Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones

httpsdigitalcsiceshandle10261139347

Buenas praacutecticas citacioacuten seguacuten Principios FORCE11

bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto

bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal

bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)

bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final

httpsdigitalcsiceshandle10261140497

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)

bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX

bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud

bull httpsdigitalcsiceshandle10261139347

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)

httpsdigitalcsiceshandle10261156967

Buenas praacutecticas referencia a datos ajenos reutilizados

bull Item httpsdigitalcsiceshandle10261140497

Dcrelationisbasedon

E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)

bull Item httpsdigitalcsiceshandle10261141218

Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo

Buenas praacutecticas Metadatos sobre software y formatos

Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051

Buenas praacutecticas fichero readme significativo

bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas

bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt

bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada

bull httpsdigitalcsiceshandle10261135062

Buenas praacutecticas informacioacuten sobre la licencia de uso

bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899

bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40

bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES

ITEM httpsdigitalcsiceshandle10261106217

bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40

CASO 3 DATASET COMPLEJOHETEROGENEO

ITEM httpsdigitalcsiceshandle10261103342

bull Dcdescription

The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0

bull httpsopendatacommonsorgfaqlicensesdb-versus-contents

Buenas praacutecticas denominacioacuten consistente de ficheros

Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003

mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la

denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)

Otros esquemas de metadatos para datos por disciplinas

httpwwwdatacarpentryorglessons

httprd-alliancegithubiometadata-directorysubjects

Descripcioacuten de software bull La descripcioacuten de un software debe ser

suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented

bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86

bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados

bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra

bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 19: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

DESCRIPCIOacuteN DE DATOS DE INVESTIGACIOacuteN

Plantilla de descripcioacuten de datos en DIGITALCSIC

iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el

tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido

eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema

estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen

asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que

hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos

de los datos iquestLas palabras clave son suficientemente descriptivas y

especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se

encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos

Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles

Mapeo Dublin Core-DataCite

Mapeo con el esquema de metadatos de DataCite

httpsschemadataciteorg

Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes

Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523

Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling

iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo

ARTIacuteCULO

DATASET

Buenas praacutecticas descripcioacuten en ingleacutes

Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones

httpsdigitalcsiceshandle10261139347

Buenas praacutecticas citacioacuten seguacuten Principios FORCE11

bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto

bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal

bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)

bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final

httpsdigitalcsiceshandle10261140497

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)

bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX

bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud

bull httpsdigitalcsiceshandle10261139347

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)

httpsdigitalcsiceshandle10261156967

Buenas praacutecticas referencia a datos ajenos reutilizados

bull Item httpsdigitalcsiceshandle10261140497

Dcrelationisbasedon

E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)

bull Item httpsdigitalcsiceshandle10261141218

Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo

Buenas praacutecticas Metadatos sobre software y formatos

Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051

Buenas praacutecticas fichero readme significativo

bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas

bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt

bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada

bull httpsdigitalcsiceshandle10261135062

Buenas praacutecticas informacioacuten sobre la licencia de uso

bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899

bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40

bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES

ITEM httpsdigitalcsiceshandle10261106217

bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40

CASO 3 DATASET COMPLEJOHETEROGENEO

ITEM httpsdigitalcsiceshandle10261103342

bull Dcdescription

The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0

bull httpsopendatacommonsorgfaqlicensesdb-versus-contents

Buenas praacutecticas denominacioacuten consistente de ficheros

Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003

mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la

denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)

Otros esquemas de metadatos para datos por disciplinas

httpwwwdatacarpentryorglessons

httprd-alliancegithubiometadata-directorysubjects

Descripcioacuten de software bull La descripcioacuten de un software debe ser

suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented

bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86

bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados

bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra

bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 20: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Plantilla de descripcioacuten de datos en DIGITALCSIC

iquestQuieacutenes han producido los datos iquestEs el tiacutetulo lo suficientemente especiacutefico iquestEs el mismo que el

tiacutetulo del artiacuteculo al que va asociado iquestPor queacute han sido creados los datos iquestQueacute limitaciones (por ejemplo datos confidenciales han sido

eliminados) tienen los datos iquestCoacutemo deben interpretarse los datos iquestHay lagunas en los datos o dan una visioacuten completa del tema

estudiado iquestQueacute procesos han generado los datos iquestQueacute miden los datos en las columnas de los ficheros iquestQueacute software es necesario para poder leer los datos iquestCoacutemo deben citarse los datos iquestPueden reutilizarse los datos iquestQueacute licencia de uso tienen

asignada iquestExisten maacutes versiones de los datos iquestDoacutende iquestSe han definido los teacuterminos teacutecnicos y acroacutenimos a los que

hacen referencia los datos iquestSe han cualificado los paraacutemetros geograacuteficos y cronoloacutegicos

de los datos iquestLas palabras clave son suficientemente descriptivas y

especiacuteficas a los datos iquestSe basan en alguacuten tesauro iquestCoacutemo se llama el proyecto de investigacioacuten en que se

encuadran los datos iquestQuieacuten ha financiado la produccioacuten y gestioacuten de los datos

Los ejemplos de datos del esquema de metadatos de DataCite son muy uacutetiles

Mapeo Dublin Core-DataCite

Mapeo con el esquema de metadatos de DataCite

httpsschemadataciteorg

Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes

Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523

Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling

iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo

ARTIacuteCULO

DATASET

Buenas praacutecticas descripcioacuten en ingleacutes

Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones

httpsdigitalcsiceshandle10261139347

Buenas praacutecticas citacioacuten seguacuten Principios FORCE11

bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto

bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal

bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)

bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final

httpsdigitalcsiceshandle10261140497

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)

bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX

bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud

bull httpsdigitalcsiceshandle10261139347

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)

httpsdigitalcsiceshandle10261156967

Buenas praacutecticas referencia a datos ajenos reutilizados

bull Item httpsdigitalcsiceshandle10261140497

Dcrelationisbasedon

E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)

bull Item httpsdigitalcsiceshandle10261141218

Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo

Buenas praacutecticas Metadatos sobre software y formatos

Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051

Buenas praacutecticas fichero readme significativo

bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas

bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt

bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada

bull httpsdigitalcsiceshandle10261135062

Buenas praacutecticas informacioacuten sobre la licencia de uso

bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899

bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40

bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES

ITEM httpsdigitalcsiceshandle10261106217

bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40

CASO 3 DATASET COMPLEJOHETEROGENEO

ITEM httpsdigitalcsiceshandle10261103342

bull Dcdescription

The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0

bull httpsopendatacommonsorgfaqlicensesdb-versus-contents

Buenas praacutecticas denominacioacuten consistente de ficheros

Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003

mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la

denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)

Otros esquemas de metadatos para datos por disciplinas

httpwwwdatacarpentryorglessons

httprd-alliancegithubiometadata-directorysubjects

Descripcioacuten de software bull La descripcioacuten de un software debe ser

suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented

bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86

bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados

bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra

bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 21: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Mapeo con el esquema de metadatos de DataCite

httpsschemadataciteorg

Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes

Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523

Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling

iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo

ARTIacuteCULO

DATASET

Buenas praacutecticas descripcioacuten en ingleacutes

Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones

httpsdigitalcsiceshandle10261139347

Buenas praacutecticas citacioacuten seguacuten Principios FORCE11

bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto

bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal

bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)

bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final

httpsdigitalcsiceshandle10261140497

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)

bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX

bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud

bull httpsdigitalcsiceshandle10261139347

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)

httpsdigitalcsiceshandle10261156967

Buenas praacutecticas referencia a datos ajenos reutilizados

bull Item httpsdigitalcsiceshandle10261140497

Dcrelationisbasedon

E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)

bull Item httpsdigitalcsiceshandle10261141218

Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo

Buenas praacutecticas Metadatos sobre software y formatos

Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051

Buenas praacutecticas fichero readme significativo

bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas

bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt

bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada

bull httpsdigitalcsiceshandle10261135062

Buenas praacutecticas informacioacuten sobre la licencia de uso

bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899

bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40

bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES

ITEM httpsdigitalcsiceshandle10261106217

bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40

CASO 3 DATASET COMPLEJOHETEROGENEO

ITEM httpsdigitalcsiceshandle10261103342

bull Dcdescription

The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0

bull httpsopendatacommonsorgfaqlicensesdb-versus-contents

Buenas praacutecticas denominacioacuten consistente de ficheros

Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003

mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la

denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)

Otros esquemas de metadatos para datos por disciplinas

httpwwwdatacarpentryorglessons

httprd-alliancegithubiometadata-directorysubjects

Descripcioacuten de software bull La descripcioacuten de un software debe ser

suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented

bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86

bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados

bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra

bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 22: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Buenas praacutecticas tiacutetulo del dataset y tiacutetulo del artiacuteculo asociado diferentes

Microsatellite data DNA sequences and GenBank codes from 240 trumpeter finches (Bucanetes githagineus) from the Iberian Peninsula Canary Islands Maghreb Western Sahara and Near East httpdigitalcsiceshandle1026185523

Refugia colonization and diversification of an arid-adapted bird coincident patterns between genetic data and ecological niche modelling

iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo

ARTIacuteCULO

DATASET

Buenas praacutecticas descripcioacuten en ingleacutes

Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones

httpsdigitalcsiceshandle10261139347

Buenas praacutecticas citacioacuten seguacuten Principios FORCE11

bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto

bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal

bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)

bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final

httpsdigitalcsiceshandle10261140497

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)

bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX

bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud

bull httpsdigitalcsiceshandle10261139347

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)

httpsdigitalcsiceshandle10261156967

Buenas praacutecticas referencia a datos ajenos reutilizados

bull Item httpsdigitalcsiceshandle10261140497

Dcrelationisbasedon

E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)

bull Item httpsdigitalcsiceshandle10261141218

Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo

Buenas praacutecticas Metadatos sobre software y formatos

Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051

Buenas praacutecticas fichero readme significativo

bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas

bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt

bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada

bull httpsdigitalcsiceshandle10261135062

Buenas praacutecticas informacioacuten sobre la licencia de uso

bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899

bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40

bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES

ITEM httpsdigitalcsiceshandle10261106217

bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40

CASO 3 DATASET COMPLEJOHETEROGENEO

ITEM httpsdigitalcsiceshandle10261103342

bull Dcdescription

The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0

bull httpsopendatacommonsorgfaqlicensesdb-versus-contents

Buenas praacutecticas denominacioacuten consistente de ficheros

Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003

mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la

denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)

Otros esquemas de metadatos para datos por disciplinas

httpwwwdatacarpentryorglessons

httprd-alliancegithubiometadata-directorysubjects

Descripcioacuten de software bull La descripcioacuten de un software debe ser

suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented

bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86

bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados

bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra

bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 23: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

iquestQueacute ocurre cuando el dataset y el artiacuteculo tienen el mismo tiacutetulo

ARTIacuteCULO

DATASET

Buenas praacutecticas descripcioacuten en ingleacutes

Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones

httpsdigitalcsiceshandle10261139347

Buenas praacutecticas citacioacuten seguacuten Principios FORCE11

bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto

bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal

bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)

bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final

httpsdigitalcsiceshandle10261140497

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)

bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX

bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud

bull httpsdigitalcsiceshandle10261139347

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)

httpsdigitalcsiceshandle10261156967

Buenas praacutecticas referencia a datos ajenos reutilizados

bull Item httpsdigitalcsiceshandle10261140497

Dcrelationisbasedon

E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)

bull Item httpsdigitalcsiceshandle10261141218

Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo

Buenas praacutecticas Metadatos sobre software y formatos

Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051

Buenas praacutecticas fichero readme significativo

bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas

bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt

bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada

bull httpsdigitalcsiceshandle10261135062

Buenas praacutecticas informacioacuten sobre la licencia de uso

bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899

bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40

bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES

ITEM httpsdigitalcsiceshandle10261106217

bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40

CASO 3 DATASET COMPLEJOHETEROGENEO

ITEM httpsdigitalcsiceshandle10261103342

bull Dcdescription

The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0

bull httpsopendatacommonsorgfaqlicensesdb-versus-contents

Buenas praacutecticas denominacioacuten consistente de ficheros

Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003

mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la

denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)

Otros esquemas de metadatos para datos por disciplinas

httpwwwdatacarpentryorglessons

httprd-alliancegithubiometadata-directorysubjects

Descripcioacuten de software bull La descripcioacuten de un software debe ser

suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented

bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86

bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados

bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra

bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 24: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Buenas praacutecticas descripcioacuten en ingleacutes

Tiacutetulo Palabras clave Resumen del contenido del dataset y su estructura Metodologiacutea y proceso de validacioacuten Descripcioacuten del contenido de cada fichero del dataset e informacioacuten sobre su licencia de uso Asociacioacuten con publicaciones

httpsdigitalcsiceshandle10261139347

Buenas praacutecticas citacioacuten seguacuten Principios FORCE11

bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto

bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal

bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)

bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final

httpsdigitalcsiceshandle10261140497

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)

bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX

bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud

bull httpsdigitalcsiceshandle10261139347

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)

httpsdigitalcsiceshandle10261156967

Buenas praacutecticas referencia a datos ajenos reutilizados

bull Item httpsdigitalcsiceshandle10261140497

Dcrelationisbasedon

E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)

bull Item httpsdigitalcsiceshandle10261141218

Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo

Buenas praacutecticas Metadatos sobre software y formatos

Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051

Buenas praacutecticas fichero readme significativo

bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas

bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt

bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada

bull httpsdigitalcsiceshandle10261135062

Buenas praacutecticas informacioacuten sobre la licencia de uso

bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899

bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40

bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES

ITEM httpsdigitalcsiceshandle10261106217

bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40

CASO 3 DATASET COMPLEJOHETEROGENEO

ITEM httpsdigitalcsiceshandle10261103342

bull Dcdescription

The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0

bull httpsopendatacommonsorgfaqlicensesdb-versus-contents

Buenas praacutecticas denominacioacuten consistente de ficheros

Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003

mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la

denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)

Otros esquemas de metadatos para datos por disciplinas

httpwwwdatacarpentryorglessons

httprd-alliancegithubiometadata-directorysubjects

Descripcioacuten de software bull La descripcioacuten de un software debe ser

suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented

bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86

bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados

bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra

bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 25: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Buenas praacutecticas citacioacuten seguacuten Principios FORCE11

bull Beneficios para autores a traveacutes de la citacioacuten se facilita la atribucioacuten y creacutedito sobre el trabajo Ayuda a que los consumidores de datos los citen adecuadamente lo que facilita su rastreo bibliograacutefico y en consecuencia su impacto

bull Beneficios para lectores es maacutes faacutecil buscar y encontrar datasets cuando tienen una citacioacuten formal

bull Componentes en la citacioacuten de datasets Authors Year Dataset title Data repository or archive Version (if any) Persistent identifier (egDOI)

bull httpswwwforce11orggroupjoint-declaration-data-citation-principles-final

httpsdigitalcsiceshandle10261140497

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)

bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX

bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud

bull httpsdigitalcsiceshandle10261139347

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)

httpsdigitalcsiceshandle10261156967

Buenas praacutecticas referencia a datos ajenos reutilizados

bull Item httpsdigitalcsiceshandle10261140497

Dcrelationisbasedon

E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)

bull Item httpsdigitalcsiceshandle10261141218

Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo

Buenas praacutecticas Metadatos sobre software y formatos

Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051

Buenas praacutecticas fichero readme significativo

bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas

bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt

bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada

bull httpsdigitalcsiceshandle10261135062

Buenas praacutecticas informacioacuten sobre la licencia de uso

bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899

bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40

bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES

ITEM httpsdigitalcsiceshandle10261106217

bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40

CASO 3 DATASET COMPLEJOHETEROGENEO

ITEM httpsdigitalcsiceshandle10261103342

bull Dcdescription

The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0

bull httpsopendatacommonsorgfaqlicensesdb-versus-contents

Buenas praacutecticas denominacioacuten consistente de ficheros

Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003

mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la

denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)

Otros esquemas de metadatos para datos por disciplinas

httpwwwdatacarpentryorglessons

httprd-alliancegithubiometadata-directorysubjects

Descripcioacuten de software bull La descripcioacuten de un software debe ser

suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented

bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86

bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados

bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra

bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 26: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (12)

bull Dccoveragetemporal se refiere a las fechas en que se han recogido los datosreferencia temporal en la forma start= XXXX end= XXXX

bull Dccoveragespatial se refiere al lugar en que se han recogidohacen referencia los datos la buena praacutectica es usar formas estandarizadas (Getty Thesaurus of Geographic Names GEONAMES) e incluir coordenadas de latitud y longitud

bull httpsdigitalcsiceshandle10261139347

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)

httpsdigitalcsiceshandle10261156967

Buenas praacutecticas referencia a datos ajenos reutilizados

bull Item httpsdigitalcsiceshandle10261140497

Dcrelationisbasedon

E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)

bull Item httpsdigitalcsiceshandle10261141218

Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo

Buenas praacutecticas Metadatos sobre software y formatos

Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051

Buenas praacutecticas fichero readme significativo

bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas

bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt

bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada

bull httpsdigitalcsiceshandle10261135062

Buenas praacutecticas informacioacuten sobre la licencia de uso

bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899

bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40

bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES

ITEM httpsdigitalcsiceshandle10261106217

bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40

CASO 3 DATASET COMPLEJOHETEROGENEO

ITEM httpsdigitalcsiceshandle10261103342

bull Dcdescription

The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0

bull httpsopendatacommonsorgfaqlicensesdb-versus-contents

Buenas praacutecticas denominacioacuten consistente de ficheros

Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003

mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la

denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)

Otros esquemas de metadatos para datos por disciplinas

httpwwwdatacarpentryorglessons

httprd-alliancegithubiometadata-directorysubjects

Descripcioacuten de software bull La descripcioacuten de un software debe ser

suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented

bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86

bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados

bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra

bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 27: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Buenas praacutecticas informacioacuten geograacutefica y cronoloacutegica (22)

httpsdigitalcsiceshandle10261156967

Buenas praacutecticas referencia a datos ajenos reutilizados

bull Item httpsdigitalcsiceshandle10261140497

Dcrelationisbasedon

E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)

bull Item httpsdigitalcsiceshandle10261141218

Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo

Buenas praacutecticas Metadatos sobre software y formatos

Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051

Buenas praacutecticas fichero readme significativo

bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas

bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt

bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada

bull httpsdigitalcsiceshandle10261135062

Buenas praacutecticas informacioacuten sobre la licencia de uso

bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899

bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40

bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES

ITEM httpsdigitalcsiceshandle10261106217

bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40

CASO 3 DATASET COMPLEJOHETEROGENEO

ITEM httpsdigitalcsiceshandle10261103342

bull Dcdescription

The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0

bull httpsopendatacommonsorgfaqlicensesdb-versus-contents

Buenas praacutecticas denominacioacuten consistente de ficheros

Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003

mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la

denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)

Otros esquemas de metadatos para datos por disciplinas

httpwwwdatacarpentryorglessons

httprd-alliancegithubiometadata-directorysubjects

Descripcioacuten de software bull La descripcioacuten de un software debe ser

suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented

bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86

bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados

bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra

bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 28: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Buenas praacutecticas referencia a datos ajenos reutilizados

bull Item httpsdigitalcsiceshandle10261140497

Dcrelationisbasedon

E Lewis D Wallace Program developed for CO2 system calculations Oak Ridge TN USA Carbon Dioxide Information Analysis Center Oak Ridge National Laboratory 1ndash21 URL httpcdiacesdornlgovoceansco2rprtnbkhtml (1998) C Mehrbach C H Culberson J E Hawley R M Pytkowicz Measurement of the apparent dissociation constants of carbonic acid in seawater at atmospheric pressure Limnol Oceanogr 18 897ndash907 (1973) A Dickson F Millero A comparison of the equilibrium constants for the dissociation of carbonic acid in seawater media Deep Sea Res A 34 1733ndash174330 (1987)

bull Item httpsdigitalcsiceshandle10261141218

Dcrelationisbasedon Spanish Meteorological Agency (AEMET) Ministry of Agriculture and Environment Servei Meteorologravegic de Catalunya (METEOCAT) Navarra Government SAIH Cantaacutebrico SAIH Duero SAIH Ebro SAIH Guadalquivir SAIH Hidrosur SAIH Juacutecar SAIH Mintildeo-Sil SAIH Segura SAIH Tajo

Buenas praacutecticas Metadatos sobre software y formatos

Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051

Buenas praacutecticas fichero readme significativo

bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas

bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt

bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada

bull httpsdigitalcsiceshandle10261135062

Buenas praacutecticas informacioacuten sobre la licencia de uso

bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899

bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40

bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES

ITEM httpsdigitalcsiceshandle10261106217

bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40

CASO 3 DATASET COMPLEJOHETEROGENEO

ITEM httpsdigitalcsiceshandle10261103342

bull Dcdescription

The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0

bull httpsopendatacommonsorgfaqlicensesdb-versus-contents

Buenas praacutecticas denominacioacuten consistente de ficheros

Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003

mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la

denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)

Otros esquemas de metadatos para datos por disciplinas

httpwwwdatacarpentryorglessons

httprd-alliancegithubiometadata-directorysubjects

Descripcioacuten de software bull La descripcioacuten de un software debe ser

suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented

bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86

bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados

bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra

bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 29: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Buenas praacutecticas Metadatos sobre software y formatos

Una buena praacutectica es ofrecer los datos en varios formatos aqueacutellos que se usan maacutes en una disciplina especiacutefica y despueacutes en un formato abierto Versionado indicar la versioacuten del dataset en el tiacutetulo y citacioacuten Indicar los cambios en la descripcioacuten Indicar en los metadatos si se requiere alguacuten software para abrir y usar los datos preferiblemente indicando doacutende acceder al software EJEMPLOS httpsdigitalcsiceshandle1026123051

Buenas praacutecticas fichero readme significativo

bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas

bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt

bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada

bull httpsdigitalcsiceshandle10261135062

Buenas praacutecticas informacioacuten sobre la licencia de uso

bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899

bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40

bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES

ITEM httpsdigitalcsiceshandle10261106217

bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40

CASO 3 DATASET COMPLEJOHETEROGENEO

ITEM httpsdigitalcsiceshandle10261103342

bull Dcdescription

The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0

bull httpsopendatacommonsorgfaqlicensesdb-versus-contents

Buenas praacutecticas denominacioacuten consistente de ficheros

Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003

mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la

denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)

Otros esquemas de metadatos para datos por disciplinas

httpwwwdatacarpentryorglessons

httprd-alliancegithubiometadata-directorysubjects

Descripcioacuten de software bull La descripcioacuten de un software debe ser

suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented

bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86

bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados

bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra

bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 30: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Buenas praacutecticas fichero readme significativo

bull Proporciona informacioacuten sobre el dataset para que sea correctamente interpretado por personas y maacutequinas

bull Buenas praacutecticas un readmefile por dataset cuando sea posible o uno muy desarrollado cuando el item se compone de varios datasets denominar al readme file de tal manera que pueda ser asociado al dataset faacutecilmente en formato plano pe txt

bull Buenas praacutecticas breve descripcioacuten del dataset contacto del investigador principal y para preguntas fecha de recogida de datos y de creacioacuten del dataset informacioacuten geograacutefica de los datos metodologiacutea y enlace a publicaciones y otra documentacioacuten unidades de medida protocolos abreviaciones coacutedigos siacutembolos asociados a los datos licencia de uso citacioacuten recomendada

bull httpsdigitalcsiceshandle10261135062

Buenas praacutecticas informacioacuten sobre la licencia de uso

bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899

bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40

bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES

ITEM httpsdigitalcsiceshandle10261106217

bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40

CASO 3 DATASET COMPLEJOHETEROGENEO

ITEM httpsdigitalcsiceshandle10261103342

bull Dcdescription

The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0

bull httpsopendatacommonsorgfaqlicensesdb-versus-contents

Buenas praacutecticas denominacioacuten consistente de ficheros

Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003

mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la

denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)

Otros esquemas de metadatos para datos por disciplinas

httpwwwdatacarpentryorglessons

httprd-alliancegithubiometadata-directorysubjects

Descripcioacuten de software bull La descripcioacuten de un software debe ser

suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented

bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86

bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados

bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra

bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 31: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Buenas praacutecticas informacioacuten sobre la licencia de uso

bull CASO 1 DATASET SIMPLEHOMOGENEO ITEM httpsdigitalcsiceshandle10261113899

bull Dcdescription This dataset is under a Creative Commons Attribution-Non commercial 40 International License bull Dcrightslicense httpcreativecommonsorglicensesby-nc40

bull CASO 2 DATASET DE PROYECTOS DE HUMANIDADES

ITEM httpsdigitalcsiceshandle10261106217

bull Dcrightslicense httpscreativecommonsorglicensesby-nc-nd40

CASO 3 DATASET COMPLEJOHETEROGENEO

ITEM httpsdigitalcsiceshandle10261103342

bull Dcdescription

The dataset is made available under the Open Database License Any rights in individual contents of the database are licensed under the Database Contents License Please read the full ODbL 10 license text for the exact terms that apply Users of the dataset are free to Share copy distribute and use the database either commercially or non-commercially Create produce derivative works from the database Adapt modify transform and build upon the database Under the following conditions Attribution You must attribute any public use of the database or works produced from the database For any use or redistribution of the database or works produced from it you must make clear to others the license of the original database Share-Alike If you publicly use any adapted version of this database or works produced from an adapted database you must also offer that adapted database under the ODbL bull Dcrightslicense httpopendatacommonsorglicensesodbl1-0

bull httpsopendatacommonsorgfaqlicensesdb-versus-contents

Buenas praacutecticas denominacioacuten consistente de ficheros

Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003

mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la

denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)

Otros esquemas de metadatos para datos por disciplinas

httpwwwdatacarpentryorglessons

httprd-alliancegithubiometadata-directorysubjects

Descripcioacuten de software bull La descripcioacuten de un software debe ser

suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented

bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86

bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados

bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra

bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 32: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Buenas praacutecticas denominacioacuten consistente de ficheros

Aspectos importantes a la hora de denominar a los ficheros del dataset - Nombre del proyecto - Coordenadas geograacuteficasespaciales - Nombre del autor - Fecha de recogida de datos - Tipo de datos - Versionado - Extensioacuten - El nombre no debe de ser muy largo - Evitar los caracteres raros - En secuencias numeacutericas usar 0001 0002 0003

mejor que 1 2 3 - Usar guion bajo en vez de espacios en blanco - Incluir en el README file la explicacioacuten de la

denominacioacuten (si se trata de muchos ficheros por ejemplo que siguen abreviacionescoacutedigos)

Otros esquemas de metadatos para datos por disciplinas

httpwwwdatacarpentryorglessons

httprd-alliancegithubiometadata-directorysubjects

Descripcioacuten de software bull La descripcioacuten de un software debe ser

suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented

bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86

bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados

bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra

bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 33: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Otros esquemas de metadatos para datos por disciplinas

httpwwwdatacarpentryorglessons

httprd-alliancegithubiometadata-directorysubjects

Descripcioacuten de software bull La descripcioacuten de un software debe ser

suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented

bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86

bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados

bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra

bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 34: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Descripcioacuten de software bull La descripcioacuten de un software debe ser

suficientemente detallada y estandarizada para que el software cumpla con la definicioacuten de ldquoTRIFIDrdquo Testable Robust Installable Findable Identifiable Documented

bull Hay distintos esquemas para describir software Una panoraacutemica en httpspeerjcomarticlescs-86

bull Proyecto CodeMeta para mapeos entre los esquemas maacutes usados

bull Elementos esenciales son nombre del software autoriacutea y roles de cada autor identificador persistente nuacutemero de versioacuten fecha de publicacioacuten licencia de uso repositorio en que se encuentra

bull El esquema de DataCite se ha extendido para abarcar tambieacuten software Ejemplo

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 35: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Citacioacuten de software casuiacutesticas

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 36: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Ejemplos de software

bull httpasclnet1505015

bull httpasclnetdashboard

bull httpcamsmseufledusoftware1

bull httplodiulaupfeduresources237

bull httpsgithubcomexplore

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 37: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Software en DIGITALCSIC

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 38: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

FORMATOS ACCESIBILIDAD REPRODUCIBILIDAD PRESERVACIOacuteN

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 39: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Formatos de datos recomendaciones

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 40: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Formatos con vistas a la preservacioacuten a largo plazo

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 41: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Recomendaciones a favor de la reusabilidad

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 42: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Recomendaciones a favor de la

replicabilidad

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 43: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Preservacioacuten de software recursos de intereacutes

PROBLEMAS COMUNES bull Cuestiones legales bull Corrupcioacuten de bits y enlaces bull Ausencia de herramientas originales bull Ausencia de fuentes bull Ausencia de documentacioacuten y versionado bull Lenguajes obsoletos bull Sistemas operativos viejos bull Falta de licencias de uso bull Proteccioacutenprohibicioacuten de copia

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 44: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

GESTIOacuteN DE COPYRIGHT Y LICENCIAS PARA DATOS DE INVESTIGACIOacuteN

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 45: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

iquestTodos los datos estaacuten protegidos por copyright

bull Algunos tipos de datos como las fotos y los videos son trabajos originales y disfrutan de proteccioacuten de copyright

bull Otros tipos de datos (bases de datos)pueden disfrutar de la proteccioacuten de la Directiva Europea de Bases de Datos (1996) en que se reconoce el esfuerzo de trabajo en la creacioacuten y organizacioacuten de los contenidos Se trata de un derecho sui generis que no hay que confundir con el copyright

bull La Directiva Europea de Bases de Datos ofrece este tipo de proteccioacuten en algunos paiacuteses europeos Pueden existir liacutemites a esta derecho por motivos de investigacioacuteneducacioacuten

bull Otros paiacuteses en el mundo como Australia tienen tambieacuten una proteccioacuten para bases de datos parecida pero por ejemplo en Estados Unidos no existe

bull Los hechos los nuacutemeros los nombres en siacute no estaacuten protegidos por copyright Sin embargo una coleccioacuten de hechos puede estar protegido bien por el derecho de bases de datos sui generis (atendiendo a la estructura y organizacioacuten de los datos) o por el copyright (atendiendo a la presentacioacuten especiacutefica d elos datos por ejemplo el disentildeo de una web)

bull Las secuencias bioloacutegicas en principio no estaacuten proteggidas por copyright pero pueden ser patentables si son parte de una invencioacuten

bull Los derechos de propiedad intelectual hace referencia a derechos adquiridos sobre cualquier trabajo creado o inventado con el esfuerzo intelectual de una persona

bull Para cualquier proyecto de investigacioacuten los investigadores deben clarificar la propiedad de los datos de investigacioacuten generados y las obligaciones marcadas por la legislacioacuten nacional (en muchos paiacuteses existe por ejemplo la llamada ldquoFreedom of Information Lawrdquo)

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 46: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Propiedad Intelectual legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 47: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Gestioacuten de datos puacuteblicos legislacioacuten baacutesica

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 48: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Licencias Creative Commons

httpsenwikipediaorgwikiCreative_Commons_license

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 49: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Selector de licencias Creative Commons

bull httpcreativecommonsorgchoose bull La atribucioacuten de la obra desde la versioacuten

40 puede ser satisfecha con un enlace a una paacutegina con informacioacuten sobre la autoriacutea de la obra y detalles relativos

bull Las licencias CC que son comerciales quieren decir ldquoprimarily intended for or directed toward commercial advantage or monetary compensationrdquo

bull Las licencias CompartirIgual (CC-BY-SA) y Sin ObraDerivada (CC-BY-ND) son reciacuteprocamente excluyentes

bull Para recursos que son bases de datos sui generis solo la versioacuten 4 es aplicable (pero no distingue los datos en siacute de una base de datos como conjunto por lo que es recomendable para casos simples y no por ejemplo para una base de datos con colecciones de elementos sujetos a distintas casuiacutesticas de copyright)

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 50: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Licencias OpenData Commons

1- Open Data Commons Open Database License (ODbL) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso expresados en la licencia

bull Si se realizan obras derivadas ofrecerlas bajo la misma licencia de uso (oDbL)

bull Si se realizan versiones o adaptaciones con restricciones de acceso seguir garantizando la disponibilidad de una copia en acceso abierto

2- Open Data Commons Attribution License (ODC-BY) bull Esta licencia permite a cualquier usuario de Internet

reproducir distribuir y usar el conjunto de datos y adaptar y transformar el conjunto de datos siempre y cuando

bull Se haga reconocimiento expliacutecito a la autoriacutea del conjunto de datos originales y a sus teacuterminos de uso

3- Public Domain Dedication and License (PDDL) bull Se dedica la base de datos y sus contenidos al dominio

puacuteblico

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 51: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Licencias Creative Commons y datosbases de datos

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 52: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Licencias Open Data Commons y datosbases de datos

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 53: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Licencias Creative Commons para datos y ldquoOpen Sciencerdquo

bull En el contexto de la Open Science la recomendacioacuten es usar la licencia CC0 Public Domain Dedication por la cual los titulares de copyright renuncian a sus derechos (en los paiacuteses en que se puede renunciar si no actuacutea como licencia) Con esta licencia los creadores de los datos no requieren atribucioacuten sino que piden creacutedito (mediante la citacioacuten completa a los datos)

bull Usar una licencia CC-BY sobre unos datos que no cualifican para proteccioacuten de copyright es equiacutevoco para los usuarios de los datos

bull Para los datos que se encuentran en el dominio puacuteblico se recomienda usar el logo de Public Domain para hacerlo expliacutecito

bull Los derechos sui generis de bases de datos no incluyen el derecho moral de reconocimiento

bull Queacute se entiende por ldquoComercialrdquo en las licencias Creative Commons no es siempre claro (por ejemplo una licencia CC no comercial puede prohibir a un tercero usar los datos para su publicacioacuten en una revista)

bull Si un usuario crea una obra que combina datos sujetos a una licencia CC-BY-SA y datos nuevos la obra derivada completa debe sujetarse a una licencia CC-BY-SA

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 54: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Herramientas para elegir una licencia para obras derivadas calcular el riesgo de violacioacuten de

copyright

httpwwwweb2rightscomOERIPRSupportcreativecommons

httpwwwweb2rightscomOERIPRSupportrisk-management-calculator

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 55: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Herramientas para elegir licencia para software

Software licenses in context of copyright according to Mark Webbink

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 56: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Asistente de licencia de datossoftware

bull License Selector desarrollado por un equipo de IT Law en IDS Mannheim (Alemania) para ayudar a elegir la licencia de uso correcta para datos o software

bull Disponible en coacutedigo abierto httpsgithubcomufalpublic-license-selector

bull Diagrama httpswwweudateusitesdefaultfilesLicense-Selector-Decision-Flow-Diagrampng

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 57: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Licencias restrictivas

Licencias httpswwwclarineucontentlegal-documents-distribution-lrs-clarin Ejemplo httpurnfiurnnbnfilb-20140730158

OTROS EJEMPLOS httpswwwicpsrumicheduicpsrwebNACJDstudies4339

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 58: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

GESTIOacuteN DE DATOS PERSONALES Y CONFIDENCIALES

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 59: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Privacidad de datos legislacioacuten baacutesica

httpswwwscienceeuropeorgwp-contentuploads201801SE_Guidance_Document_RDMPspdf

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 60: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

La gama de datos seguacuten tipo de acceso

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 61: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

iquestQueacute son los datos personales

bull lsquopersonal datarsquo means any information relating to an identified or identifiable natural person (lsquodata subjectrsquo) an identifiable natural person is one who can be identified directly or indirectly in particular by reference to an identifier such as a name an identification number location data an online identifier or to one or more factors specific to the physical physiological genetic mental economic cultural or social identity of that natural person

bull El Reglamento General de Proteccioacuten de Datos (GDPR)

Adoptada en abril de 2016 se preveacute que entre en vigor el 25 de mayo 2018 despueacutes de un periodo de transicioacuten de dos antildeos y a diferencia de las directivas no requiere incorporacioacuten a la legislacioacuten nacional siendo directamente aplicable

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 62: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Coacutemo afectaraacute la nueva normativa sobre la gestioacuten de datos personales en la Unioacuten

Europea y fuera

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 63: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Coacutemo afectaraacute la nueva normativa a la investigacioacuten cientiacutefica

bull Article 9 of the GDPR fixes general rules regarding respect for processing sensitive personal data such as data concerning health or genetic data and keeps the previous mechanisms based on a general prohibition of processing with some important exceptions in particular for the healthcare practice and the management of health systems public health and research sectors where the processing is authorised under specific conditions Focusing on research according to Article 9 al2 (j) the processing of personal sensitive data for archiving purposes in the public interest scientific or historical research purposes or statistical purposes shall be necessary

bull Throughout the GDPR the use of pseudonymisation is promoted and shall be implemented as far and as soon as possible in personal data processing for scientific research purposes as a standard data protection practice

bull Data subjectsrsquo consent can be done for lsquoone or more specified purposesrsquo thus allowing broad consent in the respect of applicable national law provided that the individual received sufficiently clear information and that the given consent represents the unambiguous indication of the data subjectrsquos wishes

bull httpswwwncbinlmnihgovpmcarticlesPMC5243137

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 64: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Eacutetica en la gestioacuten de datos

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 65: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

iquestQueacute son los datos sensibles

Los datos personales sensibles hacen referencia a datos personales combinados con informacioacuten sobre bull el origen racialeacutetnico de las personas de las

que se han recogido datos bull sobre sus opiniones poliacuteticas bull sobre sus creencias religiosas bull sus asociaciones sindicales bull salud fiacutesica y mental bull orientacioacuten sexual bull historial penal

bull Es recomendable no recoger este tipo de informacioacuten en un proyecto de investigacioacuten a menos que sea fundamental para llevar a cabo la investigacioacuten

bull Si el proyecto de investigacioacuten recoge esta informacioacuten la recomendacioacuten es que el equipo del proyecto informe a las personas participantes y obtengan su consentimiento ANTES de empezar la investigacioacuten

El procedimiento estaacutendar para una gestioacuten eacutetica de datos sensibles incluye

bull Anonimizacioacuten de los datos

bull Asignacioacuten de un nuacutemero al estudio y al proyecto

bull Separacioacuten de los datos anonimizados de la hoja de decodificacioacuten

bull Conservacioacuten de los datos en hardcopy en un espacio fiacutesico bajo llave

bull Almacenamiento de los datos tambieacuten en formato digital encriptado y con contrasentildea

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 66: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Tratamiento de datos personales pasos

Dos meacutetodos para anonimizar datos personales httpswwwhhsgovhipaafor-professionalsprivacyspecial-topicsde-identificationindexhtmlstandard

4 pasos para los datos personales de pacientes -Eliminacioacuten de informacioacuten que los identifica -Contratos sobre la transferencia de datos antes de su recogida -Evaluacioacuten independiente sobre las peticiones para consultar los datos -Establecimiento de sistemas de informacioacuten seguros

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 67: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Consideraciones sobre el consentimiento de publicacioacuten de datos

bull El consentimiento informado es un

requisito eacutetico y debe tenerse en cuenta en todo el ciclo de un proyecto de investigacioacuten desde su planificacioacuten hasta la fase de publicacioacuten de resultados

bull Los participantes deben estar informados de queacute datos personales se almacenaraacuten seraacuten preservados y usados a largo plazo y coacutemo se garantizaraacute la confidencialidad cuando sea necesario

bull Tipos de formularios bull httpwwwp3gorgnode1042 bull httpwwwhra-

decisiontoolsorgukconsentexampleshtml

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 68: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

POLIacuteTICAS Y MANDATOS DE DATOS DE INVESTIGACIOacuteN EN ACCESO ABIERTO

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 69: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Poliacuteticas nacionales en Europa

bull 11 paiacuteses de la Unioacuten Europea tienen poliacuteticas nacionales de datos de investigacioacuten Noruega y Suiza tambieacuten

bull A partir de 2009 con una aceleracioacuten en los uacuteltimos antildeos

bull En general las poliacuteticas nacionales sobre datos puacuteblicos (de las administraciones) se han desarrollado antes

bull Fuerte implicacioacuten de agencias financiadoras nacionales en el desarrollo de estas poliacuteticas

bull Con frecuencia estas poliacuteticas indican expliacutecitamente en queacute casuiacutesticas los datos de investigacioacuten no deben ser difundidos en acceso abierto

httpssparceuropeorgupdate-analysis-open-data-policies-finds-new-activity-around-oa-od-policies-multiple-countries

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 70: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Los datos de investigacioacuten en las poliacuteticas de agencias financiadoras

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 71: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Integridad en la investigacioacuten

bull Red informal de expertos en cuestiones relativas a la eacutetica y a la integridad en la investigacioacuten bull Buenas praacutecticas recomendaciones poliacuteticas nacionalesprofesionalescientiacuteficas bull 28 organizaciones son miembros procedentes de 22 paiacuteses de la Unioacuten Europea bull El CSIC se unioacute en 2011 bull httpwwwenrioeu

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 72: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Poliacutetica de datos de la Comisioacuten Europea (programa H2020)

Versioacuten 10 de un plan de gestioacuten de datos a los 6 meses del inicio del proyecto (a menos que se haya hecho opt-out) DATASETS EN ACCESO ABIERTO EN UN REPOSITORIO (Fuente Re3Data) 1 los datos que sirven para validar los

resultados presentados en publicaciones cientiacuteficas y sus metadatos correspondientes tan pronto como sea posible

2 otro tipo de datos generados (pe datos no asociados a publicaciones cientiacuteficas o datos puros) junto con sus metadatos

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 73: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Resumiendo

bull Queacute datos 1 estadiacutesticas resultados de

experimentos mediciones observaciones de trabajo de campo resultados de encuestas grabaciones de entrevistas imaacutegenes

2 los datos que sirven para validar los resultados de publicaciones cientiacuteficas y sus metadatos correspondientes y (voluntariamente) otro tipo de datos creados durante el proyecto

bull Queacute maacutes Un plan de gestioacuten de datos

bull Queacute proyectos a partir de proyectos que inician en 2017 todos por defecto

bull Queacute plataformas repositorios institucionales centralizados temaacuteticos FuenteRe3data

bull Cuaacutendo tan pronto como sea posible

bull Queacute metadatos en repositorio informacioacuten necesaria para validar resultados de investigacioacuten (pe requerimientos de software coacutedigo protocolos de anaacutelisis) Recomendable es la asignacioacuten de DOIs para datasets a traveacutes de DataCite

bull Queacute licencias Recomendadas las licencias CC-BY CC-0

bull Queacute financiacioacuten Los costes asociados a la provisioacuten de acceso abierto a los datos (pe mantenimiento y almacenamiento de datos) son elegibles y su reembolso puede realizarse durante la duracioacuten del proyecto

bull Queacute excepciones ldquofund and prizes instruments ERC proof of concept grants ERA-Nets that do not produce data SME instrument phase 1 Ademaacutes opcioacuten general de ldquoopt outrdquo por razones de seguridad eacuteticas privacidad otras

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 74: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Pasos para los proyectos H2020

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 75: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Requerimientos en gestioacuten de datos en un proyecto H2020

Preparar un Plan de Gestioacuten de Datos

Decidir queacute datos se ofreceraacuten en modo abierto

Elegir un repositorio de datos

Asignar licencias de uso a los datos

Usar estaacutendares internacionalesde la

comunidad cientiacutefica para promover la

interoperabilidad en la web

Dar metadatos a los datos para facilitar su

descubrimiento acceso y uso

Indicar queacute herramientassoftware son

necesarios para permitir verificacioacuten y replicabilidad

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 76: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Datos de investigacioacuten en nuevo Plan Estatal

bull Con el fin de impulsar el acceso a datos de investigacioacuten los proyectos de I+D+i financiados podraacuten incluir con caraacutecter optativo un plan de gestioacuten de los datos de investigacioacuten que se depositaraacuten en repositorios institucionales nacionales yo internacionales tras la finalizacioacuten del proyecto y trascurrido el plazo establecido en las correspondientes convocatorias

bull (hellip) se respetaraacuten todas las situaciones en las que los mismos han de protegerse por razones de confidencialidad seguridad proteccioacuten etc o cuando los mismos sean necesarios para la explotacioacuten comercial

bull (hellip) en la evaluacioacuten curricular de los investigadores asiacute como en la evaluacioacuten ex post de las actuaciones financiadas se tendraacuten en cuenta los trabajos publicados en abierto en repositorios institucionales y temaacuteticos nacionales yo internacionales y la puesta de los datos de su investigacioacuten en abierto

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 77: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Inventarios de poliacuteticas de datos de agencias financiadoras

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 78: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

PLANES DE GESTIOacuteN DE DATOS

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 79: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

iquestPara queacute sirven los Planes de Gestioacuten de Datos

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they confirm that they will accept later my submission

bull As a researcher I want to inform repository operator on the amount of data in the planning phase so that they provide information on costs

bull As a researcher I want to inform funders that data is available in an open access repository so that I can receive my last grant payment

bull As a funder I want to have a list of DOIs for articles published within a research project so that I can track how the grant money was spent

bull As a repository operator I want to know the embargo periods for ingested data so that I can restrict access to specific contents and comply with policies

bull Maacutes casuiacutesticas en httpsgithubcomRDA-DMP-Commonuser-stories

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 80: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Una chuleta para crear planes de gestioacuten de datos

Independientemente de la disciplina y de la poliacutetica de la agencia financiadora todos los planes de gestioacuten de datos deben abordar las siguientes cuestiones bull Descripcioacuten volumen estructura

estaacutendares formatos de los datos bull Recogida y procesamiento de los datos bull Metadatos y documentacioacuten bull Gestioacuten de propiedad intelectual bull Gestioacuten de datos personales y

confidenciales bull Cuestiones eacuteticas bull Acceso publicacioacuten y reutilizacioacuten bull Eleccioacuten de repositorio de datos bull Seguridad y almacenamiento bull Preservacioacuten a largo plazo bull Presupuesto bull Roles y responsabilidades

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 81: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Algunos protocolos para crear planes de gestioacuten de datos por disciplinas

bull Panorama relativamente fragmentado y a distintos niveles de desarrollo y aceptacioacutenimplementacioacuten por sus comunidades

bull Destacan las iniciativas de armonizacioacuten en Humanidades y Biomedicina

bull Todos los planes de gestioacuten de datos deben incluir descripcioacuten y estructura de datos condiciones de reutilizacioacuten documentacioacuten almacenamiento y preservacioacuten eacutetica e integridad calendario para difusioacuten de los datos

bull iexcliexclNo recomendar que los investigadores inventen la rueda

httpwwwscienceeuropeorgwp-contentuploads2018021_SE-RDM-WS-Jan-2018_Protocols_Doornpdf

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 82: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Ejemplos de planes por disciplinas

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 83: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Hacia Planes de Gestioacuten de Datos inteligentes

bull Actualmente los planes de gestioacuten de datos son percibidos como otra carga administrativa para los investigadores

bull Hacia un modelo de datos comuacuten bull Integracioacuten en los sistemas de agencias financiadoras

instituciones repositorios editoriales investigadores bull Uso de formatos estaacutendares como RDF XML JSON bull Procesamiento lectura y uso de DMPs por maacutequinas y

personas bull Planes uacutetiles para cualquier tipo de resultado de

proyecto bull DMPs como documento vivo bull Iniciativa internacional con partiicpacioacuten de RDA

FORCE11 Digital Curation Centre California Digital Library Australia National Data Servicehellip

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 84: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Prototipos de planes de datos inteligentes

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 85: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Planes de gestioacuten de software iquestpor queacute y coacutemo

bull Mejor comprensioacuten de los roles y responsabilidades en el proyecto

bull Mejor continuidad del proyecto si los miembros del quipo cambian

bull Mejor estimacioacuten y planificacioacuten de los recursos

bull Reduccioacuten del riesgo en la gestioacuten del proyecto

bull Facilita el uso y la reutilizacioacuten de su software por terceros (investigadores desarrolladores)

bull Facilitaraacute la citacioacuten del software bull Facilitaraacute que el software relacionado con

publicaciones pueda conservarse para futura validacioacuten y reproducibilidad

bull Aumenta la visibilidad e impacto potencial del software

bull Aumentaraacute la probabilidad de que el software satisfaga las necesidades de las personas que lo puedan utilizan

httpswwwsoftwareacukresourcesguidessoftware-management-plans

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 86: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

DATOS Y REVISTAS

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 87: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

iquestQueacute son las revistas de datos (12)

bull Revistas que aceptan artiacuteculos que describen datasets

bull 2 tipos de poliacuteticas de los ldquodata journalsrdquo

-Obligacioacuten a dar acceso abierto a los datos como requerimiento previo a la publicacioacuten del artiacuteculo -Recomendacioacuten a dar acceso abierto a los datos

DIGITALCSIC es un repositorio apto para cumplir con muchas de estas poliacuteticas porque bull Se encuentra registrado en re3data y cumple con todos los requerimientos del registro bull Asigna DOIs a datasets a traveacutes de DataCite bull Fomenta la descripcioacuten de datasets seguacuten las recomendaciones de DataCite bull Permite la asignacioacuten de distintos tipos de licencias bull Permite embargar temporalmente datasets bull A traveacutes de la funcionalidad Peticioacuten de copia privada los revisores de los artiacuteculos pueden solicitar acceso a los datasets bull Tiene la certificacioacuten de calidad Data Seal of Approval

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 88: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

iquestQueacute son las revistas de datos (22)

APCs y Factor de impacto de una seleccioacuten de revistas de datos

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 89: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Buscador de poliacuteticas de revistas para datos abiertos

-Buscador de estaacutendares repositorios de datos y poliacuteticas de acceso abierto en todas las disciplinas con particular atencioacuten a las aacutereas de BiomedicinaSalud -Directorio internacional -Multitud de estaacutendares y protocolos sobre datos de investigacioacuten - httpsfairsharingorg

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 90: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

El auge de las revistas que publican software

bull Estos artiacuteculos suelen contener

bull - Una introduccioacuten

bull - Una seccioacuten con la metodologiacutea detalles de la implementacioacuten y uso

bull - Resultados

bull - Casos de aplicacioacuten

bull - Discusioacuten

bull EJEMPLO httpswellcomeopenresearchorgarticles2-56v1

bull Son auacuten pocos los tiacutetulos que se especializan o aceptan artiacuteculos que describen software

bull Son revistas de suscripcioacuten y de acceso abierto aunque hay un apoyo especial en las uacuteltimas

bull El potencial de usar los softwares en distintos tipos de proyectos

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 91: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

DATOS Y SERVICIOS DE VALOR ANtildeADIDO

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 92: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Los servicios de EUDAT un esfuerzo colaborativo europeo para la gestioacuten de datos (sobre todo

big data) a lo largo de todo su ciclo de vida

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 93: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

EOSC-hub Nube europea de ciencia abierta

Consorcio de 100 socios de maacutes de 50 paiacuteses para crear un sistema de integracioacuten y gestioacuten de la futura nube europea de investigacioacuten El proyecto movilizaraacute a distintos proveedores europeos de datos (por ejemplo EGI EUDAT CDI INDIGO-DataCloud) para ofrecer un cataacutelogo comuacuten de datos servicios y software para la investigacioacuten Para los investigadores esto significaraacute un acceso maacutes amplio a los servicios de apoyo a la investigacioacuten y potenciaraacute la colaboracioacuten a traveacutes de disciplinas y geografiacuteas httpseoscpiloteuscience-demonstrators

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 94: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Monitorizacioacuten de datos abiertos en Europa

VIDEO de presentacioacuten httpsyoutubecGx__qndBjA

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 95: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Gestioacuten de datos y ciencia abierta

bull Iniciativa eScience Lab de la Universidad de Manchester bull Investigacioacuten y desarrollo de herramientas para llevar a cabo

proyectos cientiacuteficos con datos y anaacutelisis computacionales bull Promueve la colaboracioacuten de investigadores teacutecnicos datos y

meacutetodos en aacutereas de investigacioacuten especiacuteficas bull La consolidacioacuten del ldquoe-laboratoryrdquo

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 96: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

iquestEl futuro

bull The Big Data Europe (BDE) platform makes Big Data simpler cheaper and more flexible than ever before We offer basic building blocks to get started with common Big Data technologies and make integration with other technologies or applications easy

bull Research efforts are conducted with Smart Big Data by adding semantics to a data lake and performing structured machine learning on semantically structured data

httpswwwbig-data-europeeu

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 97: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

DATOS IMPACTO Y EVALUACIOacuteN CIENTIacuteFICA

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 98: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

La diversificacioacuten de meacutetricas de impacto

httpwwwmetrics-toolkitorg

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 99: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Hacia la inclusioacuten de los datos en CVs y el desarrollo de meacutetricas estaacutendar

Buenas praacutecticas de agencias financiadoras httpssfdoraorggood-practicesfunders

Solicitud de financiacioacuten a Wellcome Trust

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 100: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Impacto de datasets en los perfiles de DIGITALCSIC

httpsdigitalcsicescrisrprp05861

httpsdigitalcsicescrisstatsrphtmlid=f244ca81-906a-4eb1-ace9-f2c5d2cacafbamptype=dspaceitemsampmode=download

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 101: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Especiales sobre datos en CSIC Abierto

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 102: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Estadiacutesticas de DataCite para datasets de DIGITALCSIC

bull Estadiacutesticas sobre el uso online de los datasets con DOIs

bull Buacutesquedas por mes y totales bull Indica los DOIs que no han podido resolverse

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 103: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Seguimiento de impacto de los datasets en GBIF

The GBIF Science Review provides an annual survey drawn from the Secretariatrsquos ongoing literature tracking programme which identifies research uses and citations of biodiversity information accessed through GBIFrsquos global infrastructure The peer-reviewed articles summarized in its pages offer a partial but instructive view of research investigations enhanced and supported by free open access data that the GBIF network of members and publishers make available

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 104: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

Monitorizacioacuten de la reutilizacioacuten de datos de la Administracioacuten en Francia

GRACIAS Isabelbernalbibcsices

Page 105: Presentación de PowerPointdigital.csic.es/bitstream/10261/162420/1/Bernal... · Primer problema: ¿de qué datos hablamos? (2/2) • Research data are the evidence that underpins

GRACIAS Isabelbernalbibcsices